SentenceTransformer based on intfloat/multilingual-e5-small
This is a sentence-transformers model finetuned from intfloat/multilingual-e5-small. It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: intfloat/multilingual-e5-small
- Maximum Sequence Length: 512 tokens
- Output Dimensionality: 384 dimensions
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("diegolacomba/multilingual-e5-small-legal-cmnrl-final")
# Run inference
sentences = [
'query: ¿De qué manera se determina el período de ejercicio de la actividad para el cálculo de su rendimiento en un año?',
'passage: Descripción de hechos: Actividad de transporte de mercancías por carretera, que determina el rendimiento neto de la actividad por el método de estimación objetiva. En 2020, la actividad no se paralizó en ningún momento la actividad.\n\nCuestión planteada: Cómputo, en 2020, de los días de ejercicio de la actividad para la determinación del rendimiento neto.',
'passage: La posterior restitución al socio de las cantidades aportadas, en tanto no suponga disminución del capital social, no constituye ningún hecho imponible del impuesto.\nLo que comunico a Vd. con efectos vinculantes, conforme a lo dispuesto en el apartado 1 del artículo 89 de la Ley 58/2003, de 17 de diciembre, General Tributaria.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 384]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Evaluation
Metrics
Information Retrieval
- Dataset:
InformationRetrievalEvaluator
- Evaluated with
InformationRetrievalEvaluator
Metric | Value |
---|---|
cosine_accuracy@1 | 0.3141 |
cosine_accuracy@3 | 0.4604 |
cosine_accuracy@5 | 0.5381 |
cosine_accuracy@10 | 0.6382 |
cosine_accuracy@20 | 0.733 |
cosine_precision@1 | 0.3141 |
cosine_precision@3 | 0.1535 |
cosine_precision@5 | 0.1076 |
cosine_precision@10 | 0.0638 |
cosine_recall@1 | 0.3141 |
cosine_recall@3 | 0.4604 |
cosine_recall@5 | 0.5381 |
cosine_recall@10 | 0.6382 |
cosine_ndcg@10 | 0.4632 |
cosine_mrr@10 | 0.4088 |
cosine_map@100 | 0.4199 |
Training Details
Training Dataset
Unnamed Dataset
- Size: 95,184 training samples
- Columns:
anchor
andpositive
- Approximate statistics based on the first 1000 samples:
anchor positive type string string details - min: 17 tokens
- mean: 30.88 tokens
- max: 55 tokens
- min: 17 tokens
- mean: 345.99 tokens
- max: 509 tokens
- Samples:
anchor positive query: ¿Qué criterios deben cumplirse para que una actividad se considere sujeto pasivo del IVA en casos de obras inmobiliarias?
passage: Estos preceptos son de aplicación general y, por tanto, también a la entidad consultante que, consecuentemente, tendrá la condición de empresario a efectos del Impuesto sobre el Valor Añadido cuando ordene un conjunto de medios personales y materiales, con independencia y bajo su responsabilidad, para desarrollar una actividad empresarial o profesional, sea de fabricación, comercio, de prestación de servicios, etc., mediante la realización continuada de entregas de bienes o prestaciones de servicios, asumiendo el riesgo y ventura que pueda producirse en el desarrollo de la actividad, siempre que las mismas se realicen, como en este caso, a título oneroso.
2.- Con respecto al sujeto pasivo de las ejecuciones de obra inmobiliaria, se debe tener en consideración lo establecido por el artículo 84 de la Ley 37/1992, en su redacción dada por Ley 7/2012, de 29 de octubre, de modificación de la normativa tributaria y presupuestaria y de adecuación de la normativa financiera para la in...query: ¿Cuál es el proceso para comunicar la condición de revendedor ante la administración tributaria?
passage: En estas circunstancias puede considerarse que la consultante tiene la consideración que empresario o profesional revendedor a que se refiere el artículo 84.Uno.2º. g) de la Ley 37/1992, en los términos referidos en el transcrito artículo 24 quinquies del Reglamento del Impuesto en la medida que se dedica con habitualidad a la reventa de los bienes adquiridos a que se refieren dichas operaciones.
3.- Por otra parte, el Real Decreto 1073/2014 ha modificado también el Reglamento General de las actuaciones y los procedimientos de gestión e inspección tributaria y de desarrollo de las normas comunes de los procedimientos de aplicación de los tributos, aprobado por el Real Decreto 1065/2007, de 27 de julio, y ha incluido una nueva letra o) en el apartado 3 del artículo 9 del Reglamento con el objeto de establecer que la declaración censal, que deben presentar ante la Administración tributaria, los Empresarios, Profesionales y Retenedores, sirva también para:
“o) Comunicar la condic...query: ¿Cómo afecta la adquisición de servicios relacionados con terapias cognitivas a la tributación del Impuesto sobre el Valor Añadido en una nueva empresa?
passage: Descripción de hechos: La consultante es una entidad mercantil de nueva creación, que tiene previsto adquirir de otra entidad mercantil una serie de elementos afectos a una actividad de prestación de servicios de terapia psicológica, pedagógica y logopedia.
Cuestión planteada: Tributación de la operación citada a efectos del Impuesto sobre el Valor Añadido. - Loss:
CachedMultipleNegativesRankingLoss
with these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim", "mini_batch_size": 32 }
Evaluation Dataset
Unnamed Dataset
- Size: 10,577 evaluation samples
- Columns:
anchor
andpositive
- Approximate statistics based on the first 1000 samples:
anchor positive type string string details - min: 18 tokens
- mean: 30.85 tokens
- max: 50 tokens
- min: 33 tokens
- mean: 343.78 tokens
- max: 499 tokens
- Samples:
anchor positive query: ¿Qué requisitos establece la legislación para que una escultura sea reconocida como obra original y totalmente creada por un artista?
passage: c) Esculturas originales y estatuas de cualquier materia, siempre que hayan sido realizadas totalmente por el artista; vaciados de esculturas, de tirada limitada a ocho ejemplares y controlada por el artista o sus derechohabientes (código NC 9703 00 00).
(…).”.
3.- De acuerdo con el artículo 5 del Texto Refundido de la Ley de Propiedad Intelectual aprobado por Real Decreto Legislativo 1/1996, de 12 de abril (BOE de 22 de abril), determina que:
“1. Se considera autor a la persona natural que crea alguna obra literaria, artística o científica.
2. No obstante, de la protección que esta Ley concede al autor se podrán beneficiar personas jurídicas en los casos expresamente previstos en ella.”.
En particular, el artículo 8 del mismo texto refundido establece lo siguiente en relación a las personas jurídicas:
“Se considera obra colectiva la creada por la iniciativa y bajo la coordinación de una persona natural o jurídica que la edita y divulga bajo su nombre y está constituida por la...query: ¿Se aplica el IVA cuando un ayuntamiento adquiere una edificación previamente utilizada como sede de correos?
passage: Descripción de hechos: El consultante es un Ayuntamiento que va a adquirir una edificación, que había sido la sede municipal de Correos y Telégrafos, que se construyó sobre un terreno entregado a dicha entidad, a su vez, por el consultante.
Cuestión planteada: Si la entrega de dicho inmueble se encontrará sujeta al Impuesto sobre el Valor Añadido.query: ¿Cómo se gravan fiscalmente las intervenciones de implantación de prótesis capilares en pacientes con fines estéticos según la normativa vigente?
passage: Descripción de hechos: La consultante se dedica a la prestación de servicios médicos profesionales consistentes en el diagnóstico y prevención, tratamiento, y reconstrucción de la alopecia por miniaturización folicular y alopecia cicatricial.
Para la reconstrucción de alopecia se diseña e implantan prótesis capilares personalizadas que son adquiridas en Italia, y posteriormente son vendidas a otros profesionales médicos, o bien se entregan al paciente en el momento de la intervención.
Cuestión planteada: La consultante plantea cuestiones adicionales en relación con la contestación vinculante de 2 de octubre de 2018, consulta V2687-18. En particular:
El tipo del Impuesto sobre el Valor Añadido aplicable a las entregas y adquisiciones
intracomunitarias de prótesis capilares que son utilizadas indistintamente para fines estéticos y para fines terapéuticos adquiridas por profesionales.
El tipo impositivo aplicable a las ventas por la implantación de la prótesis, efectuadas a paci... - Loss:
CachedMultipleNegativesRankingLoss
with these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim", "mini_batch_size": 32 }
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy
: stepsper_device_train_batch_size
: 256per_device_eval_batch_size
: 256gradient_accumulation_steps
: 4learning_rate
: 3e-05num_train_epochs
: 12lr_scheduler_type
: cosinewarmup_ratio
: 0.1fp16
: Truetf32
: Trueload_best_model_at_end
: Trueoptim
: adamw_torch_fusedbatch_sampler
: no_duplicates
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: stepsprediction_loss_only
: Trueper_device_train_batch_size
: 256per_device_eval_batch_size
: 256per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 4eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 3e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 12max_steps
: -1lr_scheduler_type
: cosinelr_scheduler_kwargs
: {}warmup_ratio
: 0.1warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Truefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Truelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Trueignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torch_fusedoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Nonehub_always_push
: Falsehub_revision
: Nonegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseinclude_for_metrics
: []eval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseuse_liger_kernel
: Falseliger_kernel_config
: Noneeval_use_gather_object
: Falseaverage_tokens_across_devices
: Falseprompts
: Nonebatch_sampler
: no_duplicatesmulti_dataset_batch_sampler
: proportional
Training Logs
Epoch | Step | Training Loss | Validation Loss | InformationRetrievalEvaluator_cosine_ndcg@10 |
---|---|---|---|---|
None | 0 | - | 4.5300 | 0.2369 |
1.0753 | 100 | 2.1784 | 0.6987 | 0.3869 |
2.1505 | 200 | 0.6499 | 0.5427 | 0.4295 |
3.2258 | 300 | 0.539 | 0.4956 | 0.4459 |
4.3011 | 400 | 0.4811 | 0.4683 | 0.4488 |
5.3763 | 500 | 0.4476 | 0.4512 | 0.4545 |
6.4516 | 600 | 0.4238 | 0.4389 | 0.4567 |
7.5269 | 700 | 0.4076 | 0.4289 | 0.4608 |
8.6022 | 800 | 0.3928 | 0.4253 | 0.4620 |
9.6774 | 900 | 0.3879 | 0.4244 | 0.4625 |
10.7527 | 1000 | 0.3802 | 0.4231 | 0.4632 |
11.8280 | 1100 | 0.3779 | 0.4225 | 0.4631 |
12.0 | 1116 | - | 0.4231 | 0.4632 |
- The bold row denotes the saved checkpoint.
Framework Versions
- Python: 3.11.13
- Sentence Transformers: 4.1.0
- Transformers: 4.53.2
- PyTorch: 2.6.0+cu124
- Accelerate: 1.9.0
- Datasets: 2.14.4
- Tokenizers: 0.21.2
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
CachedMultipleNegativesRankingLoss
@misc{gao2021scaling,
title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
year={2021},
eprint={2101.06983},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
- Downloads last month
- 7
Model tree for diegolacomba/multilingual-e5-small-legal-cmnrl-final
Base model
intfloat/multilingual-e5-smallEvaluation results
- Cosine Accuracy@1 on InformationRetrievalEvaluatorself-reported0.314
- Cosine Accuracy@3 on InformationRetrievalEvaluatorself-reported0.460
- Cosine Accuracy@5 on InformationRetrievalEvaluatorself-reported0.538
- Cosine Accuracy@10 on InformationRetrievalEvaluatorself-reported0.638
- Cosine Accuracy@20 on InformationRetrievalEvaluatorself-reported0.733
- Cosine Precision@1 on InformationRetrievalEvaluatorself-reported0.314
- Cosine Precision@3 on InformationRetrievalEvaluatorself-reported0.153
- Cosine Precision@5 on InformationRetrievalEvaluatorself-reported0.108
- Cosine Precision@10 on InformationRetrievalEvaluatorself-reported0.064
- Cosine Recall@1 on InformationRetrievalEvaluatorself-reported0.314