basilisk78 commited on
Commit
5471d54
·
verified ·
1 Parent(s): 79d65a8

Upload folder using huggingface_hub

Browse files
This view is limited to 50 files because it contains too many changes.   See raw diff
Files changed (50) hide show
  1. .gitattributes +4 -0
  2. 1_Pooling/config.json +10 -0
  3. README.md +0 -0
  4. checkpoint-1236/1_Pooling/config.json +10 -0
  5. checkpoint-1236/README.md +1048 -0
  6. checkpoint-1236/config.json +74 -0
  7. checkpoint-1236/config_sentence_transformers.json +20 -0
  8. checkpoint-1236/model.safetensors +3 -0
  9. checkpoint-1236/modules.json +20 -0
  10. checkpoint-1236/optimizer.pt +3 -0
  11. checkpoint-1236/rng_state.pth +3 -0
  12. checkpoint-1236/scheduler.pt +3 -0
  13. checkpoint-1236/sentence_bert_config.json +4 -0
  14. checkpoint-1236/sentencepiece.bpe.model +3 -0
  15. checkpoint-1236/special_tokens_map.json +51 -0
  16. checkpoint-1236/tokenizer.json +3 -0
  17. checkpoint-1236/tokenizer_config.json +54 -0
  18. checkpoint-1236/trainer_state.json +1143 -0
  19. checkpoint-1236/training_args.bin +3 -0
  20. checkpoint-1648/1_Pooling/config.json +10 -0
  21. checkpoint-1648/README.md +1090 -0
  22. checkpoint-1648/config.json +74 -0
  23. checkpoint-1648/config_sentence_transformers.json +20 -0
  24. checkpoint-1648/model.safetensors +3 -0
  25. checkpoint-1648/modules.json +20 -0
  26. checkpoint-1648/optimizer.pt +3 -0
  27. checkpoint-1648/rng_state.pth +3 -0
  28. checkpoint-1648/scheduler.pt +3 -0
  29. checkpoint-1648/sentence_bert_config.json +4 -0
  30. checkpoint-1648/sentencepiece.bpe.model +3 -0
  31. checkpoint-1648/special_tokens_map.json +51 -0
  32. checkpoint-1648/tokenizer.json +3 -0
  33. checkpoint-1648/tokenizer_config.json +54 -0
  34. checkpoint-1648/trainer_state.json +1513 -0
  35. checkpoint-1648/training_args.bin +3 -0
  36. checkpoint-824/1_Pooling/config.json +10 -0
  37. checkpoint-824/README.md +1003 -0
  38. checkpoint-824/config.json +74 -0
  39. checkpoint-824/config_sentence_transformers.json +20 -0
  40. checkpoint-824/model.safetensors +3 -0
  41. checkpoint-824/modules.json +20 -0
  42. checkpoint-824/optimizer.pt +3 -0
  43. checkpoint-824/rng_state.pth +3 -0
  44. checkpoint-824/scheduler.pt +3 -0
  45. checkpoint-824/sentence_bert_config.json +4 -0
  46. checkpoint-824/sentencepiece.bpe.model +3 -0
  47. checkpoint-824/special_tokens_map.json +51 -0
  48. checkpoint-824/tokenizer.json +3 -0
  49. checkpoint-824/tokenizer_config.json +54 -0
  50. checkpoint-824/trainer_state.json +773 -0
.gitattributes CHANGED
@@ -33,3 +33,7 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
 
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ checkpoint-1236/tokenizer.json filter=lfs diff=lfs merge=lfs -text
37
+ checkpoint-1648/tokenizer.json filter=lfs diff=lfs merge=lfs -text
38
+ checkpoint-824/tokenizer.json filter=lfs diff=lfs merge=lfs -text
39
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
The diff for this file is too large to render. See raw diff
 
checkpoint-1236/1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
checkpoint-1236/README.md ADDED
@@ -0,0 +1,1048 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - en
4
+ license: apache-2.0
5
+ tags:
6
+ - sentence-transformers
7
+ - sentence-similarity
8
+ - feature-extraction
9
+ - generated_from_trainer
10
+ - dataset_size:13186
11
+ - loss:MatryoshkaLoss
12
+ - loss:MultipleNegativesRankingLoss
13
+ base_model: nomic-ai/nomic-embed-text-v2-moe
14
+ widget:
15
+ - source_sentence: ООО "Сибирские ягоды" зарегистрировало географическое указание
16
+ на свою продукцию. В связи с реорганизацией общества, оно изменило свое наименование
17
+ на АО "Ягодный край". Какие действия необходимо предпринять АО "Ягодный край"
18
+ в соответствии с предоставленным текстом статьи закона для внесения изменений
19
+ в Государственный реестр?
20
+ sentences:
21
+ - <p>5. Если в силу договора факторинга финансовый агент (фактор) несет обязанности
22
+ по оплате цены приобретенных им денежных требований, по предоставлению клиенту
23
+ займа (кредита) или по оказанию клиенту услуг, к отношениям сторон по договору
24
+ факторинга применяются правила соответственно о купле-продаже, займе (кредите),
25
+ возмездном оказании услуг постольку, поскольку это не противоречит положениям
26
+ настоящей главы и существу отношений по договору факторинга.</p><p>(Статья в редакции
27
+ Федерального закона <a href="102439953">от 26.07.2017 № 212-ФЗ</a>)</p>
28
+ - <p>1. В случае, когда договором купли-продажи предусмотрена оплата товара через
29
+ определенное время после его передачи покупателю (продажа товара в кредит), покупатель
30
+ должен произвести оплату в срок, предусмотренный договором, а если такой срок
31
+ договором не предусмотрен, в срок, определенный в соответствии со статьей 314
32
+ настоящего Кодекса.</p><p>2. В случае неисполнения продавцом обязанности по передаче
33
+ товара применяются правила, предусмотренные статьей 328 настоящего Кодекса.</p><p>3.
34
+ В случае, когда покупатель, получивший товар, не исполняет обязанность по его
35
+ оплате в установленный договором купли-продажи срок, продавец вправе потребовать
36
+ оплаты переданного товара или возврата неоплаченных товаров.</p><p>4. В случае,
37
+ когда покупатель не исполняет обязанность по оплате переданного товара в установленный
38
+ договором срок и иное не предусмотрено настоящим Кодексом или договором купли-продажи,
39
+ на просроченную сумму подлежат уплате проценты в соответствии со статьей 395 настоящего
40
+ Кодекса со дня, когда по договору товар должен был быть оплачен, до дня оплаты
41
+ товара покупателем.</p><p>Договором может быть предусмотрена обязанность покупателя
42
+ уплачивать проценты на сумму, соответствующую цене товара, начиная со дня передачи
43
+ товара продавцом.</p><p>5. Если иное не предусмотрено договором купли-продажи,
44
+ с момента передачи товара покупателю и до его оплаты товар, проданный в кредит,
45
+ признается находящимся в залоге у продавца для обеспечения исполнения покупателем
46
+ его обязанности по оплате товара.</p>
47
+ - <p>1. Федеральный орган исполнительной власти по интеллектуальной собственности
48
+ вносит по заявлению правообладателя в Государственный реестр указаний и ��аименований
49
+ изменения, относящиеся к государственной регистрации географического указания
50
+ или наименования места происхождения товара и предоставлению исключительного права
51
+ на географическое указание или наименование места происхождения товара (пункт
52
+ 2 статьи 1529), в том числе к наименованию или имени правообладателя, его месту
53
+ нахождения или месту жительства, адресу для переписки, сведениям, касающимся перечня
54
+ лиц, имеющих право использования географического указания или наименования места
55
+ происхождения товара, условий использования географического указания или наименования
56
+ места происхождения товара входящими в объединение лицами, а также изменения для
57
+ исправления очевидных и технических ошибок.</p><p>2. К заявлению о внесении изменений
58
+ в сведения, относящиеся к государственной регистрации географического указания
59
+ или наименования места происхождения товара, в том числе указанные в подпунктах
60
+ 1 - 4, 6 - 9 пункта 2 статьи 1522, пункте 1 статьи 15221 настоящего Кодекса, прилагаются
61
+ документы или заключение уполномоченного органа, подтверждающие обоснованность
62
+ и необходимость внесения таких изменений.</p><p class="P">(Статья в редакции Федерального
63
+ закона <a href="102577263">от 26.07.2019 № 230-ФЗ</a>)</p>
64
+ - source_sentence: Какие возражения может выдвинуть должник против требования третьего
65
+ лица, если договор предусматривает исполнение в пользу третьего лица, но не указывает
66
+ его конкретно, и третье лицо заявило о своих правах?
67
+ sentences:
68
+ - <p>1. В случаях стихийных бедствий, аварий, эпидемий, эпизоотий и при иных обстоятельствах,
69
+ носящих чрезвычайный характер, имущество в интересах общества по решению государственных
70
+ органов может быть изъято у собственника в порядке и на условиях, установленных
71
+ законом, с выплатой ему стоимости имущества (реквизиция).</p><p>2. Оценка, по
72
+ которой собственнику возмещается стоимость реквизированного имущества, может быть
73
+ оспорена им в суде.</p><p>3. Лицо, имущество которого реквизировано, вправе при
74
+ прекращении действия обстоятельств, в связи с которыми произведена реквизиция,
75
+ требовать по суду возврата ему сохранившегося имущества.</p>
76
+ - <p>1. Собственники помещений в многоквартирном доме или нескольких многоквартирных
77
+ домах либо собственники нескольких жилых домов для совместного управления общим
78
+ имуществом в многоквартирном доме либо имуществом собственников помещений в нескольких
79
+ многоквартирных домах или имуществом собственников нескольких жилых домов и осуществления
80
+ деятельности по созданию, содержанию, сохранению и приращению такого имущества,
81
+ а также для осуществления иной деятельности, направленной на достижение целей
82
+ управления многоквартирными домами либо на совместное использование имущества,
83
+ принадлежащего собственникам помещений в нескольких м��огоквартирных домах, или
84
+ имущества собственников нескольких жилых домов, могут создавать товарищества собственников
85
+ жилья. (В редакции Федерального закона <a href="102387998">от 31.01.2016 № 7-ФЗ</a>)</p><p>2.
86
+ Товарищество собственников жилья является некоммерческой организацией, создаваемой
87
+ и действующей в соответствии с законом о товариществах собственников жилья.</p>
88
+ - <p>1. Договором в пользу третьего лица признается договор, в котором стороны установили,
89
+ что должник обязан произвести исполнение не кредитору, а указанному или не указанному
90
+ в договоре третьему лицу, имеющему право требовать от должника исполнения обязательства
91
+ в свою пользу.</p><p>2. Если иное не предусмотрено законом, иными правовыми актами
92
+ или договором, с момента выражения третьим лицом должнику намерения воспользоваться
93
+ своим правом по договору стороны не могут расторгать или изменять заключенный
94
+ ими договор без согласия третьего лица.</p><p>3. Должник в договоре вправе выдвигать
95
+ против требования третьего лица возражения, которые он мог бы выдвинуть против
96
+ кредитора.</p><p>4. В случае, когда третье лицо отказалось от права, предоставленного
97
+ ему по договору, кредитор может воспользоваться этим правом, если это не противоречит
98
+ закону, иным правовым актам и договору.</p>
99
+ - source_sentence: Заявитель на полезную модель внес изменения в описание технического
100
+ результата через 14 месяцев после подачи заявки. Эти изменения касаются уточнения
101
+ способа достижения заявленного технического результата, но не меняют сам результат.
102
+ Будут ли эти изменения учтены при публикации сведений о заявке согласно пункту
103
+ 5 статьи?
104
+ sentences:
105
+ - <p>указание на технический результат, который обеспечивается изобретением или
106
+ полезной моделью и не связан с техническим результатом, содержащимся в тех же
107
+ документах.</p><p>3. Дополнительные материалы изменяют заявку на промышленный
108
+ образец по существу, если они содержат изображения изделия, на которых:</p><p>представлен
109
+ иной промышленный образец, не удовлетворяющий требованию единства промышленного
110
+ образца в отношении промышленного образца или группы промышленных образцов, раскрытых
111
+ на изображениях, принятых к рассмотрению;</p><p>представлены существенные признаки
112
+ промышленного образца, отсутствующие на изображениях, представленных на дату подачи
113
+ заявки, либо представлены изображения изделия, с которых удалены существенные
114
+ признаки промышленного образца, имеющиеся на изображениях, представленных на дату
115
+ подачи заявки.</p><p>4. Изменения сведений об авторе, о заявителе, в том числе
116
+ при передаче права на получение патента другому лицу либо вследствие изменения
117
+ имени автора, имени или наименования заявителя, а также исправления очевидных
118
+ и технических ошибок могут быть внесены заявителем в документы заявки по ��обственной
119
+ инициативе до регистрации изобретения, полезной модели или промышленного образца.</p><p>5.
120
+ Изменения, внесенные заявителем в документы заявки на изобретение, учитываются
121
+ при публикации сведений о заявке, если такие изменения представлены в федеральный
122
+ орган исполнительной власти по интеллектуальной собственности в течение пятнадцати
123
+ месяцев с даты подачи заявки.</p><p>(Статья в редакции Федерального закона <a
124
+ href="102171743">от 12.03.2014 № 35-ФЗ</a>)</p>
125
+ - <p>1. Опекун или попечитель распоряжается доходами подопечного, в том числе доходами,
126
+ причитающимися подопечному от управления его имуществом, за исключением доходов,
127
+ которыми подопечный вправе распоряжаться самостоятельно, исключительно в интересах
128
+ подопечного и с предварительного разрешения органа опеки и попечительства. Суммы
129
+ алиментов, пенсий, пособий, возмещения вреда здоровью и вреда, понесенного в случае
130
+ смерти кормильца, а также иные выплачиваемые на содержание подопечного средства,
131
+ за исключением доходов, которыми подопечный вправе распоряжаться самостоятельно,
132
+ подлежат зачислению на отдельный номинальный счет, открываемый опекуном или попечителем
133
+ в соответствии с главой 45 настоящего Кодекса, и расходуются опекуном или попечителем
134
+ без предварительного разрешения органа опеки и попечительства. Опекун или попечитель
135
+ предоставляет отчет о расходовании сумм, зачисляемых на отдельный номинальный
136
+ счет, в порядке, установленном Федеральным законом <a href="102121401">"Об опеке
137
+ и попечительстве"</a>. Случаи, при которых опекун вправе не предоставлять отчет
138
+ о расходовании сумм, зачисляемых на отдельный номинальный счет, устанавливаются
139
+ Федеральным законом <a href="102121401">"Об опеке и попечительстве"</a>. (В редакции
140
+ федеральных законов <a href="102162486">от 30.12.2012 № 302-ФЗ</a>; <a href="102456108">от
141
+ 29.12.2017 № 459-ФЗ</a>)</p><p>2. Опекун не вправе без предварительного разрешения
142
+ органа опеки и попечительства совершать, а попечитель - давать согласие на совершение
143
+ сделок по отчуждению, в том числе обмену или дарению имущества подопечного, сдаче
144
+ его внаем (в аренду), в безвозмездное пользование или в залог, сделок, влекущих
145
+ отказ от принадлежащих подопечному прав, раздел его имущества или выдел из него
146
+ долей, а также любых других действий, влекущих уменьшение имущества подопечного.
147
+ (В редакции Федерального закона <a href="102162486">от 30.12.2012 № 302-ФЗ</a>)</p>
148
+ - <p>1. Заказчик обязан в сроки и в порядке, которые предусмотрены договором подряда,
149
+ с участием подрядчика осмотреть и принять выполненную работу (ее результат), а
150
+ при обнаружении отступлений от договора, ухудшающих результат работы, или иных
151
+ недостатков в работе немедленно заявить об этом подрядчику.</p><p>2. Заказчик,
152
+ обнаруживший недостатки в работе при ее приемке, вправе ссылаться на них в случаях,
153
+ если в акте либо в ином документе, удостоверяющем приемку, были оговорены эти
154
+ недостатки либо возможность последующего предъявления требования об их устранении.</p><p>3.
155
+ Если иное не предусмотрено договором подряда, заказчик, принявший работу без проверки,
156
+ лишается права ссылаться на недостатки работы, которые могли быть установлены
157
+ при обычном способе ее приемки (явные недостатки).</p><p>4. Заказчик, обнаруживший
158
+ после приемки работы отступления в ней от договора подряда или иные недостатки,
159
+ которые не могли быть установлены при обычном способе приемки (скрытые недостатки),
160
+ в том числе такие, которые были умышленно скрыты подрядчиком, обязан известить
161
+ об этом подрядчика в разумный срок по их обнаружении.</p><p>5. При возникновении
162
+ между заказчиком и подрядчиком спора по поводу недостатков выполненной работы
163
+ или их причин по требованию любой из сторон должна быть назначена экспертиза.
164
+ Расходы на экспертизу несет подрядчик, за исключением случаев, когда экспертизой
165
+ установлено отсутствие нарушений подрядчиком договора подряда или причинной связи
166
+ между действиями подрядчика и обнаруженными недостатками. В указанных случаях
167
+ расходы на экспертизу несет сторона, потребовавшая назначения экспертизы, а если
168
+ она назначена по соглашению между сторонами, обе стороны поровну.</p>
169
+ - source_sentence: Владелец квартиры на верхнем этаже многоквартирного дома хочет
170
+ установить кондиционер, труба которого будет проходить через стену соседней квартиры,
171
+ не затрагивая земельный участок. Может ли быть установлен сервитут на стену соседней
172
+ квартиры для прокладки трубы кондиционера, согласно приведенному тексту статьи?
173
+ sentences:
174
+ - <p>1. Комиссионер не отвечает перед комитентом за неисполнение третьим лицом сделки,
175
+ заключенной с ним за счет комитента, кроме случаев, когда комиссионер не проявил
176
+ необходимой осмотрительности в выборе этого лица либо принял на себя ручательство
177
+ за исполнение сделки (делькредере).</p><p>2. В случае неисполнения третьим лицом
178
+ сделки, заключенной с ним комиссионером, комиссионер обязан немедленно сообщить
179
+ об этом комитенту, собрать необходимые доказательства, а также по требованию комитента
180
+ передать ему права по такой сделке с соблюдением правил об уступке требования
181
+ (статьи 382 - 386, 388, 389).</p><p>3. Уступка прав комитенту по сделке на основании
182
+ пункта 2 настоящей статьи допускается независимо от соглашения комиссионера с
183
+ третьим лицом, запрещающего или ограничивающего такую уступку. Это не освобождает
184
+ комиссионера от ответственности перед третьим лицом в связи с уступкой права в
185
+ нарушение соглашения о ее запрете или об ограничении.</p>
186
+ - <p>Применительно к правилам, предусмотренным статьями 274 - 276 настоящего Кодекса,
187
+ сервитутом могут обременяться здания, сооружения и другое недвижимое иму��ество,
188
+ ограниченное пользование которым необходимо вне связи с пользованием земельным
189
+ участком.</p>
190
+ - <p>1. Завещатель вправе отменить или изменить составленное им завещание в любое
191
+ время после его совершения, не указывая при этом причины его отмены или изменения.</p><p>Для
192
+ отмены или изменения завещания не требуется чье-либо согласие, в том числе лиц,
193
+ назначенных наследниками в отменяемом или изменяемом завещании.</p><p>2. Завещатель
194
+ вправе посредством нового завещания отменить прежнее завещание в целом либо изменить
195
+ его посредством отмены или изменения отдельных содержащихся в нем завещательных
196
+ распоряжений.</p><p>Последующее завещание, не содержащее прямых указаний об отмене
197
+ прежнего завещания или отдельных содержащихся в нем завещательных распоряжений,
198
+ отменяет это прежнее завещание полностью или в части, в которой оно противоречит
199
+ последующему завещанию.</p><p>Завещание, отмененное полностью или частично последующим
200
+ завещанием, не восстанавливается, если последующее завещание отменено завещателем
201
+ полностью или в соответствующей части.</p><p>3. В случае недействительности последующего
202
+ завещания наследование осуществляется в соответствии с прежним завещанием.</p><p>4.
203
+ Завещание может быть отменено также посредством распоряжения о его отмене. Распоряжение
204
+ об отмене завещания должно быть совершено в форме, установленной настоящим Кодексом
205
+ для совершения завещания. К распоряжению об отмене завещания соответственно применяются
206
+ правила пункта 3 настоящей статьи.</p><p>5. Завещанием, совершенным в чрезвычайных
207
+ обстоятельствах (статья 1129), может быть отменено или изменено только такое же
208
+ завещание.</p><p>6. Завещательным распоряжением в банке (статья 1128) может быть
209
+ отменено или изменено только завещательное распоряжение правами на денежные средства
210
+ в соответствующем банке.</p>
211
+ - source_sentence: Компания «Альфа» заключила договор с инженером Петровским на разработку
212
+ нового программного обеспечения. В процессе работы Петровский создал изобретение,
213
+ защищаемое патентом. Договор не содержал пунктов, касающихся прав на интеллектуальную
214
+ собственность. Кто является правообладателем патента на изобретение, и может
215
+ ли компания «Альфа» использовать это изобретение без выплаты дополнительного вознаграждения?
216
+ sentences:
217
+ - <p>передаче в порядке, установленном частью 11 статьи 154 Федерального закона
218
+ <a href="102088491">от 22 августа 2004 года № 122-ФЗ</a> "О внесении изменений
219
+ в законодательные акты Российской Федерации и признании утратившими силу некоторых
220
+ законодательных актов Российской Федерации в связи с принятием федеральных законов
221
+ <a href="102067003">"О внесении изменений и дополнений в Федеральный закон "Об
222
+ общих принципах организации законодательных (представительных) и исполнительных
223
+ органов государственной власти субъектов Российской Федерации"</a> и <a href="102083574">"Об
224
+ общих принципах организации местного самоуправления в Российской Федерации"</a>,
225
+ акций из федеральной собственности в собственность субъекта Российской Федерации
226
+ или муниципальную собственность, из собственности субъекта Российской Федерации
227
+ в федеральную собственность или муниципальную собственность, из муниципальной
228
+ собственности в федеральную собственность или собственность субъекта Российской
229
+ Федерации. (Дополнение абзацем - Федеральный закон <a href="102157372">от 14.06.2012
230
+ № 77-ФЗ</a>)</p>
231
+ - <p>4. Если учрежденное за границей юридическое лицо осуществляет свою предпринимательскую
232
+ деятельность преимущественно на территории Российской Федерации, к требованиям
233
+ об ответственности по обязательствам юридического лица его учредителей (участников),
234
+ других лиц, которые имеют право давать обязательные для него указания или иным
235
+ образом имеют возможность определять его действия, применяется российское право
236
+ либо по выбору кредитора личный закон такого юридического лица. (Дополнение пунктом
237
+ - Федеральный закон <a href="102168115">от 30.09.2013 № 260-ФЗ</a>)</p>
238
+ - <p>1. Право на получение патента и исключительное право на изобретение, полезную
239
+ модель или промышленный образец, созданные при выполнении договора подряда или
240
+ договора на выполнение научно-исследовательских, опытно-конструкторских или технологических
241
+ работ, которые прямо не предусматривали их создание, принадлежат подрядчику (исполнителю),
242
+ если договором между ним и заказчиком не предусмотрено иное. (В редакции Федерального
243
+ закона <a href="102171743">от 12.03.2014 № 35-ФЗ</a>)</p><p>В этом случае заказчик
244
+ вправе, если договором не предусмотрено иное, использовать созданные таким образом
245
+ изобретение, полезную модель или промышленный образец в целях, для достижения
246
+ которых был заключен соответствующий договор, на условиях простой (неисключительной)
247
+ лицензии в течение всего срока действия патента без выплаты за это использование
248
+ дополнительного вознаграждения. При передаче подрядчиком (исполнителем) права
249
+ на получение патента или отчуждении самого патента другому лицу заказчик сохраняет
250
+ право использования изобретения, полезной модели или промышленного образца на
251
+ указанных условиях.</p><p>2. В случае, когда в соответствии с договором между
252
+ подрядчиком (исполнителем) и заказчиком право на получение патента или исключительное
253
+ право на изобретение, полезную модель или промышленный образец передано заказчику
254
+ либо указанному им третьему лицу, подрядчик (исполнитель) вправе использовать
255
+ созданные изобретение, полезную модель или промышленный образец для собственных
256
+ нужд на условиях безвозмездной простой (неисключительной) лицензии в течение всего
257
+ срока действия патента, если договором не предусмотрено иное.</p><p>3. Автору
258
+ указанных в пункте 1 настоящей статьи изобретения, полезной модели или промышленного
259
+ образца, не являющемуся патентообладателем, выплачивается вознаграждение в соответствии
260
+ с пунктом 4 статьи 1370 настоящего Кодекса.</p>
261
+ pipeline_tag: sentence-similarity
262
+ library_name: sentence-transformers
263
+ metrics:
264
+ - cosine_accuracy@1
265
+ - cosine_accuracy@3
266
+ - cosine_accuracy@5
267
+ - cosine_accuracy@10
268
+ - cosine_precision@1
269
+ - cosine_precision@3
270
+ - cosine_precision@5
271
+ - cosine_precision@10
272
+ - cosine_recall@1
273
+ - cosine_recall@3
274
+ - cosine_recall@5
275
+ - cosine_recall@10
276
+ - cosine_ndcg@10
277
+ - cosine_mrr@10
278
+ - cosine_map@100
279
+ model-index:
280
+ - name: tuned nomic v2
281
+ results:
282
+ - task:
283
+ type: information-retrieval
284
+ name: Information Retrieval
285
+ dataset:
286
+ name: dim 768
287
+ type: dim_768
288
+ metrics:
289
+ - type: cosine_accuracy@1
290
+ value: 0.004092769440654843
291
+ name: Cosine Accuracy@1
292
+ - type: cosine_accuracy@3
293
+ value: 0.06412005457025921
294
+ name: Cosine Accuracy@3
295
+ - type: cosine_accuracy@5
296
+ value: 0.4208731241473397
297
+ name: Cosine Accuracy@5
298
+ - type: cosine_accuracy@10
299
+ value: 0.7612551159618008
300
+ name: Cosine Accuracy@10
301
+ - type: cosine_precision@1
302
+ value: 0.004092769440654843
303
+ name: Cosine Precision@1
304
+ - type: cosine_precision@3
305
+ value: 0.021373351523419733
306
+ name: Cosine Precision@3
307
+ - type: cosine_precision@5
308
+ value: 0.08417462482946794
309
+ name: Cosine Precision@5
310
+ - type: cosine_precision@10
311
+ value: 0.07612551159618008
312
+ name: Cosine Precision@10
313
+ - type: cosine_recall@1
314
+ value: 0.004092769440654843
315
+ name: Cosine Recall@1
316
+ - type: cosine_recall@3
317
+ value: 0.06412005457025921
318
+ name: Cosine Recall@3
319
+ - type: cosine_recall@5
320
+ value: 0.4208731241473397
321
+ name: Cosine Recall@5
322
+ - type: cosine_recall@10
323
+ value: 0.7612551159618008
324
+ name: Cosine Recall@10
325
+ - type: cosine_ndcg@10
326
+ value: 0.2986249242161157
327
+ name: Cosine Ndcg@10
328
+ - type: cosine_mrr@10
329
+ value: 0.15883599688169725
330
+ name: Cosine Mrr@10
331
+ - type: cosine_map@100
332
+ value: 0.1714890252442529
333
+ name: Cosine Map@100
334
+ - task:
335
+ type: information-retrieval
336
+ name: Information Retrieval
337
+ dataset:
338
+ name: dim 512
339
+ type: dim_512
340
+ metrics:
341
+ - type: cosine_accuracy@1
342
+ value: 0.0068212824010914054
343
+ name: Cosine Accuracy@1
344
+ - type: cosine_accuracy@3
345
+ value: 0.06753069577080491
346
+ name: Cosine Accuracy@3
347
+ - type: cosine_accuracy@5
348
+ value: 0.41609822646657574
349
+ name: Cosine Accuracy@5
350
+ - type: cosine_accuracy@10
351
+ value: 0.7503410641200545
352
+ name: Cosine Accuracy@10
353
+ - type: cosine_precision@1
354
+ value: 0.0068212824010914054
355
+ name: Cosine Precision@1
356
+ - type: cosine_precision@3
357
+ value: 0.022510231923601638
358
+ name: Cosine Precision@3
359
+ - type: cosine_precision@5
360
+ value: 0.08321964529331514
361
+ name: Cosine Precision@5
362
+ - type: cosine_precision@10
363
+ value: 0.07503410641200545
364
+ name: Cosine Precision@10
365
+ - type: cosine_recall@1
366
+ value: 0.0068212824010914054
367
+ name: Cosine Recall@1
368
+ - type: cosine_recall@3
369
+ value: 0.06753069577080491
370
+ name: Cosine Recall@3
371
+ - type: cosine_recall@5
372
+ value: 0.41609822646657574
373
+ name: Cosine Recall@5
374
+ - type: cosine_recall@10
375
+ value: 0.7503410641200545
376
+ name: Cosine Recall@10
377
+ - type: cosine_ndcg@10
378
+ value: 0.29545256337366416
379
+ name: Cosine Ndcg@10
380
+ - type: cosine_mrr@10
381
+ value: 0.15798631412546613
382
+ name: Cosine Mrr@10
383
+ - type: cosine_map@100
384
+ value: 0.17102359712258386
385
+ name: Cosine Map@100
386
+ - task:
387
+ type: information-retrieval
388
+ name: Information Retrieval
389
+ dataset:
390
+ name: dim 256
391
+ type: dim_256
392
+ metrics:
393
+ - type: cosine_accuracy@1
394
+ value: 0.0034106412005457027
395
+ name: Cosine Accuracy@1
396
+ - type: cosine_accuracy@3
397
+ value: 0.06616643929058663
398
+ name: Cosine Accuracy@3
399
+ - type: cosine_accuracy@5
400
+ value: 0.417462482946794
401
+ name: Cosine Accuracy@5
402
+ - type: cosine_accuracy@10
403
+ value: 0.7223738062755798
404
+ name: Cosine Accuracy@10
405
+ - type: cosine_precision@1
406
+ value: 0.0034106412005457027
407
+ name: Cosine Precision@1
408
+ - type: cosine_precision@3
409
+ value: 0.022055479763528875
410
+ name: Cosine Precision@3
411
+ - type: cosine_precision@5
412
+ value: 0.08349249658935878
413
+ name: Cosine Precision@5
414
+ - type: cosine_precision@10
415
+ value: 0.07223738062755797
416
+ name: Cosine Precision@10
417
+ - type: cosine_recall@1
418
+ value: 0.0034106412005457027
419
+ name: Cosine Recall@1
420
+ - type: cosine_recall@3
421
+ value: 0.06616643929058663
422
+ name: Cosine Recall@3
423
+ - type: cosine_recall@5
424
+ value: 0.417462482946794
425
+ name: Cosine Recall@5
426
+ - type: cosine_recall@10
427
+ value: 0.7223738062755798
428
+ name: Cosine Recall@10
429
+ - type: cosine_ndcg@10
430
+ value: 0.2841815053560014
431
+ name: Cosine Ndcg@10
432
+ - type: cosine_mrr@10
433
+ value: 0.15151719396262187
434
+ name: Cosine Mrr@10
435
+ - type: cosine_map@100
436
+ value: 0.1659963653118235
437
+ name: Cosine Map@100
438
+ - task:
439
+ type: information-retrieval
440
+ name: Information Retrieval
441
+ dataset:
442
+ name: dim 128
443
+ type: dim_128
444
+ metrics:
445
+ - type: cosine_accuracy@1
446
+ value: 0.008185538881309686
447
+ name: Cosine Accuracy@1
448
+ - type: cosine_accuracy@3
449
+ value: 0.05798090040927694
450
+ name: Cosine Accuracy@3
451
+ - type: cosine_accuracy@5
452
+ value: 0.3860845839017735
453
+ name: Cosine Accuracy@5
454
+ - type: cosine_accuracy@10
455
+ value: 0.694406548431105
456
+ name: Cosine Accuracy@10
457
+ - type: cosine_precision@1
458
+ value: 0.008185538881309686
459
+ name: Cosine Precision@1
460
+ - type: cosine_precision@3
461
+ value: 0.019326966803092312
462
+ name: Cosine Precision@3
463
+ - type: cosine_precision@5
464
+ value: 0.07721691678035471
465
+ name: Cosine Precision@5
466
+ - type: cosine_precision@10
467
+ value: 0.06944065484311049
468
+ name: Cosine Precision@10
469
+ - type: cosine_recall@1
470
+ value: 0.008185538881309686
471
+ name: Cosine Recall@1
472
+ - type: cosine_recall@3
473
+ value: 0.05798090040927694
474
+ name: Cosine Recall@3
475
+ - type: cosine_recall@5
476
+ value: 0.3860845839017735
477
+ name: Cosine Recall@5
478
+ - type: cosine_recall@10
479
+ value: 0.694406548431105
480
+ name: Cosine Recall@10
481
+ - type: cosine_ndcg@10
482
+ value: 0.2749254568568281
483
+ name: Cosine Ndcg@10
484
+ - type: cosine_mrr@10
485
+ value: 0.14819208947789936
486
+ name: Cosine Mrr@10
487
+ - type: cosine_map@100
488
+ value: 0.16363198200379098
489
+ name: Cosine Map@100
490
+ - task:
491
+ type: information-retrieval
492
+ name: Information Retrieval
493
+ dataset:
494
+ name: dim 64
495
+ type: dim_64
496
+ metrics:
497
+ - type: cosine_accuracy@1
498
+ value: 0.0068212824010914054
499
+ name: Cosine Accuracy@1
500
+ - type: cosine_accuracy@3
501
+ value: 0.06684856753069578
502
+ name: Cosine Accuracy@3
503
+ - type: cosine_accuracy@5
504
+ value: 0.36221009549795363
505
+ name: Cosine Accuracy@5
506
+ - type: cosine_accuracy@10
507
+ value: 0.6323328785811733
508
+ name: Cosine Accuracy@10
509
+ - type: cosine_precision@1
510
+ value: 0.0068212824010914054
511
+ name: Cosine Precision@1
512
+ - type: cosine_precision@3
513
+ value: 0.022282855843565257
514
+ name: Cosine Precision@3
515
+ - type: cosine_precision@5
516
+ value: 0.07244201909959072
517
+ name: Cosine Precision@5
518
+ - type: cosine_precision@10
519
+ value: 0.06323328785811731
520
+ name: Cosine Precision@10
521
+ - type: cosine_recall@1
522
+ value: 0.0068212824010914054
523
+ name: Cosine Recall@1
524
+ - type: cosine_recall@3
525
+ value: 0.06684856753069578
526
+ name: Cosine Recall@3
527
+ - type: cosine_recall@5
528
+ value: 0.36221009549795363
529
+ name: Cosine Recall@5
530
+ - type: cosine_recall@10
531
+ value: 0.6323328785811733
532
+ name: Cosine Recall@10
533
+ - type: cosine_ndcg@10
534
+ value: 0.25115836351492093
535
+ name: Cosine Ndcg@10
536
+ - type: cosine_mrr@10
537
+ value: 0.13584827519002
538
+ name: Cosine Mrr@10
539
+ - type: cosine_map@100
540
+ value: 0.15255646759369407
541
+ name: Cosine Map@100
542
+ ---
543
+
544
+ # tuned nomic v2
545
+
546
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [nomic-ai/nomic-embed-text-v2-moe](https://huggingface.co/nomic-ai/nomic-embed-text-v2-moe) on the json dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
547
+
548
+ ## Model Details
549
+
550
+ ### Model Description
551
+ - **Model Type:** Sentence Transformer
552
+ - **Base model:** [nomic-ai/nomic-embed-text-v2-moe](https://huggingface.co/nomic-ai/nomic-embed-text-v2-moe) <!-- at revision f6a8873b415144a69ffc529ec1e234d1e00ee765 -->
553
+ - **Maximum Sequence Length:** 512 tokens
554
+ - **Output Dimensionality:** 768 dimensions
555
+ - **Similarity Function:** Cosine Similarity
556
+ - **Training Dataset:**
557
+ - json
558
+ - **Language:** en
559
+ - **License:** apache-2.0
560
+
561
+ ### Model Sources
562
+
563
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
564
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
565
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
566
+
567
+ ### Full Model Architecture
568
+
569
+ ```
570
+ SentenceTransformer(
571
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: NomicBertModel
572
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
573
+ (2): Normalize()
574
+ )
575
+ ```
576
+
577
+ ## Usage
578
+
579
+ ### Direct Usage (Sentence Transformers)
580
+
581
+ First install the Sentence Transformers library:
582
+
583
+ ```bash
584
+ pip install -U sentence-transformers
585
+ ```
586
+
587
+ Then you can load this model and run inference.
588
+ ```python
589
+ from sentence_transformers import SentenceTransformer
590
+
591
+ # Download from the 🤗 Hub
592
+ model = SentenceTransformer("sentence_transformers_model_id")
593
+ # Run inference
594
+ sentences = [
595
+ 'Компания «Альфа» заключила договор с инженером Петровским на разработку нового программного обеспечения. В процессе работы Петровский создал изобретение, защищаемое патентом. Договор не содержал пунктов, касающихся прав на интеллектуальную собственность. Кто является правообладателем патента на изобретение, и может ли компания «Альфа» использовать это изобретение без выплаты дополнительного вознаграждения?',
596
+ '<p>1. Право на получение патента и исключительное право на изобретение, полезную модель или промышленный образец, созданные при выполнении договора подряда или договора на выполнение научно-исследовательских, опытно-конструкторских или технологических работ, которые прямо не предусматривали их создание, принадлежат подрядчику (исполнителю), если договором между ним и заказчиком не предусмотрено иное. (В редакции Федерального закона <a href="102171743">от 12.03.2014 № 35-ФЗ</a>)</p><p>В этом случае заказчик вправе, если договором не предусмотрено иное, использовать созданные таким образом изобретение, полезную модель или промышленный образец в целях, для достижения которых был заключен соответствующий договор, на условиях простой (неисключительной) лицензии в течение всего срока действия патента без выплаты за это использование дополнительного вознаграждения. При передаче подрядчиком (исполнителем) права на получение патента или отчуждении самого патента другому лицу заказчик сохраняет право использования изобретения, полезной модели или промышленного образца на указанных условиях.</p><p>2. В случае, когда в соответствии с договором между подрядчиком (исполнителем) и заказчиком право на получение патента или исключительное право на изобретение, полезную модель или промышленный образец передано заказчику либо указанному им третьему лицу, подрядчик (исполнитель) вправе использовать созданные изобретение, полезную модель или промышленный образец для собственных нужд на условиях безвозмездной простой (неисключительной) лицензии в течение всего срока действия патента, если договором не предусмотрено иное.</p><p>3. Автору указанных в пункте 1 настоящей статьи изобретения, полезной модели или промышленного образца, не являющемуся патентообладателем, выплачивается вознаграждение в соответствии с пунктом 4 статьи 1370 настоящего Кодекса.</p>',
597
+ '<p>передаче в порядке, установленном частью 11 статьи 154 Федерального закона <a href="102088491">от 22 августа 2004 года № 122-ФЗ</a> "О внесении изменений в законодательные акты Российской Федерации и признании утратившими силу некоторых законодательных актов Российской Федерации в связи с принятием федеральных законов <a href="102067003">"О внесении изменений и дополнений в Федеральный закон "Об общих принципах организации законодательных (представительных) и исполнительных органов государственной власти субъектов Российской Федерации"</a> и <a href="102083574">"Об общих принципах организации местного самоуправления в Российской Федерации"</a>, акций из федеральной собственности в собственность субъекта Российской Федерации или муниципальную собственность, из собственности субъекта Российской Федерации в федеральную собственность или муниципальную собственность, из муниципальной собственности в федеральную собственность или собственность субъекта Российской Федерации. (Дополнение абзацем - Федеральный закон <a href="102157372">от 14.06.2012 № 77-ФЗ</a>)</p>',
598
+ ]
599
+ embeddings = model.encode(sentences)
600
+ print(embeddings.shape)
601
+ # [3, 768]
602
+
603
+ # Get the similarity scores for the embeddings
604
+ similarities = model.similarity(embeddings, embeddings)
605
+ print(similarities.shape)
606
+ # [3, 3]
607
+ ```
608
+
609
+ <!--
610
+ ### Direct Usage (Transformers)
611
+
612
+ <details><summary>Click to see the direct usage in Transformers</summary>
613
+
614
+ </details>
615
+ -->
616
+
617
+ <!--
618
+ ### Downstream Usage (Sentence Transformers)
619
+
620
+ You can finetune this model on your own dataset.
621
+
622
+ <details><summary>Click to expand</summary>
623
+
624
+ </details>
625
+ -->
626
+
627
+ <!--
628
+ ### Out-of-Scope Use
629
+
630
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
631
+ -->
632
+
633
+ ## Evaluation
634
+
635
+ ### Metrics
636
+
637
+ #### Information Retrieval
638
+
639
+ * Datasets: `dim_768`, `dim_512`, `dim_256`, `dim_128` and `dim_64`
640
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
641
+
642
+ | Metric | dim_768 | dim_512 | dim_256 | dim_128 | dim_64 |
643
+ |:--------------------|:-----------|:-----------|:-----------|:-----------|:-----------|
644
+ | cosine_accuracy@1 | 0.0041 | 0.0068 | 0.0034 | 0.0082 | 0.0068 |
645
+ | cosine_accuracy@3 | 0.0641 | 0.0675 | 0.0662 | 0.058 | 0.0668 |
646
+ | cosine_accuracy@5 | 0.4209 | 0.4161 | 0.4175 | 0.3861 | 0.3622 |
647
+ | cosine_accuracy@10 | 0.7613 | 0.7503 | 0.7224 | 0.6944 | 0.6323 |
648
+ | cosine_precision@1 | 0.0041 | 0.0068 | 0.0034 | 0.0082 | 0.0068 |
649
+ | cosine_precision@3 | 0.0214 | 0.0225 | 0.0221 | 0.0193 | 0.0223 |
650
+ | cosine_precision@5 | 0.0842 | 0.0832 | 0.0835 | 0.0772 | 0.0724 |
651
+ | cosine_precision@10 | 0.0761 | 0.075 | 0.0722 | 0.0694 | 0.0632 |
652
+ | cosine_recall@1 | 0.0041 | 0.0068 | 0.0034 | 0.0082 | 0.0068 |
653
+ | cosine_recall@3 | 0.0641 | 0.0675 | 0.0662 | 0.058 | 0.0668 |
654
+ | cosine_recall@5 | 0.4209 | 0.4161 | 0.4175 | 0.3861 | 0.3622 |
655
+ | cosine_recall@10 | 0.7613 | 0.7503 | 0.7224 | 0.6944 | 0.6323 |
656
+ | **cosine_ndcg@10** | **0.2986** | **0.2955** | **0.2842** | **0.2749** | **0.2512** |
657
+ | cosine_mrr@10 | 0.1588 | 0.158 | 0.1515 | 0.1482 | 0.1358 |
658
+ | cosine_map@100 | 0.1715 | 0.171 | 0.166 | 0.1636 | 0.1526 |
659
+
660
+ <!--
661
+ ## Bias, Risks and Limitations
662
+
663
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
664
+ -->
665
+
666
+ <!--
667
+ ### Recommendations
668
+
669
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
670
+ -->
671
+
672
+ ## Training Details
673
+
674
+ ### Training Dataset
675
+
676
+ #### json
677
+
678
+ * Dataset: json
679
+ * Size: 13,186 training samples
680
+ * Columns: <code>anchor</code> and <code>positive</code>
681
+ * Approximate statistics based on the first 1000 samples:
682
+ | | anchor | positive |
683
+ |:--------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
684
+ | type | string | string |
685
+ | details | <ul><li>min: 18 tokens</li><li>mean: 61.09 tokens</li><li>max: 162 tokens</li></ul> | <ul><li>min: 40 tokens</li><li>mean: 258.71 tokens</li><li>max: 512 tokens</li></ul> |
686
+ * Samples:
687
+ | anchor | positive |
688
+ |:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
689
+ | <code>Студент разработал базу данных и подал заявку на государственную регистрацию, приложив к ней описание базы данных, реферат и заявление с указанием себя в качестве правообладателя и автора. В заявке он указал две разные базы данных. Соответствует ли заявка студента требованиям статьи закона?</code> | <code><p>1. Правообладатель в течение срока действия исключительного права на программу для ЭВМ или на базу данных может по своему желанию зарегистрировать такую программу или такую базу данных в федеральном органе исполнительной власти по интеллектуальной собственности.</p><p>Программы для ЭВМ и базы данных, в которых содержатся сведения, составляющие государственную тайну, государственной регистрации не подлежат. Лицо, подавшее заявку на государственную регистрацию (заявитель), несет ответственность за разглашение сведений о программах для ЭВМ и базах данных, в которых содержатся сведения, составляющие государственную тайну, в соответствии с законодательством Российской Федерации.</p><p>2. Заявка на государственную регистрацию программы для ЭВМ или базы данных (заявка на регистрацию) должна относиться к одной программе для ЭВМ или к одной базе данных.</p><p>Заявка на регистрацию должна содержать:</p><p>заявление о государственной регистрации программы для ЭВМ или базы данных с указанием пр...</code> |
690
+ | <code>Предположим, наследственный договор предусматривает переход права собственности на дом к А, но А отказывается от наследства. Может ли Б, другая сторона договора, потребовать исполнения договора в отношении дома, если договор не содержал бы условий о передаче дома Б в случае отказа А?</code> | <code><p>1. Наследодатель вправе заключить с любым из лиц, которые могут призываться к наследованию (статья 1116), договор, условия которого определяют круг наследников и порядок перехода прав на имущество наследодателя после его смерти к пережившим наследодателя сторонам договора или к пережившим третьим лицам, которые могут призываться к наследованию (наследственный договор). Наследственный договор может также содержать условие о душеприказчике и возлагать на участвующих в наследственном договоре лиц, которые могут призываться к наследованию, обязанность совершить какие-либо не противоречащие закону действия имущественного или неимущественного характера, в том числе исполнить завещательные отказы или завещательные возложения.</p><p>Последствия, предусмотренные наследственным договором, могут быть поставлены в зависимость от наступивших ко дню открытия наследства обстоятельств, относительно которых при заключении наследственного договора было неизвестно, наступят они или не наступят, в том ...</code> |
691
+ | <code>В чем заключается различие в порядке оспаривания патента в зависимости от характера нарушения, указанного в пункте 1 настоящей статьи?</code> | <code><p>2. Патент на изобретение, полезную модель или промышленный образец в течение срока его действия, установленного пунктами 1 - 3 статьи 1363 настоящего Кодекса, может быть оспорен путем подачи возражения в федеральный орган исполнительной власти по интеллектуальной собственности любым лицом, которому стало известно о нарушениях, предусмотренных подпунктами 1 - 4 пункта 1 настоящей статьи.</p><p>Патент на изобретение, полезную модель или промышленный образец в течение срока его действия, установленного пунктами 1 - 3 статьи 1363 настоящего Кодекса, может быть оспорен в судебном порядке любым лицом, которому стало известно о нарушениях, предусмотренных подпунктом 5 пункта 1 настоящей статьи.</p><p>Патент на изобретение, полезную модель или промышленный образец может быть оспорен заинтересованным лицом и по истечении срока его действия по основаниям и в порядке, которые установлены абзацами первым и вторым настоящего пункта.</p></code> |
692
+ * Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
693
+ ```json
694
+ {
695
+ "loss": "MultipleNegativesRankingLoss",
696
+ "matryoshka_dims": [
697
+ 768,
698
+ 512,
699
+ 256,
700
+ 128,
701
+ 64
702
+ ],
703
+ "matryoshka_weights": [
704
+ 1,
705
+ 1,
706
+ 1,
707
+ 1,
708
+ 1
709
+ ],
710
+ "n_dims_per_step": -1
711
+ }
712
+ ```
713
+
714
+ ### Training Hyperparameters
715
+ #### Non-Default Hyperparameters
716
+
717
+ - `eval_strategy`: epoch
718
+ - `per_device_train_batch_size`: 2
719
+ - `per_device_eval_batch_size`: 2
720
+ - `gradient_accumulation_steps`: 16
721
+ - `learning_rate`: 2e-05
722
+ - `num_train_epochs`: 4
723
+ - `lr_scheduler_type`: cosine
724
+ - `warmup_ratio`: 0.1
725
+ - `bf16`: True
726
+ - `load_best_model_at_end`: True
727
+ - `optim`: adamw_torch_fused
728
+ - `batch_sampler`: no_duplicates
729
+
730
+ #### All Hyperparameters
731
+ <details><summary>Click to expand</summary>
732
+
733
+ - `overwrite_output_dir`: False
734
+ - `do_predict`: False
735
+ - `eval_strategy`: epoch
736
+ - `prediction_loss_only`: True
737
+ - `per_device_train_batch_size`: 2
738
+ - `per_device_eval_batch_size`: 2
739
+ - `per_gpu_train_batch_size`: None
740
+ - `per_gpu_eval_batch_size`: None
741
+ - `gradient_accumulation_steps`: 16
742
+ - `eval_accumulation_steps`: None
743
+ - `torch_empty_cache_steps`: None
744
+ - `learning_rate`: 2e-05
745
+ - `weight_decay`: 0.0
746
+ - `adam_beta1`: 0.9
747
+ - `adam_beta2`: 0.999
748
+ - `adam_epsilon`: 1e-08
749
+ - `max_grad_norm`: 1.0
750
+ - `num_train_epochs`: 4
751
+ - `max_steps`: -1
752
+ - `lr_scheduler_type`: cosine
753
+ - `lr_scheduler_kwargs`: {}
754
+ - `warmup_ratio`: 0.1
755
+ - `warmup_steps`: 0
756
+ - `log_level`: passive
757
+ - `log_level_replica`: warning
758
+ - `log_on_each_node`: True
759
+ - `logging_nan_inf_filter`: True
760
+ - `save_safetensors`: True
761
+ - `save_on_each_node`: False
762
+ - `save_only_model`: False
763
+ - `restore_callback_states_from_checkpoint`: False
764
+ - `no_cuda`: False
765
+ - `use_cpu`: False
766
+ - `use_mps_device`: False
767
+ - `seed`: 42
768
+ - `data_seed`: None
769
+ - `jit_mode_eval`: False
770
+ - `use_ipex`: False
771
+ - `bf16`: True
772
+ - `fp16`: False
773
+ - `fp16_opt_level`: O1
774
+ - `half_precision_backend`: auto
775
+ - `bf16_full_eval`: False
776
+ - `fp16_full_eval`: False
777
+ - `tf32`: None
778
+ - `local_rank`: 0
779
+ - `ddp_backend`: None
780
+ - `tpu_num_cores`: None
781
+ - `tpu_metrics_debug`: False
782
+ - `debug`: []
783
+ - `dataloader_drop_last`: False
784
+ - `dataloader_num_workers`: 0
785
+ - `dataloader_prefetch_factor`: None
786
+ - `past_index`: -1
787
+ - `disable_tqdm`: False
788
+ - `remove_unused_columns`: True
789
+ - `label_names`: None
790
+ - `load_best_model_at_end`: True
791
+ - `ignore_data_skip`: False
792
+ - `fsdp`: []
793
+ - `fsdp_min_num_params`: 0
794
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
795
+ - `fsdp_transformer_layer_cls_to_wrap`: None
796
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
797
+ - `deepspeed`: None
798
+ - `label_smoothing_factor`: 0.0
799
+ - `optim`: adamw_torch_fused
800
+ - `optim_args`: None
801
+ - `adafactor`: False
802
+ - `group_by_length`: False
803
+ - `length_column_name`: length
804
+ - `ddp_find_unused_parameters`: None
805
+ - `ddp_bucket_cap_mb`: None
806
+ - `ddp_broadcast_buffers`: False
807
+ - `dataloader_pin_memory`: True
808
+ - `dataloader_persistent_workers`: False
809
+ - `skip_memory_metrics`: True
810
+ - `use_legacy_prediction_loop`: False
811
+ - `push_to_hub`: False
812
+ - `resume_from_checkpoint`: None
813
+ - `hub_model_id`: None
814
+ - `hub_strategy`: every_save
815
+ - `hub_private_repo`: False
816
+ - `hub_always_push`: False
817
+ - `gradient_checkpointing`: False
818
+ - `gradient_checkpointing_kwargs`: None
819
+ - `include_inputs_for_metrics`: False
820
+ - `eval_do_concat_batches`: True
821
+ - `fp16_backend`: auto
822
+ - `push_to_hub_model_id`: None
823
+ - `push_to_hub_organization`: None
824
+ - `mp_parameters`:
825
+ - `auto_find_batch_size`: False
826
+ - `full_determinism`: False
827
+ - `torchdynamo`: None
828
+ - `ray_scope`: last
829
+ - `ddp_timeout`: 1800
830
+ - `torch_compile`: False
831
+ - `torch_compile_backend`: None
832
+ - `torch_compile_mode`: None
833
+ - `dispatch_batches`: None
834
+ - `split_batches`: None
835
+ - `include_tokens_per_second`: False
836
+ - `include_num_input_tokens_seen`: False
837
+ - `neftune_noise_alpha`: None
838
+ - `optim_target_modules`: None
839
+ - `batch_eval_metrics`: False
840
+ - `eval_on_start`: False
841
+ - `eval_use_gather_object`: False
842
+ - `prompts`: None
843
+ - `batch_sampler`: no_duplicates
844
+ - `multi_dataset_batch_sampler`: proportional
845
+
846
+ </details>
847
+
848
+ ### Training Logs
849
+ <details><summary>Click to expand</summary>
850
+
851
+ | Epoch | Step | Training Loss | dim_768_cosine_ndcg@10 | dim_512_cosine_ndcg@10 | dim_256_cosine_ndcg@10 | dim_128_cosine_ndcg@10 | dim_64_cosine_ndcg@10 |
852
+ |:------:|:----:|:-------------:|:----------------------:|:----------------------:|:----------------------:|:----------------------:|:---------------------:|
853
+ | 0.0243 | 10 | 0.2108 | - | - | - | - | - |
854
+ | 0.0485 | 20 | 0.1169 | - | - | - | - | - |
855
+ | 0.0728 | 30 | 0.1334 | - | - | - | - | - |
856
+ | 0.0971 | 40 | 0.0963 | - | - | - | - | - |
857
+ | 0.1213 | 50 | 0.127 | - | - | - | - | - |
858
+ | 0.1456 | 60 | 0.1254 | - | - | - | - | - |
859
+ | 0.1699 | 70 | 0.048 | - | - | - | - | - |
860
+ | 0.1941 | 80 | 0.0358 | - | - | - | - | - |
861
+ | 0.2184 | 90 | 0.0673 | - | - | - | - | - |
862
+ | 0.2427 | 100 | 0.049 | - | - | - | - | - |
863
+ | 0.2669 | 110 | 0.0222 | - | - | - | - | - |
864
+ | 0.2912 | 120 | 0.0657 | - | - | - | - | - |
865
+ | 0.3155 | 130 | 0.0878 | - | - | - | - | - |
866
+ | 0.3398 | 140 | 0.0396 | - | - | - | - | - |
867
+ | 0.3640 | 150 | 0.033 | - | - | - | - | - |
868
+ | 0.3883 | 160 | 0.0562 | - | - | - | - | - |
869
+ | 0.4126 | 170 | 0.0329 | - | - | - | - | - |
870
+ | 0.4368 | 180 | 0.0918 | - | - | - | - | - |
871
+ | 0.4611 | 190 | 0.0198 | - | - | - | - | - |
872
+ | 0.4854 | 200 | 0.0181 | - | - | - | - | - |
873
+ | 0.5096 | 210 | 0.0119 | - | - | - | - | - |
874
+ | 0.5339 | 220 | 0.0139 | - | - | - | - | - |
875
+ | 0.5582 | 230 | 0.057 | - | - | - | - | - |
876
+ | 0.5824 | 240 | 0.0293 | - | - | - | - | - |
877
+ | 0.6067 | 250 | 0.0482 | - | - | - | - | - |
878
+ | 0.6310 | 260 | 0.017 | - | - | - | - | - |
879
+ | 0.6552 | 270 | 0.0927 | - | - | - | - | - |
880
+ | 0.6795 | 280 | 0.0187 | - | - | - | - | - |
881
+ | 0.7038 | 290 | 0.0553 | - | - | - | - | - |
882
+ | 0.7280 | 300 | 0.015 | - | - | - | - | - |
883
+ | 0.7523 | 310 | 0.0438 | - | - | - | - | - |
884
+ | 0.7766 | 320 | 0.0087 | - | - | - | - | - |
885
+ | 0.8008 | 330 | 0.038 | - | - | - | - | - |
886
+ | 0.8251 | 340 | 0.0243 | - | - | - | - | - |
887
+ | 0.8494 | 350 | 0.015 | - | - | - | - | - |
888
+ | 0.8737 | 360 | 0.0199 | - | - | - | - | - |
889
+ | 0.8979 | 370 | 0.0516 | - | - | - | - | - |
890
+ | 0.9222 | 380 | 0.0561 | - | - | - | - | - |
891
+ | 0.9465 | 390 | 0.0851 | - | - | - | - | - |
892
+ | 0.9707 | 400 | 0.0394 | - | - | - | - | - |
893
+ | 0.9950 | 410 | 0.0114 | - | - | - | - | - |
894
+ | 0.9998 | 412 | - | 0.2806 | 0.2779 | 0.2742 | 0.2597 | 0.2253 |
895
+ | 1.0193 | 420 | 0.0136 | - | - | - | - | - |
896
+ | 1.0435 | 430 | 0.1219 | - | - | - | - | - |
897
+ | 1.0678 | 440 | 0.0164 | - | - | - | - | - |
898
+ | 1.0921 | 450 | 0.0927 | - | - | - | - | - |
899
+ | 1.1163 | 460 | 0.0268 | - | - | - | - | - |
900
+ | 1.1406 | 470 | 0.0384 | - | - | - | - | - |
901
+ | 1.1649 | 480 | 0.0034 | - | - | - | - | - |
902
+ | 1.1891 | 490 | 0.0183 | - | - | - | - | - |
903
+ | 1.2134 | 500 | 0.0594 | - | - | - | - | - |
904
+ | 1.2377 | 510 | 0.0145 | - | - | - | - | - |
905
+ | 1.2619 | 520 | 0.0768 | - | - | - | - | - |
906
+ | 1.2862 | 530 | 0.0084 | - | - | - | - | - |
907
+ | 1.3105 | 540 | 0.0528 | - | - | - | - | - |
908
+ | 1.3347 | 550 | 0.0619 | - | - | - | - | - |
909
+ | 1.3590 | 560 | 0.0326 | - | - | - | - | - |
910
+ | 1.3833 | 570 | 0.0135 | - | - | - | - | - |
911
+ | 1.4076 | 580 | 0.0143 | - | - | - | - | - |
912
+ | 1.4318 | 590 | 0.0952 | - | - | - | - | - |
913
+ | 1.4561 | 600 | 0.0188 | - | - | - | - | - |
914
+ | 1.4804 | 610 | 0.01 | - | - | - | - | - |
915
+ | 1.5046 | 620 | 0.091 | - | - | - | - | - |
916
+ | 1.5289 | 630 | 0.0205 | - | - | - | - | - |
917
+ | 1.5532 | 640 | 0.0156 | - | - | - | - | - |
918
+ | 1.5774 | 650 | 0.0101 | - | - | - | - | - |
919
+ | 1.6017 | 660 | 0.022 | - | - | - | - | - |
920
+ | 1.6260 | 670 | 0.0135 | - | - | - | - | - |
921
+ | 1.6502 | 680 | 0.0226 | - | - | - | - | - |
922
+ | 1.6745 | 690 | 0.0032 | - | - | - | - | - |
923
+ | 1.6988 | 700 | 0.0071 | - | - | - | - | - |
924
+ | 1.7230 | 710 | 0.028 | - | - | - | - | - |
925
+ | 1.7473 | 720 | 0.0351 | - | - | - | - | - |
926
+ | 1.7716 | 730 | 0.0021 | - | - | - | - | - |
927
+ | 1.7958 | 740 | 0.0073 | - | - | - | - | - |
928
+ | 1.8201 | 750 | 0.0103 | - | - | - | - | - |
929
+ | 1.8444 | 760 | 0.0219 | - | - | - | - | - |
930
+ | 1.8686 | 770 | 0.0035 | - | - | - | - | - |
931
+ | 1.8929 | 780 | 0.0579 | - | - | - | - | - |
932
+ | 1.9172 | 790 | 0.0298 | - | - | - | - | - |
933
+ | 1.9415 | 800 | 0.0076 | - | - | - | - | - |
934
+ | 1.9657 | 810 | 0.0038 | - | - | - | - | - |
935
+ | 1.9900 | 820 | 0.0016 | - | - | - | - | - |
936
+ | 1.9997 | 824 | - | 0.2945 | 0.2886 | 0.2856 | 0.2642 | 0.2411 |
937
+ | 2.0143 | 830 | 0.0715 | - | - | - | - | - |
938
+ | 2.0385 | 840 | 0.0021 | - | - | - | - | - |
939
+ | 2.0628 | 850 | 0.0065 | - | - | - | - | - |
940
+ | 2.0871 | 860 | 0.0105 | - | - | - | - | - |
941
+ | 2.1113 | 870 | 0.0024 | - | - | - | - | - |
942
+ | 2.1356 | 880 | 0.0025 | - | - | - | - | - |
943
+ | 2.1599 | 890 | 0.014 | - | - | - | - | - |
944
+ | 2.1841 | 900 | 0.0016 | - | - | - | - | - |
945
+ | 2.2084 | 910 | 0.008 | - | - | - | - | - |
946
+ | 2.2327 | 920 | 0.0041 | - | - | - | - | - |
947
+ | 2.2569 | 930 | 0.0308 | - | - | - | - | - |
948
+ | 2.2812 | 940 | 0.011 | - | - | - | - | - |
949
+ | 2.3055 | 950 | 0.0207 | - | - | - | - | - |
950
+ | 2.3297 | 960 | 0.0048 | - | - | - | - | - |
951
+ | 2.3540 | 970 | 0.0215 | - | - | - | - | - |
952
+ | 2.3783 | 980 | 0.0061 | - | - | - | - | - |
953
+ | 2.4025 | 990 | 0.0164 | - | - | - | - | - |
954
+ | 2.4268 | 1000 | 0.0255 | - | - | - | - | - |
955
+ | 2.4511 | 1010 | 0.0062 | - | - | - | - | - |
956
+ | 2.4754 | 1020 | 0.0079 | - | - | - | - | - |
957
+ | 2.4996 | 1030 | 0.005 | - | - | - | - | - |
958
+ | 2.5239 | 1040 | 0.042 | - | - | - | - | - |
959
+ | 2.5482 | 1050 | 0.0057 | - | - | - | - | - |
960
+ | 2.5724 | 1060 | 0.0384 | - | - | - | - | - |
961
+ | 2.5967 | 1070 | 0.009 | - | - | - | - | - |
962
+ | 2.6210 | 1080 | 0.0089 | - | - | - | - | - |
963
+ | 2.6452 | 1090 | 0.0034 | - | - | - | - | - |
964
+ | 2.6695 | 1100 | 0.026 | - | - | - | - | - |
965
+ | 2.6938 | 1110 | 0.0358 | - | - | - | - | - |
966
+ | 2.7180 | 1120 | 0.0033 | - | - | - | - | - |
967
+ | 2.7423 | 1130 | 0.0037 | - | - | - | - | - |
968
+ | 2.7666 | 1140 | 0.0195 | - | - | - | - | - |
969
+ | 2.7908 | 1150 | 0.0024 | - | - | - | - | - |
970
+ | 2.8151 | 1160 | 0.0533 | - | - | - | - | - |
971
+ | 2.8394 | 1170 | 0.0137 | - | - | - | - | - |
972
+ | 2.8636 | 1180 | 0.0125 | - | - | - | - | - |
973
+ | 2.8879 | 1190 | 0.0253 | - | - | - | - | - |
974
+ | 2.9122 | 1200 | 0.0068 | - | - | - | - | - |
975
+ | 2.9364 | 1210 | 0.0436 | - | - | - | - | - |
976
+ | 2.9607 | 1220 | 0.0021 | - | - | - | - | - |
977
+ | 2.9850 | 1230 | 0.0129 | - | - | - | - | - |
978
+ | 2.9995 | 1236 | - | 0.2986 | 0.2955 | 0.2842 | 0.2749 | 0.2512 |
979
+
980
+ </details>
981
+
982
+ ### Framework Versions
983
+ - Python: 3.11.11
984
+ - Sentence Transformers: 3.4.1
985
+ - Transformers: 4.43.0
986
+ - PyTorch: 2.6.0+cu124
987
+ - Accelerate: 1.3.0
988
+ - Datasets: 3.3.2
989
+ - Tokenizers: 0.19.1
990
+
991
+ ## Citation
992
+
993
+ ### BibTeX
994
+
995
+ #### Sentence Transformers
996
+ ```bibtex
997
+ @inproceedings{reimers-2019-sentence-bert,
998
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
999
+ author = "Reimers, Nils and Gurevych, Iryna",
1000
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
1001
+ month = "11",
1002
+ year = "2019",
1003
+ publisher = "Association for Computational Linguistics",
1004
+ url = "https://arxiv.org/abs/1908.10084",
1005
+ }
1006
+ ```
1007
+
1008
+ #### MatryoshkaLoss
1009
+ ```bibtex
1010
+ @misc{kusupati2024matryoshka,
1011
+ title={Matryoshka Representation Learning},
1012
+ author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
1013
+ year={2024},
1014
+ eprint={2205.13147},
1015
+ archivePrefix={arXiv},
1016
+ primaryClass={cs.LG}
1017
+ }
1018
+ ```
1019
+
1020
+ #### MultipleNegativesRankingLoss
1021
+ ```bibtex
1022
+ @misc{henderson2017efficient,
1023
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
1024
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
1025
+ year={2017},
1026
+ eprint={1705.00652},
1027
+ archivePrefix={arXiv},
1028
+ primaryClass={cs.CL}
1029
+ }
1030
+ ```
1031
+
1032
+ <!--
1033
+ ## Glossary
1034
+
1035
+ *Clearly define terms in order to be accessible across audiences.*
1036
+ -->
1037
+
1038
+ <!--
1039
+ ## Model Card Authors
1040
+
1041
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
1042
+ -->
1043
+
1044
+ <!--
1045
+ ## Model Card Contact
1046
+
1047
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
1048
+ -->
checkpoint-1236/config.json ADDED
@@ -0,0 +1,74 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "nomic-ai/nomic-embed-text-v2-moe",
3
+ "activation_function": "gelu",
4
+ "add_pooling_layer": false,
5
+ "architectures": [
6
+ "NomicBertModel"
7
+ ],
8
+ "attn_pdrop": 0.0,
9
+ "auto_map": {
10
+ "AutoConfig": "nomic-ai/nomic-bert-2048--configuration_hf_nomic_bert.NomicBertConfig",
11
+ "AutoModel": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertModel",
12
+ "AutoModelForMaskedLM": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForPreTraining",
13
+ "AutoModelForMultipleChoice": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForMultipleChoice",
14
+ "AutoModelForQuestionAnswering": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForQuestionAnswering",
15
+ "AutoModelForSequenceClassification": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForSequenceClassification",
16
+ "AutoModelForTokenClassification": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForTokenClassification"
17
+ },
18
+ "bos_token_id": null,
19
+ "causal": false,
20
+ "dense_seq_output": true,
21
+ "embd_pdrop": 0.1,
22
+ "eos_token_id": null,
23
+ "expert_choice_router": false,
24
+ "ffn_div": 1,
25
+ "fused_bias_fc": true,
26
+ "fused_dropout_add_ln": true,
27
+ "initializer_range": 0.02,
28
+ "layer_norm_epsilon": 1e-05,
29
+ "max_trained_positions": 2048,
30
+ "mlp_fc1_bias": true,
31
+ "mlp_fc2_bias": true,
32
+ "model_type": "nomic_bert",
33
+ "moe_every_n_layers": 2,
34
+ "moe_impl": "megablocks",
35
+ "moe_normalize_expert_weights": false,
36
+ "moe_resid_pdrop": 0.0,
37
+ "moe_top_k": 2,
38
+ "n_embd": 768,
39
+ "n_head": 12,
40
+ "n_inner": 3072,
41
+ "n_layer": 12,
42
+ "n_positions": 2048,
43
+ "num_experts": 8,
44
+ "num_shared_experts": 0,
45
+ "pad_token_id": 1,
46
+ "pad_vocab_size_multiple": 64,
47
+ "parallel_block": false,
48
+ "parallel_block_tied_norm": false,
49
+ "prenorm": false,
50
+ "qkv_proj_bias": true,
51
+ "reorder_and_upcast_attn": false,
52
+ "resid_pdrop": 0.0,
53
+ "rotary_emb_base": 10000,
54
+ "rotary_emb_fraction": 1.0,
55
+ "rotary_emb_interleaved": false,
56
+ "rotary_emb_scale_base": null,
57
+ "rotary_scaling_factor": null,
58
+ "router_aux_loss_coef": 0.1,
59
+ "scale_attn_by_inverse_layer_idx": false,
60
+ "scale_attn_weights": true,
61
+ "summary_activation": null,
62
+ "summary_first_dropout": 0.1,
63
+ "summary_proj_to_labels": true,
64
+ "summary_type": "cls_index",
65
+ "summary_use_proj": true,
66
+ "torch_dtype": "float32",
67
+ "transformers_version": "4.43.0",
68
+ "type_vocab_size": 1,
69
+ "use_cache": true,
70
+ "use_flash_attn": true,
71
+ "use_rms_norm": null,
72
+ "use_xentropy": true,
73
+ "vocab_size": 250048
74
+ }
checkpoint-1236/config_sentence_transformers.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.4.1",
4
+ "transformers": "4.43.0",
5
+ "pytorch": "2.6.0+cu124"
6
+ },
7
+ "prompts": {
8
+ "query": "search_query: ",
9
+ "passage": "search_document: ",
10
+ "Classification": "classification: ",
11
+ "MultilabelClassification": "classification: ",
12
+ "Clustering": "clustering: ",
13
+ "PairClassification": "classification: ",
14
+ "STS": "classification: ",
15
+ "Summarization": "classification: ",
16
+ "Speed": "search_document: "
17
+ },
18
+ "default_prompt_name": null,
19
+ "similarity_fn_name": "cosine"
20
+ }
checkpoint-1236/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:7e08adbc4d5c7264da0786a20312f6b903f7229aeae9c99bacbebcdac5b24f05
3
+ size 1901187232
checkpoint-1236/modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
checkpoint-1236/optimizer.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:13d33a137a5db9b7f005e581020e88eec934dfb2510068c409c489ed33e11b83
3
+ size 3802469370
checkpoint-1236/rng_state.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:9b0e1d032a013d53dc2c63c4eb5f302acdd2786edf5d1298a2fb4a5e749b59e8
3
+ size 14244
checkpoint-1236/scheduler.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:1c37a3c8ceb14f3b84bb5cd5c64fb18105452f6ec7dd141e7e1c42ed20c8c9b3
3
+ size 1064
checkpoint-1236/sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
checkpoint-1236/sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
checkpoint-1236/special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
checkpoint-1236/tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
3
+ size 17082987
checkpoint-1236/tokenizer_config.json ADDED
@@ -0,0 +1,54 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "mask_token": "<mask>",
49
+ "model_max_length": 512,
50
+ "pad_token": "<pad>",
51
+ "sep_token": "</s>",
52
+ "tokenizer_class": "XLMRobertaTokenizer",
53
+ "unk_token": "<unk>"
54
+ }
checkpoint-1236/trainer_state.json ADDED
@@ -0,0 +1,1143 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "best_metric": 0.2749254568568281,
3
+ "best_model_checkpoint": "Nomic/nomic-v2-tuned-1/checkpoint-1236",
4
+ "epoch": 2.9995449719399363,
5
+ "eval_steps": 500,
6
+ "global_step": 1236,
7
+ "is_hyper_param_search": false,
8
+ "is_local_process_zero": true,
9
+ "is_world_process_zero": true,
10
+ "log_history": [
11
+ {
12
+ "epoch": 0.024268163203397544,
13
+ "grad_norm": 6.184824466705322,
14
+ "learning_rate": 1.2121212121212122e-06,
15
+ "loss": 0.2108,
16
+ "step": 10
17
+ },
18
+ {
19
+ "epoch": 0.04853632640679509,
20
+ "grad_norm": 7.719327449798584,
21
+ "learning_rate": 2.4242424242424244e-06,
22
+ "loss": 0.1169,
23
+ "step": 20
24
+ },
25
+ {
26
+ "epoch": 0.07280448961019263,
27
+ "grad_norm": 4.0327959060668945,
28
+ "learning_rate": 3.6363636363636366e-06,
29
+ "loss": 0.1334,
30
+ "step": 30
31
+ },
32
+ {
33
+ "epoch": 0.09707265281359018,
34
+ "grad_norm": 5.168394088745117,
35
+ "learning_rate": 4.848484848484849e-06,
36
+ "loss": 0.0963,
37
+ "step": 40
38
+ },
39
+ {
40
+ "epoch": 0.12134081601698772,
41
+ "grad_norm": 14.108105659484863,
42
+ "learning_rate": 6.060606060606061e-06,
43
+ "loss": 0.127,
44
+ "step": 50
45
+ },
46
+ {
47
+ "epoch": 0.14560897922038527,
48
+ "grad_norm": 0.29993921518325806,
49
+ "learning_rate": 7.272727272727273e-06,
50
+ "loss": 0.1254,
51
+ "step": 60
52
+ },
53
+ {
54
+ "epoch": 0.1698771424237828,
55
+ "grad_norm": 1.5108305215835571,
56
+ "learning_rate": 8.484848484848486e-06,
57
+ "loss": 0.048,
58
+ "step": 70
59
+ },
60
+ {
61
+ "epoch": 0.19414530562718035,
62
+ "grad_norm": 2.570068836212158,
63
+ "learning_rate": 9.696969696969698e-06,
64
+ "loss": 0.0358,
65
+ "step": 80
66
+ },
67
+ {
68
+ "epoch": 0.21841346883057788,
69
+ "grad_norm": 13.097607612609863,
70
+ "learning_rate": 1.0909090909090909e-05,
71
+ "loss": 0.0673,
72
+ "step": 90
73
+ },
74
+ {
75
+ "epoch": 0.24268163203397544,
76
+ "grad_norm": 4.809088230133057,
77
+ "learning_rate": 1.2121212121212122e-05,
78
+ "loss": 0.049,
79
+ "step": 100
80
+ },
81
+ {
82
+ "epoch": 0.26694979523737294,
83
+ "grad_norm": 0.4637127220630646,
84
+ "learning_rate": 1.3333333333333333e-05,
85
+ "loss": 0.0222,
86
+ "step": 110
87
+ },
88
+ {
89
+ "epoch": 0.29121795844077053,
90
+ "grad_norm": 3.315945625305176,
91
+ "learning_rate": 1.4545454545454546e-05,
92
+ "loss": 0.0657,
93
+ "step": 120
94
+ },
95
+ {
96
+ "epoch": 0.31548612164416806,
97
+ "grad_norm": 1.816904067993164,
98
+ "learning_rate": 1.575757575757576e-05,
99
+ "loss": 0.0878,
100
+ "step": 130
101
+ },
102
+ {
103
+ "epoch": 0.3397542848475656,
104
+ "grad_norm": 0.5492209792137146,
105
+ "learning_rate": 1.6969696969696972e-05,
106
+ "loss": 0.0396,
107
+ "step": 140
108
+ },
109
+ {
110
+ "epoch": 0.3640224480509631,
111
+ "grad_norm": 0.6514124274253845,
112
+ "learning_rate": 1.8181818181818182e-05,
113
+ "loss": 0.033,
114
+ "step": 150
115
+ },
116
+ {
117
+ "epoch": 0.3882906112543607,
118
+ "grad_norm": 0.20525218546390533,
119
+ "learning_rate": 1.9393939393939395e-05,
120
+ "loss": 0.0562,
121
+ "step": 160
122
+ },
123
+ {
124
+ "epoch": 0.41255877445775824,
125
+ "grad_norm": 12.202320098876953,
126
+ "learning_rate": 1.999943905097692e-05,
127
+ "loss": 0.0329,
128
+ "step": 170
129
+ },
130
+ {
131
+ "epoch": 0.43682693766115577,
132
+ "grad_norm": 7.067898273468018,
133
+ "learning_rate": 1.9994951836381796e-05,
134
+ "loss": 0.0918,
135
+ "step": 180
136
+ },
137
+ {
138
+ "epoch": 0.4610951008645533,
139
+ "grad_norm": 0.13020876049995422,
140
+ "learning_rate": 1.998597942081397e-05,
141
+ "loss": 0.0198,
142
+ "step": 190
143
+ },
144
+ {
145
+ "epoch": 0.4853632640679509,
146
+ "grad_norm": 0.3073924779891968,
147
+ "learning_rate": 1.9972525830614725e-05,
148
+ "loss": 0.0181,
149
+ "step": 200
150
+ },
151
+ {
152
+ "epoch": 0.5096314272713484,
153
+ "grad_norm": 0.40409696102142334,
154
+ "learning_rate": 1.9954597103037342e-05,
155
+ "loss": 0.0119,
156
+ "step": 210
157
+ },
158
+ {
159
+ "epoch": 0.5338995904747459,
160
+ "grad_norm": 2.918846845626831,
161
+ "learning_rate": 1.9932201283537935e-05,
162
+ "loss": 0.0139,
163
+ "step": 220
164
+ },
165
+ {
166
+ "epoch": 0.5581677536781435,
167
+ "grad_norm": 8.526318550109863,
168
+ "learning_rate": 1.9905348422165075e-05,
169
+ "loss": 0.057,
170
+ "step": 230
171
+ },
172
+ {
173
+ "epoch": 0.5824359168815411,
174
+ "grad_norm": 10.81310749053955,
175
+ "learning_rate": 1.987405056904986e-05,
176
+ "loss": 0.0293,
177
+ "step": 240
178
+ },
179
+ {
180
+ "epoch": 0.6067040800849386,
181
+ "grad_norm": 0.8693222999572754,
182
+ "learning_rate": 1.9838321768998462e-05,
183
+ "loss": 0.0482,
184
+ "step": 250
185
+ },
186
+ {
187
+ "epoch": 0.6309722432883361,
188
+ "grad_norm": 5.930874347686768,
189
+ "learning_rate": 1.9798178055189563e-05,
190
+ "loss": 0.017,
191
+ "step": 260
192
+ },
193
+ {
194
+ "epoch": 0.6552404064917337,
195
+ "grad_norm": 4.582831859588623,
196
+ "learning_rate": 1.9753637441979533e-05,
197
+ "loss": 0.0927,
198
+ "step": 270
199
+ },
200
+ {
201
+ "epoch": 0.6795085696951312,
202
+ "grad_norm": 0.19732092320919037,
203
+ "learning_rate": 1.970471991681853e-05,
204
+ "loss": 0.0187,
205
+ "step": 280
206
+ },
207
+ {
208
+ "epoch": 0.7037767328985287,
209
+ "grad_norm": 0.7359830141067505,
210
+ "learning_rate": 1.9651447431281213e-05,
211
+ "loss": 0.0553,
212
+ "step": 290
213
+ },
214
+ {
215
+ "epoch": 0.7280448961019262,
216
+ "grad_norm": 0.4606100618839264,
217
+ "learning_rate": 1.9593843891216035e-05,
218
+ "loss": 0.015,
219
+ "step": 300
220
+ },
221
+ {
222
+ "epoch": 0.7523130593053239,
223
+ "grad_norm": 0.9894680380821228,
224
+ "learning_rate": 1.9531935146017595e-05,
225
+ "loss": 0.0438,
226
+ "step": 310
227
+ },
228
+ {
229
+ "epoch": 0.7765812225087214,
230
+ "grad_norm": 0.13739630579948425,
231
+ "learning_rate": 1.9465748977026782e-05,
232
+ "loss": 0.0087,
233
+ "step": 320
234
+ },
235
+ {
236
+ "epoch": 0.8008493857121189,
237
+ "grad_norm": 0.3315618336200714,
238
+ "learning_rate": 1.9395315085064007e-05,
239
+ "loss": 0.038,
240
+ "step": 330
241
+ },
242
+ {
243
+ "epoch": 0.8251175489155165,
244
+ "grad_norm": 0.17197982966899872,
245
+ "learning_rate": 1.9320665077101066e-05,
246
+ "loss": 0.0243,
247
+ "step": 340
248
+ },
249
+ {
250
+ "epoch": 0.849385712118914,
251
+ "grad_norm": 4.819814682006836,
252
+ "learning_rate": 1.92418324520776e-05,
253
+ "loss": 0.015,
254
+ "step": 350
255
+ },
256
+ {
257
+ "epoch": 0.8736538753223115,
258
+ "grad_norm": 4.6382365226745605,
259
+ "learning_rate": 1.9158852585868575e-05,
260
+ "loss": 0.0199,
261
+ "step": 360
262
+ },
263
+ {
264
+ "epoch": 0.8979220385257091,
265
+ "grad_norm": 0.15649013221263885,
266
+ "learning_rate": 1.9071762715409474e-05,
267
+ "loss": 0.0516,
268
+ "step": 370
269
+ },
270
+ {
271
+ "epoch": 0.9221902017291066,
272
+ "grad_norm": 9.212163925170898,
273
+ "learning_rate": 1.8980601921986332e-05,
274
+ "loss": 0.0561,
275
+ "step": 380
276
+ },
277
+ {
278
+ "epoch": 0.9464583649325041,
279
+ "grad_norm": 1.8409303426742554,
280
+ "learning_rate": 1.888541111369816e-05,
281
+ "loss": 0.0851,
282
+ "step": 390
283
+ },
284
+ {
285
+ "epoch": 0.9707265281359018,
286
+ "grad_norm": 0.0260617733001709,
287
+ "learning_rate": 1.878623300709957e-05,
288
+ "loss": 0.0394,
289
+ "step": 400
290
+ },
291
+ {
292
+ "epoch": 0.9949946913392993,
293
+ "grad_norm": 0.475887656211853,
294
+ "learning_rate": 1.8683112108031856e-05,
295
+ "loss": 0.0114,
296
+ "step": 410
297
+ },
298
+ {
299
+ "epoch": 0.9998483239799788,
300
+ "eval_dim_128_cosine_accuracy@1": 0.0034106412005457027,
301
+ "eval_dim_128_cosine_accuracy@10": 0.6609822646657572,
302
+ "eval_dim_128_cosine_accuracy@3": 0.06207366984993179,
303
+ "eval_dim_128_cosine_accuracy@5": 0.35129604365620737,
304
+ "eval_dim_128_cosine_map@100": 0.15352648780478836,
305
+ "eval_dim_128_cosine_mrr@10": 0.1384457762186259,
306
+ "eval_dim_128_cosine_ndcg@10": 0.25968761539611496,
307
+ "eval_dim_128_cosine_precision@1": 0.0034106412005457027,
308
+ "eval_dim_128_cosine_precision@10": 0.06609822646657572,
309
+ "eval_dim_128_cosine_precision@3": 0.020691223283310592,
310
+ "eval_dim_128_cosine_precision@5": 0.07025920873124147,
311
+ "eval_dim_128_cosine_recall@1": 0.0034106412005457027,
312
+ "eval_dim_128_cosine_recall@10": 0.6609822646657572,
313
+ "eval_dim_128_cosine_recall@3": 0.06207366984993179,
314
+ "eval_dim_128_cosine_recall@5": 0.35129604365620737,
315
+ "eval_dim_256_cosine_accuracy@1": 0.006139154160982265,
316
+ "eval_dim_256_cosine_accuracy@10": 0.6957708049113234,
317
+ "eval_dim_256_cosine_accuracy@3": 0.059345156889495224,
318
+ "eval_dim_256_cosine_accuracy@5": 0.3969986357435198,
319
+ "eval_dim_256_cosine_map@100": 0.1608969666312337,
320
+ "eval_dim_256_cosine_mrr@10": 0.14680563676129663,
321
+ "eval_dim_256_cosine_ndcg@10": 0.2742190784977125,
322
+ "eval_dim_256_cosine_precision@1": 0.006139154160982265,
323
+ "eval_dim_256_cosine_precision@10": 0.06957708049113233,
324
+ "eval_dim_256_cosine_precision@3": 0.019781718963165072,
325
+ "eval_dim_256_cosine_precision@5": 0.07939972714870396,
326
+ "eval_dim_256_cosine_recall@1": 0.006139154160982265,
327
+ "eval_dim_256_cosine_recall@10": 0.6957708049113234,
328
+ "eval_dim_256_cosine_recall@3": 0.059345156889495224,
329
+ "eval_dim_256_cosine_recall@5": 0.3969986357435198,
330
+ "eval_dim_512_cosine_accuracy@1": 0.004092769440654843,
331
+ "eval_dim_512_cosine_accuracy@10": 0.708731241473397,
332
+ "eval_dim_512_cosine_accuracy@3": 0.054570259208731244,
333
+ "eval_dim_512_cosine_accuracy@5": 0.4045020463847203,
334
+ "eval_dim_512_cosine_map@100": 0.16179009192949412,
335
+ "eval_dim_512_cosine_mrr@10": 0.14763068710885704,
336
+ "eval_dim_512_cosine_ndcg@10": 0.2778537691360626,
337
+ "eval_dim_512_cosine_precision@1": 0.004092769440654843,
338
+ "eval_dim_512_cosine_precision@10": 0.07087312414733969,
339
+ "eval_dim_512_cosine_precision@3": 0.01819008640291041,
340
+ "eval_dim_512_cosine_precision@5": 0.08090040927694407,
341
+ "eval_dim_512_cosine_recall@1": 0.004092769440654843,
342
+ "eval_dim_512_cosine_recall@10": 0.708731241473397,
343
+ "eval_dim_512_cosine_recall@3": 0.054570259208731244,
344
+ "eval_dim_512_cosine_recall@5": 0.4045020463847203,
345
+ "eval_dim_64_cosine_accuracy@1": 0.004092769440654843,
346
+ "eval_dim_64_cosine_accuracy@10": 0.5750341064120055,
347
+ "eval_dim_64_cosine_accuracy@3": 0.048431105047748974,
348
+ "eval_dim_64_cosine_accuracy@5": 0.3144611186903138,
349
+ "eval_dim_64_cosine_map@100": 0.1367884100889619,
350
+ "eval_dim_64_cosine_mrr@10": 0.11982692349336187,
351
+ "eval_dim_64_cosine_ndcg@10": 0.2252854715830182,
352
+ "eval_dim_64_cosine_precision@1": 0.004092769440654843,
353
+ "eval_dim_64_cosine_precision@10": 0.05750341064120054,
354
+ "eval_dim_64_cosine_precision@3": 0.01614370168258299,
355
+ "eval_dim_64_cosine_precision@5": 0.06289222373806276,
356
+ "eval_dim_64_cosine_recall@1": 0.004092769440654843,
357
+ "eval_dim_64_cosine_recall@10": 0.5750341064120055,
358
+ "eval_dim_64_cosine_recall@3": 0.048431105047748974,
359
+ "eval_dim_64_cosine_recall@5": 0.3144611186903138,
360
+ "eval_dim_768_cosine_accuracy@1": 0.002728512960436562,
361
+ "eval_dim_768_cosine_accuracy@10": 0.7175989085948158,
362
+ "eval_dim_768_cosine_accuracy@3": 0.059345156889495224,
363
+ "eval_dim_768_cosine_accuracy@5": 0.40109140518417463,
364
+ "eval_dim_768_cosine_map@100": 0.1621927494042191,
365
+ "eval_dim_768_cosine_mrr@10": 0.1485466878884321,
366
+ "eval_dim_768_cosine_ndcg@10": 0.2805856733257871,
367
+ "eval_dim_768_cosine_precision@1": 0.002728512960436562,
368
+ "eval_dim_768_cosine_precision@10": 0.07175989085948158,
369
+ "eval_dim_768_cosine_precision@3": 0.019781718963165072,
370
+ "eval_dim_768_cosine_precision@5": 0.08021828103683493,
371
+ "eval_dim_768_cosine_recall@1": 0.002728512960436562,
372
+ "eval_dim_768_cosine_recall@10": 0.7175989085948158,
373
+ "eval_dim_768_cosine_recall@3": 0.059345156889495224,
374
+ "eval_dim_768_cosine_recall@5": 0.40109140518417463,
375
+ "eval_runtime": 311.6214,
376
+ "eval_samples_per_second": 0.0,
377
+ "eval_sequential_score": 0.2252854715830182,
378
+ "eval_steps_per_second": 0.0,
379
+ "step": 412
380
+ },
381
+ {
382
+ "epoch": 1.0192628545426967,
383
+ "grad_norm": 0.07392042130231857,
384
+ "learning_rate": 1.8576094691651153e-05,
385
+ "loss": 0.0136,
386
+ "step": 420
387
+ },
388
+ {
389
+ "epoch": 1.0435310177460944,
390
+ "grad_norm": 3.5508384704589844,
391
+ "learning_rate": 1.8465228781662618e-05,
392
+ "loss": 0.1219,
393
+ "step": 430
394
+ },
395
+ {
396
+ "epoch": 1.0677991809494918,
397
+ "grad_norm": 5.711903095245361,
398
+ "learning_rate": 1.8350564128769955e-05,
399
+ "loss": 0.0164,
400
+ "step": 440
401
+ },
402
+ {
403
+ "epoch": 1.0920673441528894,
404
+ "grad_norm": 1.1452428102493286,
405
+ "learning_rate": 1.8232152188349946e-05,
406
+ "loss": 0.0927,
407
+ "step": 450
408
+ },
409
+ {
410
+ "epoch": 1.116335507356287,
411
+ "grad_norm": 1.4943727254867554,
412
+ "learning_rate": 1.8110046097362033e-05,
413
+ "loss": 0.0268,
414
+ "step": 460
415
+ },
416
+ {
417
+ "epoch": 1.1406036705596845,
418
+ "grad_norm": 1.8914352655410767,
419
+ "learning_rate": 1.7984300650503282e-05,
420
+ "loss": 0.0384,
421
+ "step": 470
422
+ },
423
+ {
424
+ "epoch": 1.1648718337630821,
425
+ "grad_norm": 0.11347553879022598,
426
+ "learning_rate": 1.7854972275619453e-05,
427
+ "loss": 0.0034,
428
+ "step": 480
429
+ },
430
+ {
431
+ "epoch": 1.1891399969664795,
432
+ "grad_norm": 8.961676597595215,
433
+ "learning_rate": 1.772211900838318e-05,
434
+ "loss": 0.0183,
435
+ "step": 490
436
+ },
437
+ {
438
+ "epoch": 1.2134081601698772,
439
+ "grad_norm": 21.69032096862793,
440
+ "learning_rate": 1.758580046625068e-05,
441
+ "loss": 0.0594,
442
+ "step": 500
443
+ },
444
+ {
445
+ "epoch": 1.2376763233732746,
446
+ "grad_norm": 3.1777877807617188,
447
+ "learning_rate": 1.7446077821708596e-05,
448
+ "loss": 0.0145,
449
+ "step": 510
450
+ },
451
+ {
452
+ "epoch": 1.2619444865766722,
453
+ "grad_norm": 1.400813102722168,
454
+ "learning_rate": 1.730301377482307e-05,
455
+ "loss": 0.0768,
456
+ "step": 520
457
+ },
458
+ {
459
+ "epoch": 1.2862126497800697,
460
+ "grad_norm": 0.12172400206327438,
461
+ "learning_rate": 1.715667252510329e-05,
462
+ "loss": 0.0084,
463
+ "step": 530
464
+ },
465
+ {
466
+ "epoch": 1.3104808129834673,
467
+ "grad_norm": 0.021951694041490555,
468
+ "learning_rate": 1.700711974269218e-05,
469
+ "loss": 0.0528,
470
+ "step": 540
471
+ },
472
+ {
473
+ "epoch": 1.334748976186865,
474
+ "grad_norm": 0.030643614009022713,
475
+ "learning_rate": 1.6854422538897136e-05,
476
+ "loss": 0.0619,
477
+ "step": 550
478
+ },
479
+ {
480
+ "epoch": 1.3590171393902624,
481
+ "grad_norm": 4.491604804992676,
482
+ "learning_rate": 1.6698649436074063e-05,
483
+ "loss": 0.0326,
484
+ "step": 560
485
+ },
486
+ {
487
+ "epoch": 1.38328530259366,
488
+ "grad_norm": 0.42146193981170654,
489
+ "learning_rate": 1.65398703368782e-05,
490
+ "loss": 0.0135,
491
+ "step": 570
492
+ },
493
+ {
494
+ "epoch": 1.4075534657970574,
495
+ "grad_norm": 0.09300685673952103,
496
+ "learning_rate": 1.6378156492895524e-05,
497
+ "loss": 0.0143,
498
+ "step": 580
499
+ },
500
+ {
501
+ "epoch": 1.431821629000455,
502
+ "grad_norm": 2.0742526054382324,
503
+ "learning_rate": 1.6213580472668856e-05,
504
+ "loss": 0.0952,
505
+ "step": 590
506
+ },
507
+ {
508
+ "epoch": 1.4560897922038527,
509
+ "grad_norm": 2.740499973297119,
510
+ "learning_rate": 1.604621612913297e-05,
511
+ "loss": 0.0188,
512
+ "step": 600
513
+ },
514
+ {
515
+ "epoch": 1.4803579554072501,
516
+ "grad_norm": 0.09577389806509018,
517
+ "learning_rate": 1.5876138566473327e-05,
518
+ "loss": 0.01,
519
+ "step": 610
520
+ },
521
+ {
522
+ "epoch": 1.5046261186106475,
523
+ "grad_norm": 1.9737666845321655,
524
+ "learning_rate": 1.5703424106423335e-05,
525
+ "loss": 0.091,
526
+ "step": 620
527
+ },
528
+ {
529
+ "epoch": 1.5288942818140452,
530
+ "grad_norm": 0.018516847863793373,
531
+ "learning_rate": 1.5528150254015225e-05,
532
+ "loss": 0.0205,
533
+ "step": 630
534
+ },
535
+ {
536
+ "epoch": 1.5531624450174428,
537
+ "grad_norm": 0.0974857360124588,
538
+ "learning_rate": 1.5350395662799925e-05,
539
+ "loss": 0.0156,
540
+ "step": 640
541
+ },
542
+ {
543
+ "epoch": 1.5774306082208402,
544
+ "grad_norm": 1.012096881866455,
545
+ "learning_rate": 1.5170240099551547e-05,
546
+ "loss": 0.0101,
547
+ "step": 650
548
+ },
549
+ {
550
+ "epoch": 1.6016987714242377,
551
+ "grad_norm": 0.4372600317001343,
552
+ "learning_rate": 1.4987764408472327e-05,
553
+ "loss": 0.022,
554
+ "step": 660
555
+ },
556
+ {
557
+ "epoch": 1.6259669346276353,
558
+ "grad_norm": 1.3607388734817505,
559
+ "learning_rate": 1.4803050474914034e-05,
560
+ "loss": 0.0135,
561
+ "step": 670
562
+ },
563
+ {
564
+ "epoch": 1.650235097831033,
565
+ "grad_norm": 0.1327061802148819,
566
+ "learning_rate": 1.4616181188632229e-05,
567
+ "loss": 0.0226,
568
+ "step": 680
569
+ },
570
+ {
571
+ "epoch": 1.6745032610344306,
572
+ "grad_norm": 0.31588563323020935,
573
+ "learning_rate": 1.4427240406589727e-05,
574
+ "loss": 0.0032,
575
+ "step": 690
576
+ },
577
+ {
578
+ "epoch": 1.698771424237828,
579
+ "grad_norm": 1.2134084701538086,
580
+ "learning_rate": 1.4236312915326108e-05,
581
+ "loss": 0.0071,
582
+ "step": 700
583
+ },
584
+ {
585
+ "epoch": 1.7230395874412254,
586
+ "grad_norm": 0.06816510111093521,
587
+ "learning_rate": 1.4043484392910014e-05,
588
+ "loss": 0.028,
589
+ "step": 710
590
+ },
591
+ {
592
+ "epoch": 1.747307750644623,
593
+ "grad_norm": 0.3962950110435486,
594
+ "learning_rate": 1.3848841370491416e-05,
595
+ "loss": 0.0351,
596
+ "step": 720
597
+ },
598
+ {
599
+ "epoch": 1.7715759138480207,
600
+ "grad_norm": 0.06974906474351883,
601
+ "learning_rate": 1.3652471193471049e-05,
602
+ "loss": 0.0021,
603
+ "step": 730
604
+ },
605
+ {
606
+ "epoch": 1.7958440770514181,
607
+ "grad_norm": 0.08050140738487244,
608
+ "learning_rate": 1.345446198230446e-05,
609
+ "loss": 0.0073,
610
+ "step": 740
611
+ },
612
+ {
613
+ "epoch": 1.8201122402548155,
614
+ "grad_norm": 0.04942511394619942,
615
+ "learning_rate": 1.3254902592958242e-05,
616
+ "loss": 0.0103,
617
+ "step": 750
618
+ },
619
+ {
620
+ "epoch": 1.8443804034582132,
621
+ "grad_norm": 0.17193569242954254,
622
+ "learning_rate": 1.3053882577036236e-05,
623
+ "loss": 0.0219,
624
+ "step": 760
625
+ },
626
+ {
627
+ "epoch": 1.8686485666616108,
628
+ "grad_norm": 0.011188509874045849,
629
+ "learning_rate": 1.2851492141593531e-05,
630
+ "loss": 0.0035,
631
+ "step": 770
632
+ },
633
+ {
634
+ "epoch": 1.8929167298650085,
635
+ "grad_norm": 21.107633590698242,
636
+ "learning_rate": 1.264782210865637e-05,
637
+ "loss": 0.0579,
638
+ "step": 780
639
+ },
640
+ {
641
+ "epoch": 1.917184893068406,
642
+ "grad_norm": 0.6288430690765381,
643
+ "learning_rate": 1.2442963874466044e-05,
644
+ "loss": 0.0298,
645
+ "step": 790
646
+ },
647
+ {
648
+ "epoch": 1.9414530562718033,
649
+ "grad_norm": 0.9807838201522827,
650
+ "learning_rate": 1.2237009368465171e-05,
651
+ "loss": 0.0076,
652
+ "step": 800
653
+ },
654
+ {
655
+ "epoch": 1.965721219475201,
656
+ "grad_norm": 0.4862402379512787,
657
+ "learning_rate": 1.2030051012044644e-05,
658
+ "loss": 0.0038,
659
+ "step": 810
660
+ },
661
+ {
662
+ "epoch": 1.9899893826785986,
663
+ "grad_norm": 0.32241472601890564,
664
+ "learning_rate": 1.1822181677069855e-05,
665
+ "loss": 0.0016,
666
+ "step": 820
667
+ },
668
+ {
669
+ "epoch": 1.9996966479599574,
670
+ "eval_dim_128_cosine_accuracy@1": 0.007503410641200546,
671
+ "eval_dim_128_cosine_accuracy@10": 0.665075034106412,
672
+ "eval_dim_128_cosine_accuracy@3": 0.06070941336971351,
673
+ "eval_dim_128_cosine_accuracy@5": 0.37312414733969984,
674
+ "eval_dim_128_cosine_map@100": 0.15984371570467878,
675
+ "eval_dim_128_cosine_mrr@10": 0.1428284501613273,
676
+ "eval_dim_128_cosine_ndcg@10": 0.2641617300886433,
677
+ "eval_dim_128_cosine_precision@1": 0.007503410641200546,
678
+ "eval_dim_128_cosine_precision@10": 0.0665075034106412,
679
+ "eval_dim_128_cosine_precision@3": 0.020236471123237832,
680
+ "eval_dim_128_cosine_precision@5": 0.07462482946793998,
681
+ "eval_dim_128_cosine_recall@1": 0.007503410641200546,
682
+ "eval_dim_128_cosine_recall@10": 0.665075034106412,
683
+ "eval_dim_128_cosine_recall@3": 0.06070941336971351,
684
+ "eval_dim_128_cosine_recall@5": 0.37312414733969984,
685
+ "eval_dim_256_cosine_accuracy@1": 0.009549795361527967,
686
+ "eval_dim_256_cosine_accuracy@10": 0.713506139154161,
687
+ "eval_dim_256_cosine_accuracy@3": 0.0723055934515689,
688
+ "eval_dim_256_cosine_accuracy@5": 0.4106412005457026,
689
+ "eval_dim_256_cosine_map@100": 0.17096884521775468,
690
+ "eval_dim_256_cosine_mrr@10": 0.1559981268541958,
691
+ "eval_dim_256_cosine_ndcg@10": 0.28559481472300186,
692
+ "eval_dim_256_cosine_precision@1": 0.009549795361527967,
693
+ "eval_dim_256_cosine_precision@10": 0.07135061391541608,
694
+ "eval_dim_256_cosine_precision@3": 0.024101864483856296,
695
+ "eval_dim_256_cosine_precision@5": 0.08212824010914052,
696
+ "eval_dim_256_cosine_recall@1": 0.009549795361527967,
697
+ "eval_dim_256_cosine_recall@10": 0.713506139154161,
698
+ "eval_dim_256_cosine_recall@3": 0.0723055934515689,
699
+ "eval_dim_256_cosine_recall@5": 0.4106412005457026,
700
+ "eval_dim_512_cosine_accuracy@1": 0.007503410641200546,
701
+ "eval_dim_512_cosine_accuracy@10": 0.7285129604365621,
702
+ "eval_dim_512_cosine_accuracy@3": 0.0688949522510232,
703
+ "eval_dim_512_cosine_accuracy@5": 0.40654843110504774,
704
+ "eval_dim_512_cosine_map@100": 0.1702634278904753,
705
+ "eval_dim_512_cosine_mrr@10": 0.15564731804499674,
706
+ "eval_dim_512_cosine_ndcg@10": 0.28864373602538085,
707
+ "eval_dim_512_cosine_precision@1": 0.007503410641200546,
708
+ "eval_dim_512_cosine_precision@10": 0.0728512960436562,
709
+ "eval_dim_512_cosine_precision@3": 0.022964984083674395,
710
+ "eval_dim_512_cosine_precision@5": 0.08130968622100954,
711
+ "eval_dim_512_cosine_recall@1": 0.007503410641200546,
712
+ "eval_dim_512_cosine_recall@10": 0.7285129604365621,
713
+ "eval_dim_512_cosine_recall@3": 0.0688949522510232,
714
+ "eval_dim_512_cosine_recall@5": 0.40654843110504774,
715
+ "eval_dim_64_cosine_accuracy@1": 0.0047748976807639835,
716
+ "eval_dim_64_cosine_accuracy@10": 0.6125511596180082,
717
+ "eval_dim_64_cosine_accuracy@3": 0.05798090040927694,
718
+ "eval_dim_64_cosine_accuracy@5": 0.33901773533424284,
719
+ "eval_dim_64_cosine_map@100": 0.14541967837644934,
720
+ "eval_dim_64_cosine_mrr@10": 0.12895282487710774,
721
+ "eval_dim_64_cosine_ndcg@10": 0.24113965638184232,
722
+ "eval_dim_64_cosine_precision@1": 0.0047748976807639835,
723
+ "eval_dim_64_cosine_precision@10": 0.06125511596180082,
724
+ "eval_dim_64_cosine_precision@3": 0.019326966803092312,
725
+ "eval_dim_64_cosine_precision@5": 0.06780354706684857,
726
+ "eval_dim_64_cosine_recall@1": 0.0047748976807639835,
727
+ "eval_dim_64_cosine_recall@10": 0.6125511596180082,
728
+ "eval_dim_64_cosine_recall@3": 0.05798090040927694,
729
+ "eval_dim_64_cosine_recall@5": 0.33901773533424284,
730
+ "eval_dim_768_cosine_accuracy@1": 0.008867667121418827,
731
+ "eval_dim_768_cosine_accuracy@10": 0.742837653478854,
732
+ "eval_dim_768_cosine_accuracy@3": 0.07025920873124147,
733
+ "eval_dim_768_cosine_accuracy@5": 0.40313778990450205,
734
+ "eval_dim_768_cosine_map@100": 0.17294783798650806,
735
+ "eval_dim_768_cosine_mrr@10": 0.15909747937373914,
736
+ "eval_dim_768_cosine_ndcg@10": 0.29453813752341906,
737
+ "eval_dim_768_cosine_precision@1": 0.008867667121418827,
738
+ "eval_dim_768_cosine_precision@10": 0.0742837653478854,
739
+ "eval_dim_768_cosine_precision@3": 0.023419736243747154,
740
+ "eval_dim_768_cosine_precision@5": 0.08062755798090042,
741
+ "eval_dim_768_cosine_recall@1": 0.008867667121418827,
742
+ "eval_dim_768_cosine_recall@10": 0.742837653478854,
743
+ "eval_dim_768_cosine_recall@3": 0.07025920873124147,
744
+ "eval_dim_768_cosine_recall@5": 0.40313778990450205,
745
+ "eval_runtime": 312.3268,
746
+ "eval_samples_per_second": 0.0,
747
+ "eval_sequential_score": 0.24113965638184232,
748
+ "eval_steps_per_second": 0.0,
749
+ "step": 824
750
+ },
751
+ {
752
+ "epoch": 2.0142575458819962,
753
+ "grad_norm": 0.6989903450012207,
754
+ "learning_rate": 1.1613494644204755e-05,
755
+ "loss": 0.0715,
756
+ "step": 830
757
+ },
758
+ {
759
+ "epoch": 2.0385257090853934,
760
+ "grad_norm": 0.031900301575660706,
761
+ "learning_rate": 1.1404083561052454e-05,
762
+ "loss": 0.0021,
763
+ "step": 840
764
+ },
765
+ {
766
+ "epoch": 2.062793872288791,
767
+ "grad_norm": 0.8742988109588623,
768
+ "learning_rate": 1.1194042400131213e-05,
769
+ "loss": 0.0065,
770
+ "step": 850
771
+ },
772
+ {
773
+ "epoch": 2.0870620354921887,
774
+ "grad_norm": 1.0062671899795532,
775
+ "learning_rate": 1.098346541670455e-05,
776
+ "loss": 0.0105,
777
+ "step": 860
778
+ },
779
+ {
780
+ "epoch": 2.1113301986955864,
781
+ "grad_norm": 0.1330879032611847,
782
+ "learning_rate": 1.0772447106484544e-05,
783
+ "loss": 0.0024,
784
+ "step": 870
785
+ },
786
+ {
787
+ "epoch": 2.1355983618989836,
788
+ "grad_norm": 1.5431034564971924,
789
+ "learning_rate": 1.0561082163227173e-05,
790
+ "loss": 0.0025,
791
+ "step": 880
792
+ },
793
+ {
794
+ "epoch": 2.159866525102381,
795
+ "grad_norm": 0.20452944934368134,
796
+ "learning_rate": 1.0349465436238826e-05,
797
+ "loss": 0.014,
798
+ "step": 890
799
+ },
800
+ {
801
+ "epoch": 2.184134688305779,
802
+ "grad_norm": 3.1080780029296875,
803
+ "learning_rate": 1.0137691887812994e-05,
804
+ "loss": 0.0016,
805
+ "step": 900
806
+ },
807
+ {
808
+ "epoch": 2.2084028515091765,
809
+ "grad_norm": 1.0478427410125732,
810
+ "learning_rate": 9.925856550616272e-06,
811
+ "loss": 0.008,
812
+ "step": 910
813
+ },
814
+ {
815
+ "epoch": 2.232671014712574,
816
+ "grad_norm": 0.037069372832775116,
817
+ "learning_rate": 9.714054485042734e-06,
818
+ "loss": 0.0041,
819
+ "step": 920
820
+ },
821
+ {
822
+ "epoch": 2.2569391779159713,
823
+ "grad_norm": 0.2362644523382187,
824
+ "learning_rate": 9.502380736555945e-06,
825
+ "loss": 0.0308,
826
+ "step": 930
827
+ },
828
+ {
829
+ "epoch": 2.281207341119369,
830
+ "grad_norm": 3.4790825843811035,
831
+ "learning_rate": 9.290930293037599e-06,
832
+ "loss": 0.011,
833
+ "step": 940
834
+ },
835
+ {
836
+ "epoch": 2.3054755043227666,
837
+ "grad_norm": 0.30720242857933044,
838
+ "learning_rate": 9.079798042162046e-06,
839
+ "loss": 0.0207,
840
+ "step": 950
841
+ },
842
+ {
843
+ "epoch": 2.3297436675261642,
844
+ "grad_norm": 0.33387142419815063,
845
+ "learning_rate": 8.86907872881575e-06,
846
+ "loss": 0.0048,
847
+ "step": 960
848
+ },
849
+ {
850
+ "epoch": 2.3540118307295614,
851
+ "grad_norm": 0.01000495720654726,
852
+ "learning_rate": 8.658866912580852e-06,
853
+ "loss": 0.0215,
854
+ "step": 970
855
+ },
856
+ {
857
+ "epoch": 2.378279993932959,
858
+ "grad_norm": 0.8057634234428406,
859
+ "learning_rate": 8.449256925301883e-06,
860
+ "loss": 0.0061,
861
+ "step": 980
862
+ },
863
+ {
864
+ "epoch": 2.4025481571363567,
865
+ "grad_norm": 3.0753707885742188,
866
+ "learning_rate": 8.24034282875464e-06,
867
+ "loss": 0.0164,
868
+ "step": 990
869
+ },
870
+ {
871
+ "epoch": 2.4268163203397544,
872
+ "grad_norm": 1.1145414113998413,
873
+ "learning_rate": 8.032218372436314e-06,
874
+ "loss": 0.0255,
875
+ "step": 1000
876
+ },
877
+ {
878
+ "epoch": 2.451084483543152,
879
+ "grad_norm": 0.014523504301905632,
880
+ "learning_rate": 7.824976951495696e-06,
881
+ "loss": 0.0062,
882
+ "step": 1010
883
+ },
884
+ {
885
+ "epoch": 2.475352646746549,
886
+ "grad_norm": 0.09692133218050003,
887
+ "learning_rate": 7.618711564822419e-06,
888
+ "loss": 0.0079,
889
+ "step": 1020
890
+ },
891
+ {
892
+ "epoch": 2.499620809949947,
893
+ "grad_norm": 0.9156332015991211,
894
+ "learning_rate": 7.413514773314043e-06,
895
+ "loss": 0.005,
896
+ "step": 1030
897
+ },
898
+ {
899
+ "epoch": 2.5238889731533445,
900
+ "grad_norm": 0.18534983694553375,
901
+ "learning_rate": 7.209478658339626e-06,
902
+ "loss": 0.042,
903
+ "step": 1040
904
+ },
905
+ {
906
+ "epoch": 2.548157136356742,
907
+ "grad_norm": 0.10605430603027344,
908
+ "learning_rate": 7.006694780418558e-06,
909
+ "loss": 0.0057,
910
+ "step": 1050
911
+ },
912
+ {
913
+ "epoch": 2.5724252995601393,
914
+ "grad_norm": 0.0882348120212555,
915
+ "learning_rate": 6.805254138133061e-06,
916
+ "loss": 0.0384,
917
+ "step": 1060
918
+ },
919
+ {
920
+ "epoch": 2.596693462763537,
921
+ "grad_norm": 0.7285648584365845,
922
+ "learning_rate": 6.605247127292887e-06,
923
+ "loss": 0.009,
924
+ "step": 1070
925
+ },
926
+ {
927
+ "epoch": 2.6209616259669346,
928
+ "grad_norm": 0.013403256423771381,
929
+ "learning_rate": 6.406763500370515e-06,
930
+ "loss": 0.0089,
931
+ "step": 1080
932
+ },
933
+ {
934
+ "epoch": 2.6452297891703322,
935
+ "grad_norm": 0.07016568630933762,
936
+ "learning_rate": 6.2098923262250075e-06,
937
+ "loss": 0.0034,
938
+ "step": 1090
939
+ },
940
+ {
941
+ "epoch": 2.66949795237373,
942
+ "grad_norm": 16.01243782043457,
943
+ "learning_rate": 6.014721950132694e-06,
944
+ "loss": 0.026,
945
+ "step": 1100
946
+ },
947
+ {
948
+ "epoch": 2.6937661155771275,
949
+ "grad_norm": 16.028738021850586,
950
+ "learning_rate": 5.821339954142486e-06,
951
+ "loss": 0.0358,
952
+ "step": 1110
953
+ },
954
+ {
955
+ "epoch": 2.7180342787805247,
956
+ "grad_norm": 0.19954819977283478,
957
+ "learning_rate": 5.629833117773755e-06,
958
+ "loss": 0.0033,
959
+ "step": 1120
960
+ },
961
+ {
962
+ "epoch": 2.7423024419839224,
963
+ "grad_norm": 0.07437506318092346,
964
+ "learning_rate": 5.440287379074321e-06,
965
+ "loss": 0.0037,
966
+ "step": 1130
967
+ },
968
+ {
969
+ "epoch": 2.76657060518732,
970
+ "grad_norm": 0.047555409371852875,
971
+ "learning_rate": 5.252787796056005e-06,
972
+ "loss": 0.0195,
973
+ "step": 1140
974
+ },
975
+ {
976
+ "epoch": 2.790838768390717,
977
+ "grad_norm": 0.12791568040847778,
978
+ "learning_rate": 5.067418508525181e-06,
979
+ "loss": 0.0024,
980
+ "step": 1150
981
+ },
982
+ {
983
+ "epoch": 2.815106931594115,
984
+ "grad_norm": 1.663771629333496,
985
+ "learning_rate": 4.884262700325282e-06,
986
+ "loss": 0.0533,
987
+ "step": 1160
988
+ },
989
+ {
990
+ "epoch": 2.8393750947975125,
991
+ "grad_norm": 0.5862261056900024,
992
+ "learning_rate": 4.703402562008355e-06,
993
+ "loss": 0.0137,
994
+ "step": 1170
995
+ },
996
+ {
997
+ "epoch": 2.86364325800091,
998
+ "grad_norm": 0.08700157701969147,
999
+ "learning_rate": 4.52491925395232e-06,
1000
+ "loss": 0.0125,
1001
+ "step": 1180
1002
+ },
1003
+ {
1004
+ "epoch": 2.8879114212043078,
1005
+ "grad_norm": 0.02824460342526436,
1006
+ "learning_rate": 4.3488928699405135e-06,
1007
+ "loss": 0.0253,
1008
+ "step": 1190
1009
+ },
1010
+ {
1011
+ "epoch": 2.9121795844077054,
1012
+ "grad_norm": 0.005378555506467819,
1013
+ "learning_rate": 4.175402401219894e-06,
1014
+ "loss": 0.0068,
1015
+ "step": 1200
1016
+ },
1017
+ {
1018
+ "epoch": 2.9364477476111026,
1019
+ "grad_norm": 0.2840709984302521,
1020
+ "learning_rate": 4.004525701053964e-06,
1021
+ "loss": 0.0436,
1022
+ "step": 1210
1023
+ },
1024
+ {
1025
+ "epoch": 2.9607159108145003,
1026
+ "grad_norm": 0.3918948769569397,
1027
+ "learning_rate": 3.836339449786396e-06,
1028
+ "loss": 0.0021,
1029
+ "step": 1220
1030
+ },
1031
+ {
1032
+ "epoch": 2.984984074017898,
1033
+ "grad_norm": 1.3828555345535278,
1034
+ "learning_rate": 3.6709191204309845e-06,
1035
+ "loss": 0.0129,
1036
+ "step": 1230
1037
+ },
1038
+ {
1039
+ "epoch": 2.9995449719399363,
1040
+ "eval_dim_128_cosine_accuracy@1": 0.008185538881309686,
1041
+ "eval_dim_128_cosine_accuracy@10": 0.694406548431105,
1042
+ "eval_dim_128_cosine_accuracy@3": 0.05798090040927694,
1043
+ "eval_dim_128_cosine_accuracy@5": 0.3860845839017735,
1044
+ "eval_dim_128_cosine_map@100": 0.16363198200379098,
1045
+ "eval_dim_128_cosine_mrr@10": 0.14819208947789936,
1046
+ "eval_dim_128_cosine_ndcg@10": 0.2749254568568281,
1047
+ "eval_dim_128_cosine_precision@1": 0.008185538881309686,
1048
+ "eval_dim_128_cosine_precision@10": 0.06944065484311049,
1049
+ "eval_dim_128_cosine_precision@3": 0.019326966803092312,
1050
+ "eval_dim_128_cosine_precision@5": 0.07721691678035471,
1051
+ "eval_dim_128_cosine_recall@1": 0.008185538881309686,
1052
+ "eval_dim_128_cosine_recall@10": 0.694406548431105,
1053
+ "eval_dim_128_cosine_recall@3": 0.05798090040927694,
1054
+ "eval_dim_128_cosine_recall@5": 0.3860845839017735,
1055
+ "eval_dim_256_cosine_accuracy@1": 0.0034106412005457027,
1056
+ "eval_dim_256_cosine_accuracy@10": 0.7223738062755798,
1057
+ "eval_dim_256_cosine_accuracy@3": 0.06616643929058663,
1058
+ "eval_dim_256_cosine_accuracy@5": 0.417462482946794,
1059
+ "eval_dim_256_cosine_map@100": 0.1659963653118235,
1060
+ "eval_dim_256_cosine_mrr@10": 0.15151719396262187,
1061
+ "eval_dim_256_cosine_ndcg@10": 0.2841815053560014,
1062
+ "eval_dim_256_cosine_precision@1": 0.0034106412005457027,
1063
+ "eval_dim_256_cosine_precision@10": 0.07223738062755797,
1064
+ "eval_dim_256_cosine_precision@3": 0.022055479763528875,
1065
+ "eval_dim_256_cosine_precision@5": 0.08349249658935878,
1066
+ "eval_dim_256_cosine_recall@1": 0.0034106412005457027,
1067
+ "eval_dim_256_cosine_recall@10": 0.7223738062755798,
1068
+ "eval_dim_256_cosine_recall@3": 0.06616643929058663,
1069
+ "eval_dim_256_cosine_recall@5": 0.417462482946794,
1070
+ "eval_dim_512_cosine_accuracy@1": 0.0068212824010914054,
1071
+ "eval_dim_512_cosine_accuracy@10": 0.7503410641200545,
1072
+ "eval_dim_512_cosine_accuracy@3": 0.06753069577080491,
1073
+ "eval_dim_512_cosine_accuracy@5": 0.41609822646657574,
1074
+ "eval_dim_512_cosine_map@100": 0.17102359712258386,
1075
+ "eval_dim_512_cosine_mrr@10": 0.15798631412546613,
1076
+ "eval_dim_512_cosine_ndcg@10": 0.29545256337366416,
1077
+ "eval_dim_512_cosine_precision@1": 0.0068212824010914054,
1078
+ "eval_dim_512_cosine_precision@10": 0.07503410641200545,
1079
+ "eval_dim_512_cosine_precision@3": 0.022510231923601638,
1080
+ "eval_dim_512_cosine_precision@5": 0.08321964529331514,
1081
+ "eval_dim_512_cosine_recall@1": 0.0068212824010914054,
1082
+ "eval_dim_512_cosine_recall@10": 0.7503410641200545,
1083
+ "eval_dim_512_cosine_recall@3": 0.06753069577080491,
1084
+ "eval_dim_512_cosine_recall@5": 0.41609822646657574,
1085
+ "eval_dim_64_cosine_accuracy@1": 0.0068212824010914054,
1086
+ "eval_dim_64_cosine_accuracy@10": 0.6323328785811733,
1087
+ "eval_dim_64_cosine_accuracy@3": 0.06684856753069578,
1088
+ "eval_dim_64_cosine_accuracy@5": 0.36221009549795363,
1089
+ "eval_dim_64_cosine_map@100": 0.15255646759369407,
1090
+ "eval_dim_64_cosine_mrr@10": 0.13584827519002,
1091
+ "eval_dim_64_cosine_ndcg@10": 0.25115836351492093,
1092
+ "eval_dim_64_cosine_precision@1": 0.0068212824010914054,
1093
+ "eval_dim_64_cosine_precision@10": 0.06323328785811731,
1094
+ "eval_dim_64_cosine_precision@3": 0.022282855843565257,
1095
+ "eval_dim_64_cosine_precision@5": 0.07244201909959072,
1096
+ "eval_dim_64_cosine_recall@1": 0.0068212824010914054,
1097
+ "eval_dim_64_cosine_recall@10": 0.6323328785811733,
1098
+ "eval_dim_64_cosine_recall@3": 0.06684856753069578,
1099
+ "eval_dim_64_cosine_recall@5": 0.36221009549795363,
1100
+ "eval_dim_768_cosine_accuracy@1": 0.004092769440654843,
1101
+ "eval_dim_768_cosine_accuracy@10": 0.7612551159618008,
1102
+ "eval_dim_768_cosine_accuracy@3": 0.06412005457025921,
1103
+ "eval_dim_768_cosine_accuracy@5": 0.4208731241473397,
1104
+ "eval_dim_768_cosine_map@100": 0.1714890252442529,
1105
+ "eval_dim_768_cosine_mrr@10": 0.15883599688169725,
1106
+ "eval_dim_768_cosine_ndcg@10": 0.2986249242161157,
1107
+ "eval_dim_768_cosine_precision@1": 0.004092769440654843,
1108
+ "eval_dim_768_cosine_precision@10": 0.07612551159618008,
1109
+ "eval_dim_768_cosine_precision@3": 0.021373351523419733,
1110
+ "eval_dim_768_cosine_precision@5": 0.08417462482946794,
1111
+ "eval_dim_768_cosine_recall@1": 0.004092769440654843,
1112
+ "eval_dim_768_cosine_recall@10": 0.7612551159618008,
1113
+ "eval_dim_768_cosine_recall@3": 0.06412005457025921,
1114
+ "eval_dim_768_cosine_recall@5": 0.4208731241473397,
1115
+ "eval_runtime": 311.0822,
1116
+ "eval_samples_per_second": 0.0,
1117
+ "eval_sequential_score": 0.25115836351492093,
1118
+ "eval_steps_per_second": 0.0,
1119
+ "step": 1236
1120
+ }
1121
+ ],
1122
+ "logging_steps": 10,
1123
+ "max_steps": 1648,
1124
+ "num_input_tokens_seen": 0,
1125
+ "num_train_epochs": 4,
1126
+ "save_steps": 500,
1127
+ "stateful_callbacks": {
1128
+ "TrainerControl": {
1129
+ "args": {
1130
+ "should_epoch_stop": false,
1131
+ "should_evaluate": false,
1132
+ "should_log": false,
1133
+ "should_save": true,
1134
+ "should_training_stop": false
1135
+ },
1136
+ "attributes": {}
1137
+ }
1138
+ },
1139
+ "total_flos": 0.0,
1140
+ "train_batch_size": 2,
1141
+ "trial_name": null,
1142
+ "trial_params": null
1143
+ }
checkpoint-1236/training_args.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:c4cc2f888d304cc638d9229cee4d97273e72d5cd4109d5e994883f9da6feea4d
3
+ size 5496
checkpoint-1648/1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
checkpoint-1648/README.md ADDED
@@ -0,0 +1,1090 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - en
4
+ license: apache-2.0
5
+ tags:
6
+ - sentence-transformers
7
+ - sentence-similarity
8
+ - feature-extraction
9
+ - generated_from_trainer
10
+ - dataset_size:13186
11
+ - loss:MatryoshkaLoss
12
+ - loss:MultipleNegativesRankingLoss
13
+ base_model: nomic-ai/nomic-embed-text-v2-moe
14
+ widget:
15
+ - source_sentence: ООО "Сибирские ягоды" зарегистрировало географическое указание
16
+ на свою продукцию. В связи с реорганизацией общества, оно изменило свое наименование
17
+ на АО "Ягодный край". Какие действия необходимо предпринять АО "Ягодный край"
18
+ в соответствии с предоставленным текстом статьи закона для внесения изменений
19
+ в Государственный реестр?
20
+ sentences:
21
+ - <p>5. Если в силу договора факторинга финансовый агент (фактор) несет обязанности
22
+ по оплате цены приобретенных им денежных требований, по предоставлению клиенту
23
+ займа (кредита) или по оказанию клиенту услуг, к отношениям сторон по договору
24
+ факторинга применяются правила соответственно о купле-продаже, займе (кредите),
25
+ возмездном оказании услуг постольку, поскольку это не противоречит положениям
26
+ настоящей главы и существу отношений по договору факторинга.</p><p>(Статья в редакции
27
+ Федерального закона <a href="102439953">от 26.07.2017 № 212-ФЗ</a>)</p>
28
+ - <p>1. В случае, когда договором купли-продажи предусмотрена оплата товара через
29
+ определенное время после его передачи покупателю (продажа товара в кредит), покупатель
30
+ должен произвести оплату в срок, предусмотренный договором, а если такой срок
31
+ договором не предусмотрен, в срок, определенный в соответствии со статьей 314
32
+ настоящего Кодекса.</p><p>2. В случае неисполнения продавцом обязанности по передаче
33
+ товара применяются правила, предусмотренные статьей 328 настоящего Кодекса.</p><p>3.
34
+ В случае, когда покупатель, получивший товар, не исполняет обязанность по его
35
+ оплате в установленный договором купли-продажи срок, продавец вправе потребовать
36
+ оплаты переданного товара или возврата неоплаченных товаров.</p><p>4. В случае,
37
+ когда покупатель не исполняет обязанность по оплате переданного товара в установленный
38
+ договором срок и иное не предусмотрено настоящим Кодексом или договором купли-продажи,
39
+ на просроченную сумму подлежат уплате проценты в соответствии со статьей 395 настоящего
40
+ Кодекса со дня, когда по договору товар должен был быть оплачен, до дня оплаты
41
+ товара покупателем.</p><p>Договором может быть предусмотрена обязанность покупателя
42
+ уплачивать проценты на сумму, соответствующую цене товара, начиная со дня передачи
43
+ товара продавцом.</p><p>5. Если иное не предусмотрено договором купли-продажи,
44
+ с момента передачи товара покупателю и до его оплаты товар, проданный в кредит,
45
+ признается находящимся в залоге у продавца для обеспечения исполнения покупателем
46
+ его обязанности по оплате товара.</p>
47
+ - <p>1. Федеральный орган исполнительной власти по интеллектуальной собственности
48
+ вносит по заявлению правообладателя в Государственный реестр указаний и ��аименований
49
+ изменения, относящиеся к государственной регистрации географического указания
50
+ или наименования места происхождения товара и предоставлению исключительного права
51
+ на географическое указание или наименование места происхождения товара (пункт
52
+ 2 статьи 1529), в том числе к наименованию или имени правообладателя, его месту
53
+ нахождения или месту жительства, адресу для переписки, сведениям, касающимся перечня
54
+ лиц, имеющих право использования географического указания или наименования места
55
+ происхождения товара, условий использования географического указания или наименования
56
+ места происхождения товара входящими в объединение лицами, а также изменения для
57
+ исправления очевидных и технических ошибок.</p><p>2. К заявлению о внесении изменений
58
+ в сведения, относящиеся к государственной регистрации географического указания
59
+ или наименования места происхождения товара, в том числе указанные в подпунктах
60
+ 1 - 4, 6 - 9 пункта 2 статьи 1522, пункте 1 статьи 15221 настоящего Кодекса, прилагаются
61
+ документы или заключение уполномоченного органа, подтверждающие обоснованность
62
+ и необходимость внесения таких изменений.</p><p class="P">(Статья в редакции Федерального
63
+ закона <a href="102577263">от 26.07.2019 № 230-ФЗ</a>)</p>
64
+ - source_sentence: Какие возражения может выдвинуть должник против требования третьего
65
+ лица, если договор предусматривает исполнение в пользу третьего лица, но не указывает
66
+ его конкретно, и третье лицо заявило о своих правах?
67
+ sentences:
68
+ - <p>1. В случаях стихийных бедствий, аварий, эпидемий, эпизоотий и при иных обстоятельствах,
69
+ носящих чрезвычайный характер, имущество в интересах общества по решению государственных
70
+ органов может быть изъято у собственника в порядке и на условиях, установленных
71
+ законом, с выплатой ему стоимости имущества (реквизиция).</p><p>2. Оценка, по
72
+ которой собственнику возмещается стоимость реквизированного имущества, может быть
73
+ оспорена им в суде.</p><p>3. Лицо, имущество которого реквизировано, вправе при
74
+ прекращении действия обстоятельств, в связи с которыми произведена реквизиция,
75
+ требовать по суду возврата ему сохранившегося имущества.</p>
76
+ - <p>1. Собственники помещений в многоквартирном доме или нескольких многоквартирных
77
+ домах либо собственники нескольких жилых домов для совместного управления общим
78
+ имуществом в многоквартирном доме либо имуществом собственников помещений в нескольких
79
+ многоквартирных домах или имуществом собственников нескольких жилых домов и осуществления
80
+ деятельности по созданию, содержанию, сохранению и приращению такого имущества,
81
+ а также для осуществления иной деятельности, направленной на достижение целей
82
+ управления многоквартирными домами либо на совместное использование имущества,
83
+ принадлежащего собственникам помещений в нескольких м��огоквартирных домах, или
84
+ имущества собственников нескольких жилых домов, могут создавать товарищества собственников
85
+ жилья. (В редакции Федерального закона <a href="102387998">от 31.01.2016 № 7-ФЗ</a>)</p><p>2.
86
+ Товарищество собственников жилья является некоммерческой организацией, создаваемой
87
+ и действующей в соответствии с законом о товариществах собственников жилья.</p>
88
+ - <p>1. Договором в пользу третьего лица признается договор, в котором стороны установили,
89
+ что должник обязан произвести исполнение не кредитору, а указанному или не указанному
90
+ в договоре третьему лицу, имеющему право требовать от должника исполнения обязательства
91
+ в свою пользу.</p><p>2. Если иное не предусмотрено законом, иными правовыми актами
92
+ или договором, с момента выражения третьим лицом должнику намерения воспользоваться
93
+ своим правом по договору стороны не могут расторгать или изменять заключенный
94
+ ими договор без согласия третьего лица.</p><p>3. Должник в договоре вправе выдвигать
95
+ против требования третьего лица возражения, которые он мог бы выдвинуть против
96
+ кредитора.</p><p>4. В случае, когда третье лицо отказалось от права, предоставленного
97
+ ему по договору, кредитор может воспользоваться этим правом, если это не противоречит
98
+ закону, иным правовым актам и договору.</p>
99
+ - source_sentence: Заявитель на полезную модель внес изменения в описание технического
100
+ результата через 14 месяцев после подачи заявки. Эти изменения касаются уточнения
101
+ способа достижения заявленного технического результата, но не меняют сам результат.
102
+ Будут ли эти изменения учтены при публикации сведений о заявке согласно пункту
103
+ 5 статьи?
104
+ sentences:
105
+ - <p>указание на технический результат, который обеспечивается изобретением или
106
+ полезной моделью и не связан с техническим результатом, содержащимся в тех же
107
+ документах.</p><p>3. Дополнительные материалы изменяют заявку на промышленный
108
+ образец по существу, если они содержат изображения изделия, на которых:</p><p>представлен
109
+ иной промышленный образец, не удовлетворяющий требованию единства промышленного
110
+ образца в отношении промышленного образца или группы промышленных образцов, раскрытых
111
+ на изображениях, принятых к рассмотрению;</p><p>представлены существенные признаки
112
+ промышленного образца, отсутствующие на изображениях, представленных на дату подачи
113
+ заявки, либо представлены изображения изделия, с которых удалены существенные
114
+ признаки промышленного образца, имеющиеся на изображениях, представленных на дату
115
+ подачи заявки.</p><p>4. Изменения сведений об авторе, о заявителе, в том числе
116
+ при передаче права на получение патента другому лицу либо вследствие изменения
117
+ имени автора, имени или наименования заявителя, а также исправления очевидных
118
+ и технических ошибок могут быть внесены заявителем в документы заявки по ��обственной
119
+ инициативе до регистрации изобретения, полезной модели или промышленного образца.</p><p>5.
120
+ Изменения, внесенные заявителем в документы заявки на изобретение, учитываются
121
+ при публикации сведений о заявке, если такие изменения представлены в федеральный
122
+ орган исполнительной власти по интеллектуальной собственности в течение пятнадцати
123
+ месяцев с даты подачи заявки.</p><p>(Статья в редакции Федерального закона <a
124
+ href="102171743">от 12.03.2014 № 35-ФЗ</a>)</p>
125
+ - <p>1. Опекун или попечитель распоряжается доходами подопечного, в том числе доходами,
126
+ причитающимися подопечному от управления его имуществом, за исключением доходов,
127
+ которыми подопечный вправе распоряжаться самостоятельно, исключительно в интересах
128
+ подопечного и с предварительного разрешения органа опеки и попечительства. Суммы
129
+ алиментов, пенсий, пособий, возмещения вреда здоровью и вреда, понесенного в случае
130
+ смерти кормильца, а также иные выплачиваемые на содержание подопечного средства,
131
+ за исключением доходов, которыми подопечный вправе распоряжаться самостоятельно,
132
+ подлежат зачислению на отдельный номинальный счет, открываемый опекуном или попечителем
133
+ в соответствии с главой 45 настоящего Кодекса, и расходуются опекуном или попечителем
134
+ без предварительного разрешения органа опеки и попечительства. Опекун или попечитель
135
+ предоставляет отчет о расходовании сумм, зачисляемых на отдельный номинальный
136
+ счет, в порядке, установленном Федеральным законом <a href="102121401">"Об опеке
137
+ и попечительстве"</a>. Случаи, при которых опекун вправе не предоставлять отчет
138
+ о расходовании сумм, зачисляемых на отдельный номинальный счет, устанавливаются
139
+ Федеральным законом <a href="102121401">"Об опеке и попечительстве"</a>. (В редакции
140
+ федеральных законов <a href="102162486">от 30.12.2012 № 302-ФЗ</a>; <a href="102456108">от
141
+ 29.12.2017 № 459-ФЗ</a>)</p><p>2. Опекун не вправе без предварительного разрешения
142
+ органа опеки и попечительства совершать, а попечитель - давать согласие на совершение
143
+ сделок по отчуждению, в том числе обмену или дарению имущества подопечного, сдаче
144
+ его внаем (в аренду), в безвозмездное пользование или в залог, сделок, влекущих
145
+ отказ от принадлежащих подопечному прав, раздел его имущества или выдел из него
146
+ долей, а также любых других действий, влекущих уменьшение имущества подопечного.
147
+ (В редакции Федерального закона <a href="102162486">от 30.12.2012 № 302-ФЗ</a>)</p>
148
+ - <p>1. Заказчик обязан в сроки и в порядке, которые предусмотрены договором подряда,
149
+ с участием подрядчика осмотреть и принять выполненную работу (ее результат), а
150
+ при обнаружении отступлений от договора, ухудшающих результат работы, или иных
151
+ недостатков в работе немедленно заявить об этом подрядчику.</p><p>2. Заказчик,
152
+ обнаруживший недостатки в работе при ее приемке, вправе ссылаться на них в случаях,
153
+ если в акте либо в ином документе, удостоверяющем приемку, были оговорены эти
154
+ недостатки либо возможность последующего предъявления требования об их устранении.</p><p>3.
155
+ Если иное не предусмотрено договором подряда, заказчик, принявший работу без проверки,
156
+ лишается права ссылаться на недостатки работы, которые могли быть установлены
157
+ при обычном способе ее приемки (явные недостатки).</p><p>4. Заказчик, обнаруживший
158
+ после приемки работы отступления в ней от договора подряда или иные недостатки,
159
+ которые не могли быть установлены при обычном способе приемки (скрытые недостатки),
160
+ в том числе такие, которые были умышленно скрыты подрядчиком, обязан известить
161
+ об этом подрядчика в разумный срок по их обнаружении.</p><p>5. При возникновении
162
+ между заказчиком и подрядчиком спора по поводу недостатков выполненной работы
163
+ или их причин по требованию любой из сторон должна быть назначена экспертиза.
164
+ Расходы на экспертизу несет подрядчик, за исключением случаев, когда экспертизой
165
+ установлено отсутствие нарушений подрядчиком договора подряда или причинной связи
166
+ между действиями подрядчика и обнаруженными недостатками. В указанных случаях
167
+ расходы на экспертизу несет сторона, потребовавшая назначения экспертизы, а если
168
+ она назначена по соглашению между сторонами, обе стороны поровну.</p>
169
+ - source_sentence: Владелец квартиры на верхнем этаже многоквартирного дома хочет
170
+ установить кондиционер, труба которого будет проходить через стену соседней квартиры,
171
+ не затрагивая земельный участок. Может ли быть установлен сервитут на стену соседней
172
+ квартиры для прокладки трубы кондиционера, согласно приведенному тексту статьи?
173
+ sentences:
174
+ - <p>1. Комиссионер не отвечает перед комитентом за неисполнение третьим лицом сделки,
175
+ заключенной с ним за счет комитента, кроме случаев, когда комиссионер не проявил
176
+ необходимой осмотрительности в выборе этого лица либо принял на себя ручательство
177
+ за исполнение сделки (делькредере).</p><p>2. В случае неисполнения третьим лицом
178
+ сделки, заключенной с ним комиссионером, комиссионер обязан немедленно сообщить
179
+ об этом комитенту, собрать необходимые доказательства, а также по требованию комитента
180
+ передать ему права по такой сделке с соблюдением правил об уступке требования
181
+ (статьи 382 - 386, 388, 389).</p><p>3. Уступка прав комитенту по сделке на основании
182
+ пункта 2 настоящей статьи допускается независимо от соглашения комиссионера с
183
+ третьим лицом, запрещающего или ограничивающего такую уступку. Это не освобождает
184
+ комиссионера от ответственности перед третьим лицом в связи с уступкой права в
185
+ нарушение соглашения о ее запрете или об ограничении.</p>
186
+ - <p>Применительно к правилам, предусмотренным статьями 274 - 276 настоящего Кодекса,
187
+ сервитутом могут обременяться здания, сооружения и другое недвижимое иму��ество,
188
+ ограниченное пользование которым необходимо вне связи с пользованием земельным
189
+ участком.</p>
190
+ - <p>1. Завещатель вправе отменить или изменить составленное им завещание в любое
191
+ время после его совершения, не указывая при этом причины его отмены или изменения.</p><p>Для
192
+ отмены или изменения завещания не требуется чье-либо согласие, в том числе лиц,
193
+ назначенных наследниками в отменяемом или изменяемом завещании.</p><p>2. Завещатель
194
+ вправе посредством нового завещания отменить прежнее завещание в целом либо изменить
195
+ его посредством отмены или изменения отдельных содержащихся в нем завещательных
196
+ распоряжений.</p><p>Последующее завещание, не содержащее прямых указаний об отмене
197
+ прежнего завещания или отдельных содержащихся в нем завещательных распоряжений,
198
+ отменяет это прежнее завещание полностью или в части, в которой оно противоречит
199
+ последующему завещанию.</p><p>Завещание, отмененное полностью или частично последующим
200
+ завещанием, не восстанавливается, если последующее завещание отменено завещателем
201
+ полностью или в соответствующей части.</p><p>3. В случае недействительности последующего
202
+ завещания наследование осуществляется в соответствии с прежним завещанием.</p><p>4.
203
+ Завещание может быть отменено также посредством распоряжения о его отмене. Распоряжение
204
+ об отмене завещания должно быть совершено в форме, установленной настоящим Кодексом
205
+ для совершения завещания. К распоряжению об отмене завещания соответственно применяются
206
+ правила пункта 3 настоящей статьи.</p><p>5. Завещанием, совершенным в чрезвычайных
207
+ обстоятельствах (статья 1129), может быть отменено или изменено только такое же
208
+ завещание.</p><p>6. Завещательным распоряжением в банке (статья 1128) может быть
209
+ отменено или изменено только завещательное распоряжение правами на денежные средства
210
+ в соответствующем банке.</p>
211
+ - source_sentence: Компания «Альфа» заключила договор с инженером Петровским на разработку
212
+ нового программного обеспечения. В процессе работы Петровский создал изобретение,
213
+ защищаемое патентом. Договор не содержал пунктов, касающихся прав на интеллектуальную
214
+ собственность. Кто является правообладателем патента на изобретение, и может
215
+ ли компания «Альфа» использовать это изобретение без выплаты дополнительного вознаграждения?
216
+ sentences:
217
+ - <p>передаче в порядке, установленном частью 11 статьи 154 Федерального закона
218
+ <a href="102088491">от 22 августа 2004 года № 122-ФЗ</a> "О внесении изменений
219
+ в законодательные акты Российской Федерации и признании утратившими силу некоторых
220
+ законодательных актов Российской Федерации в связи с принятием федеральных законов
221
+ <a href="102067003">"О внесении изменений и дополнений в Федеральный закон "Об
222
+ общих принципах организации законодательных (представительных) и исполнительных
223
+ органов государственной власти субъектов Российской Федерации"</a> и <a href="102083574">"Об
224
+ общих принципах организации местного самоуправления в Российской Федерации"</a>,
225
+ акций из федеральной собственности в собственность субъекта Российской Федерации
226
+ или муниципальную собственность, из собственности субъекта Российской Федерации
227
+ в федеральную собственность или муниципальную собственность, из муниципальной
228
+ собственности в федеральную собственность или собственность субъекта Российской
229
+ Федерации. (Дополнение абзацем - Федеральный закон <a href="102157372">от 14.06.2012
230
+ № 77-ФЗ</a>)</p>
231
+ - <p>4. Если учрежденное за границей юридическое лицо осуществляет свою предпринимательскую
232
+ деятельность преимущественно на территории Российской Федерации, к требованиям
233
+ об ответственности по обязательствам юридического лица его учредителей (участников),
234
+ других лиц, которые имеют право давать обязательные для него указания или иным
235
+ образом имеют возможность определять его действия, применяется российское право
236
+ либо по выбору кредитора личный закон такого юридического лица. (Дополнение пунктом
237
+ - Федеральный закон <a href="102168115">от 30.09.2013 № 260-ФЗ</a>)</p>
238
+ - <p>1. Право на получение патента и исключительное право на изобретение, полезную
239
+ модель или промышленный образец, созданные при выполнении договора подряда или
240
+ договора на выполнение научно-исследовательских, опытно-конструкторских или технологических
241
+ работ, которые прямо не предусматривали их создание, принадлежат подрядчику (исполнителю),
242
+ если договором между ним и заказчиком не предусмотрено иное. (В редакции Федерального
243
+ закона <a href="102171743">от 12.03.2014 № 35-ФЗ</a>)</p><p>В этом случае заказчик
244
+ вправе, если договором не предусмотрено иное, использовать созданные таким образом
245
+ изобретение, полезную модель или промышленный образец в целях, для достижения
246
+ которых был заключен соответствующий договор, на условиях простой (неисключительной)
247
+ лицензии в течение всего срока действия патента без выплаты за это использование
248
+ дополнительного вознаграждения. При передаче подрядчиком (исполнителем) права
249
+ на получение патента или отчуждении самого патента другому лицу заказчик сохраняет
250
+ право использования изобретения, полезной модели или промышленного образца на
251
+ указанных условиях.</p><p>2. В случае, когда в соответствии с договором между
252
+ подрядчиком (исполнителем) и заказчиком право на получение патента или исключительное
253
+ право на изобретение, полезную модель или промышленный образец передано заказчику
254
+ либо указанному им третьему лицу, подрядчик (исполнитель) вправе использовать
255
+ созданные изобретение, полезную модель или промышленный образец для собственных
256
+ нужд на условиях безвозмездной простой (неисключительной) лицензии в течение всего
257
+ срока действия патента, если договором не предусмотрено иное.</p><p>3. Автору
258
+ указанных в пункте 1 настоящей статьи изобретения, полезной модели или промышленного
259
+ образца, не являющемуся патентообладателем, выплачивается вознаграждение в соответствии
260
+ с пунктом 4 статьи 1370 настоящего Кодекса.</p>
261
+ pipeline_tag: sentence-similarity
262
+ library_name: sentence-transformers
263
+ metrics:
264
+ - cosine_accuracy@1
265
+ - cosine_accuracy@3
266
+ - cosine_accuracy@5
267
+ - cosine_accuracy@10
268
+ - cosine_precision@1
269
+ - cosine_precision@3
270
+ - cosine_precision@5
271
+ - cosine_precision@10
272
+ - cosine_recall@1
273
+ - cosine_recall@3
274
+ - cosine_recall@5
275
+ - cosine_recall@10
276
+ - cosine_ndcg@10
277
+ - cosine_mrr@10
278
+ - cosine_map@100
279
+ model-index:
280
+ - name: tuned nomic v2
281
+ results:
282
+ - task:
283
+ type: information-retrieval
284
+ name: Information Retrieval
285
+ dataset:
286
+ name: dim 768
287
+ type: dim_768
288
+ metrics:
289
+ - type: cosine_accuracy@1
290
+ value: 0.007503410641200546
291
+ name: Cosine Accuracy@1
292
+ - type: cosine_accuracy@3
293
+ value: 0.06002728512960437
294
+ name: Cosine Accuracy@3
295
+ - type: cosine_accuracy@5
296
+ value: 0.4304229195088677
297
+ name: Cosine Accuracy@5
298
+ - type: cosine_accuracy@10
299
+ value: 0.76193724420191
300
+ name: Cosine Accuracy@10
301
+ - type: cosine_precision@1
302
+ value: 0.007503410641200546
303
+ name: Cosine Precision@1
304
+ - type: cosine_precision@3
305
+ value: 0.020009095043201454
306
+ name: Cosine Precision@3
307
+ - type: cosine_precision@5
308
+ value: 0.08608458390177355
309
+ name: Cosine Precision@5
310
+ - type: cosine_precision@10
311
+ value: 0.07619372442019098
312
+ name: Cosine Precision@10
313
+ - type: cosine_recall@1
314
+ value: 0.007503410641200546
315
+ name: Cosine Recall@1
316
+ - type: cosine_recall@3
317
+ value: 0.06002728512960437
318
+ name: Cosine Recall@3
319
+ - type: cosine_recall@5
320
+ value: 0.4304229195088677
321
+ name: Cosine Recall@5
322
+ - type: cosine_recall@10
323
+ value: 0.76193724420191
324
+ name: Cosine Recall@10
325
+ - type: cosine_ndcg@10
326
+ value: 0.3000127641618364
327
+ name: Cosine Ndcg@10
328
+ - type: cosine_mrr@10
329
+ value: 0.1604208622967127
330
+ name: Cosine Mrr@10
331
+ - type: cosine_map@100
332
+ value: 0.17310179565186012
333
+ name: Cosine Map@100
334
+ - task:
335
+ type: information-retrieval
336
+ name: Information Retrieval
337
+ dataset:
338
+ name: dim 512
339
+ type: dim_512
340
+ metrics:
341
+ - type: cosine_accuracy@1
342
+ value: 0.0068212824010914054
343
+ name: Cosine Accuracy@1
344
+ - type: cosine_accuracy@3
345
+ value: 0.059345156889495224
346
+ name: Cosine Accuracy@3
347
+ - type: cosine_accuracy@5
348
+ value: 0.4311050477489768
349
+ name: Cosine Accuracy@5
350
+ - type: cosine_accuracy@10
351
+ value: 0.7448840381991815
352
+ name: Cosine Accuracy@10
353
+ - type: cosine_precision@1
354
+ value: 0.0068212824010914054
355
+ name: Cosine Precision@1
356
+ - type: cosine_precision@3
357
+ value: 0.019781718963165072
358
+ name: Cosine Precision@3
359
+ - type: cosine_precision@5
360
+ value: 0.08622100954979535
361
+ name: Cosine Precision@5
362
+ - type: cosine_precision@10
363
+ value: 0.07448840381991814
364
+ name: Cosine Precision@10
365
+ - type: cosine_recall@1
366
+ value: 0.0068212824010914054
367
+ name: Cosine Recall@1
368
+ - type: cosine_recall@3
369
+ value: 0.059345156889495224
370
+ name: Cosine Recall@3
371
+ - type: cosine_recall@5
372
+ value: 0.4311050477489768
373
+ name: Cosine Recall@5
374
+ - type: cosine_recall@10
375
+ value: 0.7448840381991815
376
+ name: Cosine Recall@10
377
+ - type: cosine_ndcg@10
378
+ value: 0.29381415276343026
379
+ name: Cosine Ndcg@10
380
+ - type: cosine_mrr@10
381
+ value: 0.15735047315879294
382
+ name: Cosine Mrr@10
383
+ - type: cosine_map@100
384
+ value: 0.1710230677531375
385
+ name: Cosine Map@100
386
+ - task:
387
+ type: information-retrieval
388
+ name: Information Retrieval
389
+ dataset:
390
+ name: dim 256
391
+ type: dim_256
392
+ metrics:
393
+ - type: cosine_accuracy@1
394
+ value: 0.008185538881309686
395
+ name: Cosine Accuracy@1
396
+ - type: cosine_accuracy@3
397
+ value: 0.06207366984993179
398
+ name: Cosine Accuracy@3
399
+ - type: cosine_accuracy@5
400
+ value: 0.41678035470668484
401
+ name: Cosine Accuracy@5
402
+ - type: cosine_accuracy@10
403
+ value: 0.7271487039563438
404
+ name: Cosine Accuracy@10
405
+ - type: cosine_precision@1
406
+ value: 0.008185538881309686
407
+ name: Cosine Precision@1
408
+ - type: cosine_precision@3
409
+ value: 0.020691223283310595
410
+ name: Cosine Precision@3
411
+ - type: cosine_precision@5
412
+ value: 0.08335607094133697
413
+ name: Cosine Precision@5
414
+ - type: cosine_precision@10
415
+ value: 0.07271487039563437
416
+ name: Cosine Precision@10
417
+ - type: cosine_recall@1
418
+ value: 0.008185538881309686
419
+ name: Cosine Recall@1
420
+ - type: cosine_recall@3
421
+ value: 0.06207366984993179
422
+ name: Cosine Recall@3
423
+ - type: cosine_recall@5
424
+ value: 0.41678035470668484
425
+ name: Cosine Recall@5
426
+ - type: cosine_recall@10
427
+ value: 0.7271487039563438
428
+ name: Cosine Recall@10
429
+ - type: cosine_ndcg@10
430
+ value: 0.2876701680743724
431
+ name: Cosine Ndcg@10
432
+ - type: cosine_mrr@10
433
+ value: 0.15479628185971772
434
+ name: Cosine Mrr@10
435
+ - type: cosine_map@100
436
+ value: 0.1692974551068429
437
+ name: Cosine Map@100
438
+ - task:
439
+ type: information-retrieval
440
+ name: Information Retrieval
441
+ dataset:
442
+ name: dim 128
443
+ type: dim_128
444
+ metrics:
445
+ - type: cosine_accuracy@1
446
+ value: 0.008185538881309686
447
+ name: Cosine Accuracy@1
448
+ - type: cosine_accuracy@3
449
+ value: 0.05593451568894952
450
+ name: Cosine Accuracy@3
451
+ - type: cosine_accuracy@5
452
+ value: 0.3840381991814461
453
+ name: Cosine Accuracy@5
454
+ - type: cosine_accuracy@10
455
+ value: 0.6950886766712142
456
+ name: Cosine Accuracy@10
457
+ - type: cosine_precision@1
458
+ value: 0.008185538881309686
459
+ name: Cosine Precision@1
460
+ - type: cosine_precision@3
461
+ value: 0.018644838562983174
462
+ name: Cosine Precision@3
463
+ - type: cosine_precision@5
464
+ value: 0.07680763983628923
465
+ name: Cosine Precision@5
466
+ - type: cosine_precision@10
467
+ value: 0.0695088676671214
468
+ name: Cosine Precision@10
469
+ - type: cosine_recall@1
470
+ value: 0.008185538881309686
471
+ name: Cosine Recall@1
472
+ - type: cosine_recall@3
473
+ value: 0.05593451568894952
474
+ name: Cosine Recall@3
475
+ - type: cosine_recall@5
476
+ value: 0.3840381991814461
477
+ name: Cosine Recall@5
478
+ - type: cosine_recall@10
479
+ value: 0.6950886766712142
480
+ name: Cosine Recall@10
481
+ - type: cosine_ndcg@10
482
+ value: 0.27519563194479246
483
+ name: Cosine Ndcg@10
484
+ - type: cosine_mrr@10
485
+ value: 0.14822809069057183
486
+ name: Cosine Mrr@10
487
+ - type: cosine_map@100
488
+ value: 0.16389295635755213
489
+ name: Cosine Map@100
490
+ - task:
491
+ type: information-retrieval
492
+ name: Information Retrieval
493
+ dataset:
494
+ name: dim 64
495
+ type: dim_64
496
+ metrics:
497
+ - type: cosine_accuracy@1
498
+ value: 0.007503410641200546
499
+ name: Cosine Accuracy@1
500
+ - type: cosine_accuracy@3
501
+ value: 0.06275579809004093
502
+ name: Cosine Accuracy@3
503
+ - type: cosine_accuracy@5
504
+ value: 0.3792633015006821
505
+ name: Cosine Accuracy@5
506
+ - type: cosine_accuracy@10
507
+ value: 0.6412005457025921
508
+ name: Cosine Accuracy@10
509
+ - type: cosine_precision@1
510
+ value: 0.007503410641200546
511
+ name: Cosine Precision@1
512
+ - type: cosine_precision@3
513
+ value: 0.020918599363346974
514
+ name: Cosine Precision@3
515
+ - type: cosine_precision@5
516
+ value: 0.07585266030013643
517
+ name: Cosine Precision@5
518
+ - type: cosine_precision@10
519
+ value: 0.0641200545702592
520
+ name: Cosine Precision@10
521
+ - type: cosine_recall@1
522
+ value: 0.007503410641200546
523
+ name: Cosine Recall@1
524
+ - type: cosine_recall@3
525
+ value: 0.06275579809004093
526
+ name: Cosine Recall@3
527
+ - type: cosine_recall@5
528
+ value: 0.3792633015006821
529
+ name: Cosine Recall@5
530
+ - type: cosine_recall@10
531
+ value: 0.6412005457025921
532
+ name: Cosine Recall@10
533
+ - type: cosine_ndcg@10
534
+ value: 0.2546507438265754
535
+ name: Cosine Ndcg@10
536
+ - type: cosine_mrr@10
537
+ value: 0.13775254986032456
538
+ name: Cosine Mrr@10
539
+ - type: cosine_map@100
540
+ value: 0.15410585003942584
541
+ name: Cosine Map@100
542
+ ---
543
+
544
+ # tuned nomic v2
545
+
546
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [nomic-ai/nomic-embed-text-v2-moe](https://huggingface.co/nomic-ai/nomic-embed-text-v2-moe) on the json dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
547
+
548
+ ## Model Details
549
+
550
+ ### Model Description
551
+ - **Model Type:** Sentence Transformer
552
+ - **Base model:** [nomic-ai/nomic-embed-text-v2-moe](https://huggingface.co/nomic-ai/nomic-embed-text-v2-moe) <!-- at revision f6a8873b415144a69ffc529ec1e234d1e00ee765 -->
553
+ - **Maximum Sequence Length:** 512 tokens
554
+ - **Output Dimensionality:** 768 dimensions
555
+ - **Similarity Function:** Cosine Similarity
556
+ - **Training Dataset:**
557
+ - json
558
+ - **Language:** en
559
+ - **License:** apache-2.0
560
+
561
+ ### Model Sources
562
+
563
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
564
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
565
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
566
+
567
+ ### Full Model Architecture
568
+
569
+ ```
570
+ SentenceTransformer(
571
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: NomicBertModel
572
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
573
+ (2): Normalize()
574
+ )
575
+ ```
576
+
577
+ ## Usage
578
+
579
+ ### Direct Usage (Sentence Transformers)
580
+
581
+ First install the Sentence Transformers library:
582
+
583
+ ```bash
584
+ pip install -U sentence-transformers
585
+ ```
586
+
587
+ Then you can load this model and run inference.
588
+ ```python
589
+ from sentence_transformers import SentenceTransformer
590
+
591
+ # Download from the 🤗 Hub
592
+ model = SentenceTransformer("sentence_transformers_model_id")
593
+ # Run inference
594
+ sentences = [
595
+ 'Компания «Альфа» заключила договор с инженером Петровским на разработку нового программного обеспечения. В процессе работы Петровский создал изобретение, защищаемое патентом. Договор не содержал пунктов, касающихся прав на интеллектуальную собственность. Кто является правообладателем патента на изобретение, и может ли компания «Альфа» использовать это изобретение без выплаты дополнительного вознаграждения?',
596
+ '<p>1. Право на получение патента и исключительное право на изобретение, полезную модель или промышленный образец, созданные при выполнении договора подряда или договора на выполнение научно-исследовательских, опытно-конструкторских или технологических работ, которые прямо не предусматривали их создание, принадлежат подрядчику (исполнителю), если договором между ним и заказчиком не предусмотрено иное. (В редакции Федерального закона <a href="102171743">от 12.03.2014 № 35-ФЗ</a>)</p><p>В этом случае заказчик вправе, если договором не предусмотрено иное, использовать созданные таким образом изобретение, полезную модель или промышленный образец в целях, для достижения которых был заключен соответствующий договор, на условиях простой (неисключительной) лицензии в течение всего срока действия патента без выплаты за это использование дополнительного вознаграждения. При передаче подрядчиком (исполнителем) права на получение патента или отчуждении самого патента другому лицу заказчик сохраняет право использования изобретения, полезной модели или промышленного образца на указанных условиях.</p><p>2. В случае, когда в соответствии с договором между подрядчиком (исполнителем) и заказчиком право на получение патента или исключительное право на изобретение, полезную модель или промышленный образец передано заказчику либо указанному им третьему лицу, подрядчик (исполнитель) вправе использовать созданные изобретение, полезную модель или промышленный образец для собственных нужд на условиях безвозмездной простой (неисключительной) лицензии в течение всего срока действия патента, если договором не предусмотрено иное.</p><p>3. Автору указанных в пункте 1 настоящей статьи изобретения, полезной модели или промышленного образца, не являющемуся патентообладателем, выплачивается вознаграждение в соответствии с пунктом 4 статьи 1370 настоящего Кодекса.</p>',
597
+ '<p>передаче в порядке, установленном частью 11 статьи 154 Федерального закона <a href="102088491">от 22 августа 2004 года № 122-ФЗ</a> "О внесении изменений в законодательные акты Российской Федерации и признании утратившими силу некоторых законодательных актов Российской Федерации в связи с принятием федеральных законов <a href="102067003">"О внесении изменений и дополнений в Федеральный закон "Об общих принципах организации законодательных (представительных) и исполнительных органов государственной власти субъектов Российской Федерации"</a> и <a href="102083574">"Об общих принципах организации местного самоуправления в Российской Федерации"</a>, акций из федеральной собственности в собственность субъекта Российской Федерации или муниципальную собственность, из собственности субъекта Российской Федерации в федеральную собственность или муниципальную собственность, из муниципальной собственности в федеральную собственность или собственность субъекта Российской Федерации. (Дополнение абзацем - Федеральный закон <a href="102157372">от 14.06.2012 № 77-ФЗ</a>)</p>',
598
+ ]
599
+ embeddings = model.encode(sentences)
600
+ print(embeddings.shape)
601
+ # [3, 768]
602
+
603
+ # Get the similarity scores for the embeddings
604
+ similarities = model.similarity(embeddings, embeddings)
605
+ print(similarities.shape)
606
+ # [3, 3]
607
+ ```
608
+
609
+ <!--
610
+ ### Direct Usage (Transformers)
611
+
612
+ <details><summary>Click to see the direct usage in Transformers</summary>
613
+
614
+ </details>
615
+ -->
616
+
617
+ <!--
618
+ ### Downstream Usage (Sentence Transformers)
619
+
620
+ You can finetune this model on your own dataset.
621
+
622
+ <details><summary>Click to expand</summary>
623
+
624
+ </details>
625
+ -->
626
+
627
+ <!--
628
+ ### Out-of-Scope Use
629
+
630
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
631
+ -->
632
+
633
+ ## Evaluation
634
+
635
+ ### Metrics
636
+
637
+ #### Information Retrieval
638
+
639
+ * Datasets: `dim_768`, `dim_512`, `dim_256`, `dim_128` and `dim_64`
640
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
641
+
642
+ | Metric | dim_768 | dim_512 | dim_256 | dim_128 | dim_64 |
643
+ |:--------------------|:--------|:-----------|:-----------|:-----------|:-----------|
644
+ | cosine_accuracy@1 | 0.0075 | 0.0068 | 0.0082 | 0.0082 | 0.0075 |
645
+ | cosine_accuracy@3 | 0.06 | 0.0593 | 0.0621 | 0.0559 | 0.0628 |
646
+ | cosine_accuracy@5 | 0.4304 | 0.4311 | 0.4168 | 0.384 | 0.3793 |
647
+ | cosine_accuracy@10 | 0.7619 | 0.7449 | 0.7271 | 0.6951 | 0.6412 |
648
+ | cosine_precision@1 | 0.0075 | 0.0068 | 0.0082 | 0.0082 | 0.0075 |
649
+ | cosine_precision@3 | 0.02 | 0.0198 | 0.0207 | 0.0186 | 0.0209 |
650
+ | cosine_precision@5 | 0.0861 | 0.0862 | 0.0834 | 0.0768 | 0.0759 |
651
+ | cosine_precision@10 | 0.0762 | 0.0745 | 0.0727 | 0.0695 | 0.0641 |
652
+ | cosine_recall@1 | 0.0075 | 0.0068 | 0.0082 | 0.0082 | 0.0075 |
653
+ | cosine_recall@3 | 0.06 | 0.0593 | 0.0621 | 0.0559 | 0.0628 |
654
+ | cosine_recall@5 | 0.4304 | 0.4311 | 0.4168 | 0.384 | 0.3793 |
655
+ | cosine_recall@10 | 0.7619 | 0.7449 | 0.7271 | 0.6951 | 0.6412 |
656
+ | **cosine_ndcg@10** | **0.3** | **0.2938** | **0.2877** | **0.2752** | **0.2547** |
657
+ | cosine_mrr@10 | 0.1604 | 0.1574 | 0.1548 | 0.1482 | 0.1378 |
658
+ | cosine_map@100 | 0.1731 | 0.171 | 0.1693 | 0.1639 | 0.1541 |
659
+
660
+ <!--
661
+ ## Bias, Risks and Limitations
662
+
663
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
664
+ -->
665
+
666
+ <!--
667
+ ### Recommendations
668
+
669
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
670
+ -->
671
+
672
+ ## Training Details
673
+
674
+ ### Training Dataset
675
+
676
+ #### json
677
+
678
+ * Dataset: json
679
+ * Size: 13,186 training samples
680
+ * Columns: <code>anchor</code> and <code>positive</code>
681
+ * Approximate statistics based on the first 1000 samples:
682
+ | | anchor | positive |
683
+ |:--------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
684
+ | type | string | string |
685
+ | details | <ul><li>min: 18 tokens</li><li>mean: 61.09 tokens</li><li>max: 162 tokens</li></ul> | <ul><li>min: 40 tokens</li><li>mean: 258.71 tokens</li><li>max: 512 tokens</li></ul> |
686
+ * Samples:
687
+ | anchor | positive |
688
+ |:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
689
+ | <code>Студент разработал базу данных и подал заявку на государственную регистрацию, приложив к ней описание базы данных, реферат и заявление с указанием себя в качестве правообладателя и автора. В заявке он указал две разные базы данных. Соответствует ли заявка студента требованиям статьи закона?</code> | <code><p>1. Правообладатель в течение срока действия исключительного права на программу для ЭВМ или на базу данных может по своему желанию зарегистрировать такую программу или такую базу данных в федеральном органе исполнительной власти по интеллектуальной собственности.</p><p>Программы для ЭВМ и базы данных, в которых содержатся сведения, составляющие государственную тайну, государственной регистрации не подлежат. Лицо, подавшее заявку на государственную регистрацию (заявитель), несет ответственность за разглашение сведений о программах для ЭВМ и базах данных, в которых содержатся сведения, составляющие государственную тайну, в соответствии с законодательством Российской Федерации.</p><p>2. Заявка на государственную регистрацию программы для ЭВМ или базы данных (заявка на регистрацию) должна относиться к одной программе для ЭВМ или к одной базе данных.</p><p>Заявка на регистрацию должна содержать:</p><p>заявление о государственной регистрации программы для ЭВМ или базы данных с указанием пр...</code> |
690
+ | <code>Предположим, наследственный договор предусматривает переход права собственности на дом к А, но А отказывается от наследства. Может ли Б, другая сторона договора, потребовать исполнения договора в отношении дома, если договор не содержал бы условий о передаче дома Б в случае отказа А?</code> | <code><p>1. Наследодатель вправе заключить с любым из лиц, которые могут призываться к наследованию (статья 1116), договор, условия которого определяют круг наследников и порядок перехода прав на имущество наследодателя после его смерти к пережившим наследодателя сторонам договора или к пережившим третьим лицам, которые могут призываться к наследованию (наследственный договор). Наследственный договор может также содержать условие о душеприказчике и возлагать на участвующих в наследственном договоре лиц, которые могут призываться к наследованию, обязанность совершить какие-либо не противоречащие закону действия имущественного или неимущественного характера, в том числе исполнить завещательные отказы или завещательные возложения.</p><p>Последствия, предусмотренные наследственным договором, могут быть поставлены в зависимость от наступивших ко дню открытия наследства обстоятельств, относительно которых при заключении наследственного договора было неизвестно, наступят они или не наступят, в том ...</code> |
691
+ | <code>В чем заключается различие в порядке оспаривания патента в зависимости от характера нарушения, указанного в пункте 1 настоящей статьи?</code> | <code><p>2. Патент на изобретение, полезную модель или промышленный образец в течение срока его действия, установленного пунктами 1 - 3 статьи 1363 настоящего Кодекса, может быть оспорен путем подачи возражения в федеральный орган исполнительной власти по интеллектуальной собственности любым лицом, которому стало известно о нарушениях, предусмотренных подпунктами 1 - 4 пункта 1 настоящей статьи.</p><p>Патент на изобретение, полезную модель или промышленный образец в течение срока его действия, установленного пунктами 1 - 3 статьи 1363 настоящего Кодекса, может быть оспорен в судебном порядке любым лицом, которому стало известно о нарушениях, предусмотренных подпунктом 5 пункта 1 настоящей статьи.</p><p>Патент на изобретение, полезную модель или промышленный образец может быть оспорен заинтересованным лицом и по истечении срока его действия по основаниям и в порядке, которые установлены абзацами первым и вторым настоящего пункта.</p></code> |
692
+ * Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
693
+ ```json
694
+ {
695
+ "loss": "MultipleNegativesRankingLoss",
696
+ "matryoshka_dims": [
697
+ 768,
698
+ 512,
699
+ 256,
700
+ 128,
701
+ 64
702
+ ],
703
+ "matryoshka_weights": [
704
+ 1,
705
+ 1,
706
+ 1,
707
+ 1,
708
+ 1
709
+ ],
710
+ "n_dims_per_step": -1
711
+ }
712
+ ```
713
+
714
+ ### Training Hyperparameters
715
+ #### Non-Default Hyperparameters
716
+
717
+ - `eval_strategy`: epoch
718
+ - `per_device_train_batch_size`: 2
719
+ - `per_device_eval_batch_size`: 2
720
+ - `gradient_accumulation_steps`: 16
721
+ - `learning_rate`: 2e-05
722
+ - `num_train_epochs`: 4
723
+ - `lr_scheduler_type`: cosine
724
+ - `warmup_ratio`: 0.1
725
+ - `bf16`: True
726
+ - `load_best_model_at_end`: True
727
+ - `optim`: adamw_torch_fused
728
+ - `batch_sampler`: no_duplicates
729
+
730
+ #### All Hyperparameters
731
+ <details><summary>Click to expand</summary>
732
+
733
+ - `overwrite_output_dir`: False
734
+ - `do_predict`: False
735
+ - `eval_strategy`: epoch
736
+ - `prediction_loss_only`: True
737
+ - `per_device_train_batch_size`: 2
738
+ - `per_device_eval_batch_size`: 2
739
+ - `per_gpu_train_batch_size`: None
740
+ - `per_gpu_eval_batch_size`: None
741
+ - `gradient_accumulation_steps`: 16
742
+ - `eval_accumulation_steps`: None
743
+ - `torch_empty_cache_steps`: None
744
+ - `learning_rate`: 2e-05
745
+ - `weight_decay`: 0.0
746
+ - `adam_beta1`: 0.9
747
+ - `adam_beta2`: 0.999
748
+ - `adam_epsilon`: 1e-08
749
+ - `max_grad_norm`: 1.0
750
+ - `num_train_epochs`: 4
751
+ - `max_steps`: -1
752
+ - `lr_scheduler_type`: cosine
753
+ - `lr_scheduler_kwargs`: {}
754
+ - `warmup_ratio`: 0.1
755
+ - `warmup_steps`: 0
756
+ - `log_level`: passive
757
+ - `log_level_replica`: warning
758
+ - `log_on_each_node`: True
759
+ - `logging_nan_inf_filter`: True
760
+ - `save_safetensors`: True
761
+ - `save_on_each_node`: False
762
+ - `save_only_model`: False
763
+ - `restore_callback_states_from_checkpoint`: False
764
+ - `no_cuda`: False
765
+ - `use_cpu`: False
766
+ - `use_mps_device`: False
767
+ - `seed`: 42
768
+ - `data_seed`: None
769
+ - `jit_mode_eval`: False
770
+ - `use_ipex`: False
771
+ - `bf16`: True
772
+ - `fp16`: False
773
+ - `fp16_opt_level`: O1
774
+ - `half_precision_backend`: auto
775
+ - `bf16_full_eval`: False
776
+ - `fp16_full_eval`: False
777
+ - `tf32`: None
778
+ - `local_rank`: 0
779
+ - `ddp_backend`: None
780
+ - `tpu_num_cores`: None
781
+ - `tpu_metrics_debug`: False
782
+ - `debug`: []
783
+ - `dataloader_drop_last`: False
784
+ - `dataloader_num_workers`: 0
785
+ - `dataloader_prefetch_factor`: None
786
+ - `past_index`: -1
787
+ - `disable_tqdm`: False
788
+ - `remove_unused_columns`: True
789
+ - `label_names`: None
790
+ - `load_best_model_at_end`: True
791
+ - `ignore_data_skip`: False
792
+ - `fsdp`: []
793
+ - `fsdp_min_num_params`: 0
794
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
795
+ - `fsdp_transformer_layer_cls_to_wrap`: None
796
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
797
+ - `deepspeed`: None
798
+ - `label_smoothing_factor`: 0.0
799
+ - `optim`: adamw_torch_fused
800
+ - `optim_args`: None
801
+ - `adafactor`: False
802
+ - `group_by_length`: False
803
+ - `length_column_name`: length
804
+ - `ddp_find_unused_parameters`: None
805
+ - `ddp_bucket_cap_mb`: None
806
+ - `ddp_broadcast_buffers`: False
807
+ - `dataloader_pin_memory`: True
808
+ - `dataloader_persistent_workers`: False
809
+ - `skip_memory_metrics`: True
810
+ - `use_legacy_prediction_loop`: False
811
+ - `push_to_hub`: False
812
+ - `resume_from_checkpoint`: None
813
+ - `hub_model_id`: None
814
+ - `hub_strategy`: every_save
815
+ - `hub_private_repo`: False
816
+ - `hub_always_push`: False
817
+ - `gradient_checkpointing`: False
818
+ - `gradient_checkpointing_kwargs`: None
819
+ - `include_inputs_for_metrics`: False
820
+ - `eval_do_concat_batches`: True
821
+ - `fp16_backend`: auto
822
+ - `push_to_hub_model_id`: None
823
+ - `push_to_hub_organization`: None
824
+ - `mp_parameters`:
825
+ - `auto_find_batch_size`: False
826
+ - `full_determinism`: False
827
+ - `torchdynamo`: None
828
+ - `ray_scope`: last
829
+ - `ddp_timeout`: 1800
830
+ - `torch_compile`: False
831
+ - `torch_compile_backend`: None
832
+ - `torch_compile_mode`: None
833
+ - `dispatch_batches`: None
834
+ - `split_batches`: None
835
+ - `include_tokens_per_second`: False
836
+ - `include_num_input_tokens_seen`: False
837
+ - `neftune_noise_alpha`: None
838
+ - `optim_target_modules`: None
839
+ - `batch_eval_metrics`: False
840
+ - `eval_on_start`: False
841
+ - `eval_use_gather_object`: False
842
+ - `prompts`: None
843
+ - `batch_sampler`: no_duplicates
844
+ - `multi_dataset_batch_sampler`: proportional
845
+
846
+ </details>
847
+
848
+ ### Training Logs
849
+ <details><summary>Click to expand</summary>
850
+
851
+ | Epoch | Step | Training Loss | dim_768_cosine_ndcg@10 | dim_512_cosine_ndcg@10 | dim_256_cosine_ndcg@10 | dim_128_cosine_ndcg@10 | dim_64_cosine_ndcg@10 |
852
+ |:------:|:----:|:-------------:|:----------------------:|:----------------------:|:----------------------:|:----------------------:|:---------------------:|
853
+ | 0.0243 | 10 | 0.2108 | - | - | - | - | - |
854
+ | 0.0485 | 20 | 0.1169 | - | - | - | - | - |
855
+ | 0.0728 | 30 | 0.1334 | - | - | - | - | - |
856
+ | 0.0971 | 40 | 0.0963 | - | - | - | - | - |
857
+ | 0.1213 | 50 | 0.127 | - | - | - | - | - |
858
+ | 0.1456 | 60 | 0.1254 | - | - | - | - | - |
859
+ | 0.1699 | 70 | 0.048 | - | - | - | - | - |
860
+ | 0.1941 | 80 | 0.0358 | - | - | - | - | - |
861
+ | 0.2184 | 90 | 0.0673 | - | - | - | - | - |
862
+ | 0.2427 | 100 | 0.049 | - | - | - | - | - |
863
+ | 0.2669 | 110 | 0.0222 | - | - | - | - | - |
864
+ | 0.2912 | 120 | 0.0657 | - | - | - | - | - |
865
+ | 0.3155 | 130 | 0.0878 | - | - | - | - | - |
866
+ | 0.3398 | 140 | 0.0396 | - | - | - | - | - |
867
+ | 0.3640 | 150 | 0.033 | - | - | - | - | - |
868
+ | 0.3883 | 160 | 0.0562 | - | - | - | - | - |
869
+ | 0.4126 | 170 | 0.0329 | - | - | - | - | - |
870
+ | 0.4368 | 180 | 0.0918 | - | - | - | - | - |
871
+ | 0.4611 | 190 | 0.0198 | - | - | - | - | - |
872
+ | 0.4854 | 200 | 0.0181 | - | - | - | - | - |
873
+ | 0.5096 | 210 | 0.0119 | - | - | - | - | - |
874
+ | 0.5339 | 220 | 0.0139 | - | - | - | - | - |
875
+ | 0.5582 | 230 | 0.057 | - | - | - | - | - |
876
+ | 0.5824 | 240 | 0.0293 | - | - | - | - | - |
877
+ | 0.6067 | 250 | 0.0482 | - | - | - | - | - |
878
+ | 0.6310 | 260 | 0.017 | - | - | - | - | - |
879
+ | 0.6552 | 270 | 0.0927 | - | - | - | - | - |
880
+ | 0.6795 | 280 | 0.0187 | - | - | - | - | - |
881
+ | 0.7038 | 290 | 0.0553 | - | - | - | - | - |
882
+ | 0.7280 | 300 | 0.015 | - | - | - | - | - |
883
+ | 0.7523 | 310 | 0.0438 | - | - | - | - | - |
884
+ | 0.7766 | 320 | 0.0087 | - | - | - | - | - |
885
+ | 0.8008 | 330 | 0.038 | - | - | - | - | - |
886
+ | 0.8251 | 340 | 0.0243 | - | - | - | - | - |
887
+ | 0.8494 | 350 | 0.015 | - | - | - | - | - |
888
+ | 0.8737 | 360 | 0.0199 | - | - | - | - | - |
889
+ | 0.8979 | 370 | 0.0516 | - | - | - | - | - |
890
+ | 0.9222 | 380 | 0.0561 | - | - | - | - | - |
891
+ | 0.9465 | 390 | 0.0851 | - | - | - | - | - |
892
+ | 0.9707 | 400 | 0.0394 | - | - | - | - | - |
893
+ | 0.9950 | 410 | 0.0114 | - | - | - | - | - |
894
+ | 0.9998 | 412 | - | 0.2806 | 0.2779 | 0.2742 | 0.2597 | 0.2253 |
895
+ | 1.0193 | 420 | 0.0136 | - | - | - | - | - |
896
+ | 1.0435 | 430 | 0.1219 | - | - | - | - | - |
897
+ | 1.0678 | 440 | 0.0164 | - | - | - | - | - |
898
+ | 1.0921 | 450 | 0.0927 | - | - | - | - | - |
899
+ | 1.1163 | 460 | 0.0268 | - | - | - | - | - |
900
+ | 1.1406 | 470 | 0.0384 | - | - | - | - | - |
901
+ | 1.1649 | 480 | 0.0034 | - | - | - | - | - |
902
+ | 1.1891 | 490 | 0.0183 | - | - | - | - | - |
903
+ | 1.2134 | 500 | 0.0594 | - | - | - | - | - |
904
+ | 1.2377 | 510 | 0.0145 | - | - | - | - | - |
905
+ | 1.2619 | 520 | 0.0768 | - | - | - | - | - |
906
+ | 1.2862 | 530 | 0.0084 | - | - | - | - | - |
907
+ | 1.3105 | 540 | 0.0528 | - | - | - | - | - |
908
+ | 1.3347 | 550 | 0.0619 | - | - | - | - | - |
909
+ | 1.3590 | 560 | 0.0326 | - | - | - | - | - |
910
+ | 1.3833 | 570 | 0.0135 | - | - | - | - | - |
911
+ | 1.4076 | 580 | 0.0143 | - | - | - | - | - |
912
+ | 1.4318 | 590 | 0.0952 | - | - | - | - | - |
913
+ | 1.4561 | 600 | 0.0188 | - | - | - | - | - |
914
+ | 1.4804 | 610 | 0.01 | - | - | - | - | - |
915
+ | 1.5046 | 620 | 0.091 | - | - | - | - | - |
916
+ | 1.5289 | 630 | 0.0205 | - | - | - | - | - |
917
+ | 1.5532 | 640 | 0.0156 | - | - | - | - | - |
918
+ | 1.5774 | 650 | 0.0101 | - | - | - | - | - |
919
+ | 1.6017 | 660 | 0.022 | - | - | - | - | - |
920
+ | 1.6260 | 670 | 0.0135 | - | - | - | - | - |
921
+ | 1.6502 | 680 | 0.0226 | - | - | - | - | - |
922
+ | 1.6745 | 690 | 0.0032 | - | - | - | - | - |
923
+ | 1.6988 | 700 | 0.0071 | - | - | - | - | - |
924
+ | 1.7230 | 710 | 0.028 | - | - | - | - | - |
925
+ | 1.7473 | 720 | 0.0351 | - | - | - | - | - |
926
+ | 1.7716 | 730 | 0.0021 | - | - | - | - | - |
927
+ | 1.7958 | 740 | 0.0073 | - | - | - | - | - |
928
+ | 1.8201 | 750 | 0.0103 | - | - | - | - | - |
929
+ | 1.8444 | 760 | 0.0219 | - | - | - | - | - |
930
+ | 1.8686 | 770 | 0.0035 | - | - | - | - | - |
931
+ | 1.8929 | 780 | 0.0579 | - | - | - | - | - |
932
+ | 1.9172 | 790 | 0.0298 | - | - | - | - | - |
933
+ | 1.9415 | 800 | 0.0076 | - | - | - | - | - |
934
+ | 1.9657 | 810 | 0.0038 | - | - | - | - | - |
935
+ | 1.9900 | 820 | 0.0016 | - | - | - | - | - |
936
+ | 1.9997 | 824 | - | 0.2945 | 0.2886 | 0.2856 | 0.2642 | 0.2411 |
937
+ | 2.0143 | 830 | 0.0715 | - | - | - | - | - |
938
+ | 2.0385 | 840 | 0.0021 | - | - | - | - | - |
939
+ | 2.0628 | 850 | 0.0065 | - | - | - | - | - |
940
+ | 2.0871 | 860 | 0.0105 | - | - | - | - | - |
941
+ | 2.1113 | 870 | 0.0024 | - | - | - | - | - |
942
+ | 2.1356 | 880 | 0.0025 | - | - | - | - | - |
943
+ | 2.1599 | 890 | 0.014 | - | - | - | - | - |
944
+ | 2.1841 | 900 | 0.0016 | - | - | - | - | - |
945
+ | 2.2084 | 910 | 0.008 | - | - | - | - | - |
946
+ | 2.2327 | 920 | 0.0041 | - | - | - | - | - |
947
+ | 2.2569 | 930 | 0.0308 | - | - | - | - | - |
948
+ | 2.2812 | 940 | 0.011 | - | - | - | - | - |
949
+ | 2.3055 | 950 | 0.0207 | - | - | - | - | - |
950
+ | 2.3297 | 960 | 0.0048 | - | - | - | - | - |
951
+ | 2.3540 | 970 | 0.0215 | - | - | - | - | - |
952
+ | 2.3783 | 980 | 0.0061 | - | - | - | - | - |
953
+ | 2.4025 | 990 | 0.0164 | - | - | - | - | - |
954
+ | 2.4268 | 1000 | 0.0255 | - | - | - | - | - |
955
+ | 2.4511 | 1010 | 0.0062 | - | - | - | - | - |
956
+ | 2.4754 | 1020 | 0.0079 | - | - | - | - | - |
957
+ | 2.4996 | 1030 | 0.005 | - | - | - | - | - |
958
+ | 2.5239 | 1040 | 0.042 | - | - | - | - | - |
959
+ | 2.5482 | 1050 | 0.0057 | - | - | - | - | - |
960
+ | 2.5724 | 1060 | 0.0384 | - | - | - | - | - |
961
+ | 2.5967 | 1070 | 0.009 | - | - | - | - | - |
962
+ | 2.6210 | 1080 | 0.0089 | - | - | - | - | - |
963
+ | 2.6452 | 1090 | 0.0034 | - | - | - | - | - |
964
+ | 2.6695 | 1100 | 0.026 | - | - | - | - | - |
965
+ | 2.6938 | 1110 | 0.0358 | - | - | - | - | - |
966
+ | 2.7180 | 1120 | 0.0033 | - | - | - | - | - |
967
+ | 2.7423 | 1130 | 0.0037 | - | - | - | - | - |
968
+ | 2.7666 | 1140 | 0.0195 | - | - | - | - | - |
969
+ | 2.7908 | 1150 | 0.0024 | - | - | - | - | - |
970
+ | 2.8151 | 1160 | 0.0533 | - | - | - | - | - |
971
+ | 2.8394 | 1170 | 0.0137 | - | - | - | - | - |
972
+ | 2.8636 | 1180 | 0.0125 | - | - | - | - | - |
973
+ | 2.8879 | 1190 | 0.0253 | - | - | - | - | - |
974
+ | 2.9122 | 1200 | 0.0068 | - | - | - | - | - |
975
+ | 2.9364 | 1210 | 0.0436 | - | - | - | - | - |
976
+ | 2.9607 | 1220 | 0.0021 | - | - | - | - | - |
977
+ | 2.9850 | 1230 | 0.0129 | - | - | - | - | - |
978
+ | 2.9995 | 1236 | - | 0.2986 | 0.2955 | 0.2842 | 0.2749 | 0.2512 |
979
+ | 3.0093 | 1240 | 0.0037 | - | - | - | - | - |
980
+ | 3.0335 | 1250 | 0.0161 | - | - | - | - | - |
981
+ | 3.0578 | 1260 | 0.0164 | - | - | - | - | - |
982
+ | 3.0821 | 1270 | 0.0007 | - | - | - | - | - |
983
+ | 3.1063 | 1280 | 0.0023 | - | - | - | - | - |
984
+ | 3.1306 | 1290 | 0.0073 | - | - | - | - | - |
985
+ | 3.1549 | 1300 | 0.0134 | - | - | - | - | - |
986
+ | 3.1791 | 1310 | 0.0021 | - | - | - | - | - |
987
+ | 3.2034 | 1320 | 0.0571 | - | - | - | - | - |
988
+ | 3.2277 | 1330 | 0.0376 | - | - | - | - | - |
989
+ | 3.2519 | 1340 | 0.0049 | - | - | - | - | - |
990
+ | 3.2762 | 1350 | 0.0151 | - | - | - | - | - |
991
+ | 3.3005 | 1360 | 0.002 | - | - | - | - | - |
992
+ | 3.3247 | 1370 | 0.0276 | - | - | - | - | - |
993
+ | 3.3490 | 1380 | 0.0007 | - | - | - | - | - |
994
+ | 3.3733 | 1390 | 0.0324 | - | - | - | - | - |
995
+ | 3.3975 | 1400 | 0.0043 | - | - | - | - | - |
996
+ | 3.4218 | 1410 | 0.0074 | - | - | - | - | - |
997
+ | 3.4461 | 1420 | 0.005 | - | - | - | - | - |
998
+ | 3.4703 | 1430 | 0.0066 | - | - | - | - | - |
999
+ | 3.4946 | 1440 | 0.0039 | - | - | - | - | - |
1000
+ | 3.5189 | 1450 | 0.0056 | - | - | - | - | - |
1001
+ | 3.5432 | 1460 | 0.0039 | - | - | - | - | - |
1002
+ | 3.5674 | 1470 | 0.0148 | - | - | - | - | - |
1003
+ | 3.5917 | 1480 | 0.0029 | - | - | - | - | - |
1004
+ | 3.6160 | 1490 | 0.011 | - | - | - | - | - |
1005
+ | 3.6402 | 1500 | 0.0029 | - | - | - | - | - |
1006
+ | 3.6645 | 1510 | 0.0057 | - | - | - | - | - |
1007
+ | 3.6888 | 1520 | 0.0013 | - | - | - | - | - |
1008
+ | 3.7130 | 1530 | 0.0618 | - | - | - | - | - |
1009
+ | 3.7373 | 1540 | 0.0102 | - | - | - | - | - |
1010
+ | 3.7616 | 1550 | 0.0009 | - | - | - | - | - |
1011
+ | 3.7858 | 1560 | 0.023 | - | - | - | - | - |
1012
+ | 3.8101 | 1570 | 0.0067 | - | - | - | - | - |
1013
+ | 3.8344 | 1580 | 0.011 | - | - | - | - | - |
1014
+ | 3.8586 | 1590 | 0.0023 | - | - | - | - | - |
1015
+ | 3.8829 | 1600 | 0.0154 | - | - | - | - | - |
1016
+ | 3.9072 | 1610 | 0.0014 | - | - | - | - | - |
1017
+ | 3.9314 | 1620 | 0.0024 | - | - | - | - | - |
1018
+ | 3.9557 | 1630 | 0.0034 | - | - | - | - | - |
1019
+ | 3.9800 | 1640 | 0.0022 | - | - | - | - | - |
1020
+ | 3.9994 | 1648 | - | 0.3000 | 0.2938 | 0.2877 | 0.2752 | 0.2547 |
1021
+
1022
+ </details>
1023
+
1024
+ ### Framework Versions
1025
+ - Python: 3.11.11
1026
+ - Sentence Transformers: 3.4.1
1027
+ - Transformers: 4.43.0
1028
+ - PyTorch: 2.6.0+cu124
1029
+ - Accelerate: 1.3.0
1030
+ - Datasets: 3.3.2
1031
+ - Tokenizers: 0.19.1
1032
+
1033
+ ## Citation
1034
+
1035
+ ### BibTeX
1036
+
1037
+ #### Sentence Transformers
1038
+ ```bibtex
1039
+ @inproceedings{reimers-2019-sentence-bert,
1040
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
1041
+ author = "Reimers, Nils and Gurevych, Iryna",
1042
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
1043
+ month = "11",
1044
+ year = "2019",
1045
+ publisher = "Association for Computational Linguistics",
1046
+ url = "https://arxiv.org/abs/1908.10084",
1047
+ }
1048
+ ```
1049
+
1050
+ #### MatryoshkaLoss
1051
+ ```bibtex
1052
+ @misc{kusupati2024matryoshka,
1053
+ title={Matryoshka Representation Learning},
1054
+ author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
1055
+ year={2024},
1056
+ eprint={2205.13147},
1057
+ archivePrefix={arXiv},
1058
+ primaryClass={cs.LG}
1059
+ }
1060
+ ```
1061
+
1062
+ #### MultipleNegativesRankingLoss
1063
+ ```bibtex
1064
+ @misc{henderson2017efficient,
1065
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
1066
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
1067
+ year={2017},
1068
+ eprint={1705.00652},
1069
+ archivePrefix={arXiv},
1070
+ primaryClass={cs.CL}
1071
+ }
1072
+ ```
1073
+
1074
+ <!--
1075
+ ## Glossary
1076
+
1077
+ *Clearly define terms in order to be accessible across audiences.*
1078
+ -->
1079
+
1080
+ <!--
1081
+ ## Model Card Authors
1082
+
1083
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
1084
+ -->
1085
+
1086
+ <!--
1087
+ ## Model Card Contact
1088
+
1089
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
1090
+ -->
checkpoint-1648/config.json ADDED
@@ -0,0 +1,74 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "nomic-ai/nomic-embed-text-v2-moe",
3
+ "activation_function": "gelu",
4
+ "add_pooling_layer": false,
5
+ "architectures": [
6
+ "NomicBertModel"
7
+ ],
8
+ "attn_pdrop": 0.0,
9
+ "auto_map": {
10
+ "AutoConfig": "nomic-ai/nomic-bert-2048--configuration_hf_nomic_bert.NomicBertConfig",
11
+ "AutoModel": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertModel",
12
+ "AutoModelForMaskedLM": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForPreTraining",
13
+ "AutoModelForMultipleChoice": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForMultipleChoice",
14
+ "AutoModelForQuestionAnswering": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForQuestionAnswering",
15
+ "AutoModelForSequenceClassification": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForSequenceClassification",
16
+ "AutoModelForTokenClassification": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForTokenClassification"
17
+ },
18
+ "bos_token_id": null,
19
+ "causal": false,
20
+ "dense_seq_output": true,
21
+ "embd_pdrop": 0.1,
22
+ "eos_token_id": null,
23
+ "expert_choice_router": false,
24
+ "ffn_div": 1,
25
+ "fused_bias_fc": true,
26
+ "fused_dropout_add_ln": true,
27
+ "initializer_range": 0.02,
28
+ "layer_norm_epsilon": 1e-05,
29
+ "max_trained_positions": 2048,
30
+ "mlp_fc1_bias": true,
31
+ "mlp_fc2_bias": true,
32
+ "model_type": "nomic_bert",
33
+ "moe_every_n_layers": 2,
34
+ "moe_impl": "megablocks",
35
+ "moe_normalize_expert_weights": false,
36
+ "moe_resid_pdrop": 0.0,
37
+ "moe_top_k": 2,
38
+ "n_embd": 768,
39
+ "n_head": 12,
40
+ "n_inner": 3072,
41
+ "n_layer": 12,
42
+ "n_positions": 2048,
43
+ "num_experts": 8,
44
+ "num_shared_experts": 0,
45
+ "pad_token_id": 1,
46
+ "pad_vocab_size_multiple": 64,
47
+ "parallel_block": false,
48
+ "parallel_block_tied_norm": false,
49
+ "prenorm": false,
50
+ "qkv_proj_bias": true,
51
+ "reorder_and_upcast_attn": false,
52
+ "resid_pdrop": 0.0,
53
+ "rotary_emb_base": 10000,
54
+ "rotary_emb_fraction": 1.0,
55
+ "rotary_emb_interleaved": false,
56
+ "rotary_emb_scale_base": null,
57
+ "rotary_scaling_factor": null,
58
+ "router_aux_loss_coef": 0.1,
59
+ "scale_attn_by_inverse_layer_idx": false,
60
+ "scale_attn_weights": true,
61
+ "summary_activation": null,
62
+ "summary_first_dropout": 0.1,
63
+ "summary_proj_to_labels": true,
64
+ "summary_type": "cls_index",
65
+ "summary_use_proj": true,
66
+ "torch_dtype": "float32",
67
+ "transformers_version": "4.43.0",
68
+ "type_vocab_size": 1,
69
+ "use_cache": true,
70
+ "use_flash_attn": true,
71
+ "use_rms_norm": null,
72
+ "use_xentropy": true,
73
+ "vocab_size": 250048
74
+ }
checkpoint-1648/config_sentence_transformers.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.4.1",
4
+ "transformers": "4.43.0",
5
+ "pytorch": "2.6.0+cu124"
6
+ },
7
+ "prompts": {
8
+ "query": "search_query: ",
9
+ "passage": "search_document: ",
10
+ "Classification": "classification: ",
11
+ "MultilabelClassification": "classification: ",
12
+ "Clustering": "clustering: ",
13
+ "PairClassification": "classification: ",
14
+ "STS": "classification: ",
15
+ "Summarization": "classification: ",
16
+ "Speed": "search_document: "
17
+ },
18
+ "default_prompt_name": null,
19
+ "similarity_fn_name": "cosine"
20
+ }
checkpoint-1648/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:ee11369a5447fcd4949eae2793e3b88b867e1c80cd0ffbd764089500e3a62aa5
3
+ size 1901187232
checkpoint-1648/modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
checkpoint-1648/optimizer.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:aa2be7f6d47529351a1c2ce91ee9d218e3574c86828d1a3906a456032b359163
3
+ size 3802469370
checkpoint-1648/rng_state.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:ae737c9b599a4e1c58e333b4550319a527b201b0662f6d4f5ff20fc26ebcee0f
3
+ size 14244
checkpoint-1648/scheduler.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:22db1da62f9cbf355c11a9c7ab5e56a360cd75d32c539104bcfcfe0c3b8df122
3
+ size 1064
checkpoint-1648/sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
checkpoint-1648/sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
checkpoint-1648/special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
checkpoint-1648/tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
3
+ size 17082987
checkpoint-1648/tokenizer_config.json ADDED
@@ -0,0 +1,54 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "mask_token": "<mask>",
49
+ "model_max_length": 512,
50
+ "pad_token": "<pad>",
51
+ "sep_token": "</s>",
52
+ "tokenizer_class": "XLMRobertaTokenizer",
53
+ "unk_token": "<unk>"
54
+ }
checkpoint-1648/trainer_state.json ADDED
@@ -0,0 +1,1513 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "best_metric": 0.27519563194479246,
3
+ "best_model_checkpoint": "Nomic/nomic-v2-tuned-1/checkpoint-1648",
4
+ "epoch": 3.999393295919915,
5
+ "eval_steps": 500,
6
+ "global_step": 1648,
7
+ "is_hyper_param_search": false,
8
+ "is_local_process_zero": true,
9
+ "is_world_process_zero": true,
10
+ "log_history": [
11
+ {
12
+ "epoch": 0.024268163203397544,
13
+ "grad_norm": 6.184824466705322,
14
+ "learning_rate": 1.2121212121212122e-06,
15
+ "loss": 0.2108,
16
+ "step": 10
17
+ },
18
+ {
19
+ "epoch": 0.04853632640679509,
20
+ "grad_norm": 7.719327449798584,
21
+ "learning_rate": 2.4242424242424244e-06,
22
+ "loss": 0.1169,
23
+ "step": 20
24
+ },
25
+ {
26
+ "epoch": 0.07280448961019263,
27
+ "grad_norm": 4.0327959060668945,
28
+ "learning_rate": 3.6363636363636366e-06,
29
+ "loss": 0.1334,
30
+ "step": 30
31
+ },
32
+ {
33
+ "epoch": 0.09707265281359018,
34
+ "grad_norm": 5.168394088745117,
35
+ "learning_rate": 4.848484848484849e-06,
36
+ "loss": 0.0963,
37
+ "step": 40
38
+ },
39
+ {
40
+ "epoch": 0.12134081601698772,
41
+ "grad_norm": 14.108105659484863,
42
+ "learning_rate": 6.060606060606061e-06,
43
+ "loss": 0.127,
44
+ "step": 50
45
+ },
46
+ {
47
+ "epoch": 0.14560897922038527,
48
+ "grad_norm": 0.29993921518325806,
49
+ "learning_rate": 7.272727272727273e-06,
50
+ "loss": 0.1254,
51
+ "step": 60
52
+ },
53
+ {
54
+ "epoch": 0.1698771424237828,
55
+ "grad_norm": 1.5108305215835571,
56
+ "learning_rate": 8.484848484848486e-06,
57
+ "loss": 0.048,
58
+ "step": 70
59
+ },
60
+ {
61
+ "epoch": 0.19414530562718035,
62
+ "grad_norm": 2.570068836212158,
63
+ "learning_rate": 9.696969696969698e-06,
64
+ "loss": 0.0358,
65
+ "step": 80
66
+ },
67
+ {
68
+ "epoch": 0.21841346883057788,
69
+ "grad_norm": 13.097607612609863,
70
+ "learning_rate": 1.0909090909090909e-05,
71
+ "loss": 0.0673,
72
+ "step": 90
73
+ },
74
+ {
75
+ "epoch": 0.24268163203397544,
76
+ "grad_norm": 4.809088230133057,
77
+ "learning_rate": 1.2121212121212122e-05,
78
+ "loss": 0.049,
79
+ "step": 100
80
+ },
81
+ {
82
+ "epoch": 0.26694979523737294,
83
+ "grad_norm": 0.4637127220630646,
84
+ "learning_rate": 1.3333333333333333e-05,
85
+ "loss": 0.0222,
86
+ "step": 110
87
+ },
88
+ {
89
+ "epoch": 0.29121795844077053,
90
+ "grad_norm": 3.315945625305176,
91
+ "learning_rate": 1.4545454545454546e-05,
92
+ "loss": 0.0657,
93
+ "step": 120
94
+ },
95
+ {
96
+ "epoch": 0.31548612164416806,
97
+ "grad_norm": 1.816904067993164,
98
+ "learning_rate": 1.575757575757576e-05,
99
+ "loss": 0.0878,
100
+ "step": 130
101
+ },
102
+ {
103
+ "epoch": 0.3397542848475656,
104
+ "grad_norm": 0.5492209792137146,
105
+ "learning_rate": 1.6969696969696972e-05,
106
+ "loss": 0.0396,
107
+ "step": 140
108
+ },
109
+ {
110
+ "epoch": 0.3640224480509631,
111
+ "grad_norm": 0.6514124274253845,
112
+ "learning_rate": 1.8181818181818182e-05,
113
+ "loss": 0.033,
114
+ "step": 150
115
+ },
116
+ {
117
+ "epoch": 0.3882906112543607,
118
+ "grad_norm": 0.20525218546390533,
119
+ "learning_rate": 1.9393939393939395e-05,
120
+ "loss": 0.0562,
121
+ "step": 160
122
+ },
123
+ {
124
+ "epoch": 0.41255877445775824,
125
+ "grad_norm": 12.202320098876953,
126
+ "learning_rate": 1.999943905097692e-05,
127
+ "loss": 0.0329,
128
+ "step": 170
129
+ },
130
+ {
131
+ "epoch": 0.43682693766115577,
132
+ "grad_norm": 7.067898273468018,
133
+ "learning_rate": 1.9994951836381796e-05,
134
+ "loss": 0.0918,
135
+ "step": 180
136
+ },
137
+ {
138
+ "epoch": 0.4610951008645533,
139
+ "grad_norm": 0.13020876049995422,
140
+ "learning_rate": 1.998597942081397e-05,
141
+ "loss": 0.0198,
142
+ "step": 190
143
+ },
144
+ {
145
+ "epoch": 0.4853632640679509,
146
+ "grad_norm": 0.3073924779891968,
147
+ "learning_rate": 1.9972525830614725e-05,
148
+ "loss": 0.0181,
149
+ "step": 200
150
+ },
151
+ {
152
+ "epoch": 0.5096314272713484,
153
+ "grad_norm": 0.40409696102142334,
154
+ "learning_rate": 1.9954597103037342e-05,
155
+ "loss": 0.0119,
156
+ "step": 210
157
+ },
158
+ {
159
+ "epoch": 0.5338995904747459,
160
+ "grad_norm": 2.918846845626831,
161
+ "learning_rate": 1.9932201283537935e-05,
162
+ "loss": 0.0139,
163
+ "step": 220
164
+ },
165
+ {
166
+ "epoch": 0.5581677536781435,
167
+ "grad_norm": 8.526318550109863,
168
+ "learning_rate": 1.9905348422165075e-05,
169
+ "loss": 0.057,
170
+ "step": 230
171
+ },
172
+ {
173
+ "epoch": 0.5824359168815411,
174
+ "grad_norm": 10.81310749053955,
175
+ "learning_rate": 1.987405056904986e-05,
176
+ "loss": 0.0293,
177
+ "step": 240
178
+ },
179
+ {
180
+ "epoch": 0.6067040800849386,
181
+ "grad_norm": 0.8693222999572754,
182
+ "learning_rate": 1.9838321768998462e-05,
183
+ "loss": 0.0482,
184
+ "step": 250
185
+ },
186
+ {
187
+ "epoch": 0.6309722432883361,
188
+ "grad_norm": 5.930874347686768,
189
+ "learning_rate": 1.9798178055189563e-05,
190
+ "loss": 0.017,
191
+ "step": 260
192
+ },
193
+ {
194
+ "epoch": 0.6552404064917337,
195
+ "grad_norm": 4.582831859588623,
196
+ "learning_rate": 1.9753637441979533e-05,
197
+ "loss": 0.0927,
198
+ "step": 270
199
+ },
200
+ {
201
+ "epoch": 0.6795085696951312,
202
+ "grad_norm": 0.19732092320919037,
203
+ "learning_rate": 1.970471991681853e-05,
204
+ "loss": 0.0187,
205
+ "step": 280
206
+ },
207
+ {
208
+ "epoch": 0.7037767328985287,
209
+ "grad_norm": 0.7359830141067505,
210
+ "learning_rate": 1.9651447431281213e-05,
211
+ "loss": 0.0553,
212
+ "step": 290
213
+ },
214
+ {
215
+ "epoch": 0.7280448961019262,
216
+ "grad_norm": 0.4606100618839264,
217
+ "learning_rate": 1.9593843891216035e-05,
218
+ "loss": 0.015,
219
+ "step": 300
220
+ },
221
+ {
222
+ "epoch": 0.7523130593053239,
223
+ "grad_norm": 0.9894680380821228,
224
+ "learning_rate": 1.9531935146017595e-05,
225
+ "loss": 0.0438,
226
+ "step": 310
227
+ },
228
+ {
229
+ "epoch": 0.7765812225087214,
230
+ "grad_norm": 0.13739630579948425,
231
+ "learning_rate": 1.9465748977026782e-05,
232
+ "loss": 0.0087,
233
+ "step": 320
234
+ },
235
+ {
236
+ "epoch": 0.8008493857121189,
237
+ "grad_norm": 0.3315618336200714,
238
+ "learning_rate": 1.9395315085064007e-05,
239
+ "loss": 0.038,
240
+ "step": 330
241
+ },
242
+ {
243
+ "epoch": 0.8251175489155165,
244
+ "grad_norm": 0.17197982966899872,
245
+ "learning_rate": 1.9320665077101066e-05,
246
+ "loss": 0.0243,
247
+ "step": 340
248
+ },
249
+ {
250
+ "epoch": 0.849385712118914,
251
+ "grad_norm": 4.819814682006836,
252
+ "learning_rate": 1.92418324520776e-05,
253
+ "loss": 0.015,
254
+ "step": 350
255
+ },
256
+ {
257
+ "epoch": 0.8736538753223115,
258
+ "grad_norm": 4.6382365226745605,
259
+ "learning_rate": 1.9158852585868575e-05,
260
+ "loss": 0.0199,
261
+ "step": 360
262
+ },
263
+ {
264
+ "epoch": 0.8979220385257091,
265
+ "grad_norm": 0.15649013221263885,
266
+ "learning_rate": 1.9071762715409474e-05,
267
+ "loss": 0.0516,
268
+ "step": 370
269
+ },
270
+ {
271
+ "epoch": 0.9221902017291066,
272
+ "grad_norm": 9.212163925170898,
273
+ "learning_rate": 1.8980601921986332e-05,
274
+ "loss": 0.0561,
275
+ "step": 380
276
+ },
277
+ {
278
+ "epoch": 0.9464583649325041,
279
+ "grad_norm": 1.8409303426742554,
280
+ "learning_rate": 1.888541111369816e-05,
281
+ "loss": 0.0851,
282
+ "step": 390
283
+ },
284
+ {
285
+ "epoch": 0.9707265281359018,
286
+ "grad_norm": 0.0260617733001709,
287
+ "learning_rate": 1.878623300709957e-05,
288
+ "loss": 0.0394,
289
+ "step": 400
290
+ },
291
+ {
292
+ "epoch": 0.9949946913392993,
293
+ "grad_norm": 0.475887656211853,
294
+ "learning_rate": 1.8683112108031856e-05,
295
+ "loss": 0.0114,
296
+ "step": 410
297
+ },
298
+ {
299
+ "epoch": 0.9998483239799788,
300
+ "eval_dim_128_cosine_accuracy@1": 0.0034106412005457027,
301
+ "eval_dim_128_cosine_accuracy@10": 0.6609822646657572,
302
+ "eval_dim_128_cosine_accuracy@3": 0.06207366984993179,
303
+ "eval_dim_128_cosine_accuracy@5": 0.35129604365620737,
304
+ "eval_dim_128_cosine_map@100": 0.15352648780478836,
305
+ "eval_dim_128_cosine_mrr@10": 0.1384457762186259,
306
+ "eval_dim_128_cosine_ndcg@10": 0.25968761539611496,
307
+ "eval_dim_128_cosine_precision@1": 0.0034106412005457027,
308
+ "eval_dim_128_cosine_precision@10": 0.06609822646657572,
309
+ "eval_dim_128_cosine_precision@3": 0.020691223283310592,
310
+ "eval_dim_128_cosine_precision@5": 0.07025920873124147,
311
+ "eval_dim_128_cosine_recall@1": 0.0034106412005457027,
312
+ "eval_dim_128_cosine_recall@10": 0.6609822646657572,
313
+ "eval_dim_128_cosine_recall@3": 0.06207366984993179,
314
+ "eval_dim_128_cosine_recall@5": 0.35129604365620737,
315
+ "eval_dim_256_cosine_accuracy@1": 0.006139154160982265,
316
+ "eval_dim_256_cosine_accuracy@10": 0.6957708049113234,
317
+ "eval_dim_256_cosine_accuracy@3": 0.059345156889495224,
318
+ "eval_dim_256_cosine_accuracy@5": 0.3969986357435198,
319
+ "eval_dim_256_cosine_map@100": 0.1608969666312337,
320
+ "eval_dim_256_cosine_mrr@10": 0.14680563676129663,
321
+ "eval_dim_256_cosine_ndcg@10": 0.2742190784977125,
322
+ "eval_dim_256_cosine_precision@1": 0.006139154160982265,
323
+ "eval_dim_256_cosine_precision@10": 0.06957708049113233,
324
+ "eval_dim_256_cosine_precision@3": 0.019781718963165072,
325
+ "eval_dim_256_cosine_precision@5": 0.07939972714870396,
326
+ "eval_dim_256_cosine_recall@1": 0.006139154160982265,
327
+ "eval_dim_256_cosine_recall@10": 0.6957708049113234,
328
+ "eval_dim_256_cosine_recall@3": 0.059345156889495224,
329
+ "eval_dim_256_cosine_recall@5": 0.3969986357435198,
330
+ "eval_dim_512_cosine_accuracy@1": 0.004092769440654843,
331
+ "eval_dim_512_cosine_accuracy@10": 0.708731241473397,
332
+ "eval_dim_512_cosine_accuracy@3": 0.054570259208731244,
333
+ "eval_dim_512_cosine_accuracy@5": 0.4045020463847203,
334
+ "eval_dim_512_cosine_map@100": 0.16179009192949412,
335
+ "eval_dim_512_cosine_mrr@10": 0.14763068710885704,
336
+ "eval_dim_512_cosine_ndcg@10": 0.2778537691360626,
337
+ "eval_dim_512_cosine_precision@1": 0.004092769440654843,
338
+ "eval_dim_512_cosine_precision@10": 0.07087312414733969,
339
+ "eval_dim_512_cosine_precision@3": 0.01819008640291041,
340
+ "eval_dim_512_cosine_precision@5": 0.08090040927694407,
341
+ "eval_dim_512_cosine_recall@1": 0.004092769440654843,
342
+ "eval_dim_512_cosine_recall@10": 0.708731241473397,
343
+ "eval_dim_512_cosine_recall@3": 0.054570259208731244,
344
+ "eval_dim_512_cosine_recall@5": 0.4045020463847203,
345
+ "eval_dim_64_cosine_accuracy@1": 0.004092769440654843,
346
+ "eval_dim_64_cosine_accuracy@10": 0.5750341064120055,
347
+ "eval_dim_64_cosine_accuracy@3": 0.048431105047748974,
348
+ "eval_dim_64_cosine_accuracy@5": 0.3144611186903138,
349
+ "eval_dim_64_cosine_map@100": 0.1367884100889619,
350
+ "eval_dim_64_cosine_mrr@10": 0.11982692349336187,
351
+ "eval_dim_64_cosine_ndcg@10": 0.2252854715830182,
352
+ "eval_dim_64_cosine_precision@1": 0.004092769440654843,
353
+ "eval_dim_64_cosine_precision@10": 0.05750341064120054,
354
+ "eval_dim_64_cosine_precision@3": 0.01614370168258299,
355
+ "eval_dim_64_cosine_precision@5": 0.06289222373806276,
356
+ "eval_dim_64_cosine_recall@1": 0.004092769440654843,
357
+ "eval_dim_64_cosine_recall@10": 0.5750341064120055,
358
+ "eval_dim_64_cosine_recall@3": 0.048431105047748974,
359
+ "eval_dim_64_cosine_recall@5": 0.3144611186903138,
360
+ "eval_dim_768_cosine_accuracy@1": 0.002728512960436562,
361
+ "eval_dim_768_cosine_accuracy@10": 0.7175989085948158,
362
+ "eval_dim_768_cosine_accuracy@3": 0.059345156889495224,
363
+ "eval_dim_768_cosine_accuracy@5": 0.40109140518417463,
364
+ "eval_dim_768_cosine_map@100": 0.1621927494042191,
365
+ "eval_dim_768_cosine_mrr@10": 0.1485466878884321,
366
+ "eval_dim_768_cosine_ndcg@10": 0.2805856733257871,
367
+ "eval_dim_768_cosine_precision@1": 0.002728512960436562,
368
+ "eval_dim_768_cosine_precision@10": 0.07175989085948158,
369
+ "eval_dim_768_cosine_precision@3": 0.019781718963165072,
370
+ "eval_dim_768_cosine_precision@5": 0.08021828103683493,
371
+ "eval_dim_768_cosine_recall@1": 0.002728512960436562,
372
+ "eval_dim_768_cosine_recall@10": 0.7175989085948158,
373
+ "eval_dim_768_cosine_recall@3": 0.059345156889495224,
374
+ "eval_dim_768_cosine_recall@5": 0.40109140518417463,
375
+ "eval_runtime": 311.6214,
376
+ "eval_samples_per_second": 0.0,
377
+ "eval_sequential_score": 0.2252854715830182,
378
+ "eval_steps_per_second": 0.0,
379
+ "step": 412
380
+ },
381
+ {
382
+ "epoch": 1.0192628545426967,
383
+ "grad_norm": 0.07392042130231857,
384
+ "learning_rate": 1.8576094691651153e-05,
385
+ "loss": 0.0136,
386
+ "step": 420
387
+ },
388
+ {
389
+ "epoch": 1.0435310177460944,
390
+ "grad_norm": 3.5508384704589844,
391
+ "learning_rate": 1.8465228781662618e-05,
392
+ "loss": 0.1219,
393
+ "step": 430
394
+ },
395
+ {
396
+ "epoch": 1.0677991809494918,
397
+ "grad_norm": 5.711903095245361,
398
+ "learning_rate": 1.8350564128769955e-05,
399
+ "loss": 0.0164,
400
+ "step": 440
401
+ },
402
+ {
403
+ "epoch": 1.0920673441528894,
404
+ "grad_norm": 1.1452428102493286,
405
+ "learning_rate": 1.8232152188349946e-05,
406
+ "loss": 0.0927,
407
+ "step": 450
408
+ },
409
+ {
410
+ "epoch": 1.116335507356287,
411
+ "grad_norm": 1.4943727254867554,
412
+ "learning_rate": 1.8110046097362033e-05,
413
+ "loss": 0.0268,
414
+ "step": 460
415
+ },
416
+ {
417
+ "epoch": 1.1406036705596845,
418
+ "grad_norm": 1.8914352655410767,
419
+ "learning_rate": 1.7984300650503282e-05,
420
+ "loss": 0.0384,
421
+ "step": 470
422
+ },
423
+ {
424
+ "epoch": 1.1648718337630821,
425
+ "grad_norm": 0.11347553879022598,
426
+ "learning_rate": 1.7854972275619453e-05,
427
+ "loss": 0.0034,
428
+ "step": 480
429
+ },
430
+ {
431
+ "epoch": 1.1891399969664795,
432
+ "grad_norm": 8.961676597595215,
433
+ "learning_rate": 1.772211900838318e-05,
434
+ "loss": 0.0183,
435
+ "step": 490
436
+ },
437
+ {
438
+ "epoch": 1.2134081601698772,
439
+ "grad_norm": 21.69032096862793,
440
+ "learning_rate": 1.758580046625068e-05,
441
+ "loss": 0.0594,
442
+ "step": 500
443
+ },
444
+ {
445
+ "epoch": 1.2376763233732746,
446
+ "grad_norm": 3.1777877807617188,
447
+ "learning_rate": 1.7446077821708596e-05,
448
+ "loss": 0.0145,
449
+ "step": 510
450
+ },
451
+ {
452
+ "epoch": 1.2619444865766722,
453
+ "grad_norm": 1.400813102722168,
454
+ "learning_rate": 1.730301377482307e-05,
455
+ "loss": 0.0768,
456
+ "step": 520
457
+ },
458
+ {
459
+ "epoch": 1.2862126497800697,
460
+ "grad_norm": 0.12172400206327438,
461
+ "learning_rate": 1.715667252510329e-05,
462
+ "loss": 0.0084,
463
+ "step": 530
464
+ },
465
+ {
466
+ "epoch": 1.3104808129834673,
467
+ "grad_norm": 0.021951694041490555,
468
+ "learning_rate": 1.700711974269218e-05,
469
+ "loss": 0.0528,
470
+ "step": 540
471
+ },
472
+ {
473
+ "epoch": 1.334748976186865,
474
+ "grad_norm": 0.030643614009022713,
475
+ "learning_rate": 1.6854422538897136e-05,
476
+ "loss": 0.0619,
477
+ "step": 550
478
+ },
479
+ {
480
+ "epoch": 1.3590171393902624,
481
+ "grad_norm": 4.491604804992676,
482
+ "learning_rate": 1.6698649436074063e-05,
483
+ "loss": 0.0326,
484
+ "step": 560
485
+ },
486
+ {
487
+ "epoch": 1.38328530259366,
488
+ "grad_norm": 0.42146193981170654,
489
+ "learning_rate": 1.65398703368782e-05,
490
+ "loss": 0.0135,
491
+ "step": 570
492
+ },
493
+ {
494
+ "epoch": 1.4075534657970574,
495
+ "grad_norm": 0.09300685673952103,
496
+ "learning_rate": 1.6378156492895524e-05,
497
+ "loss": 0.0143,
498
+ "step": 580
499
+ },
500
+ {
501
+ "epoch": 1.431821629000455,
502
+ "grad_norm": 2.0742526054382324,
503
+ "learning_rate": 1.6213580472668856e-05,
504
+ "loss": 0.0952,
505
+ "step": 590
506
+ },
507
+ {
508
+ "epoch": 1.4560897922038527,
509
+ "grad_norm": 2.740499973297119,
510
+ "learning_rate": 1.604621612913297e-05,
511
+ "loss": 0.0188,
512
+ "step": 600
513
+ },
514
+ {
515
+ "epoch": 1.4803579554072501,
516
+ "grad_norm": 0.09577389806509018,
517
+ "learning_rate": 1.5876138566473327e-05,
518
+ "loss": 0.01,
519
+ "step": 610
520
+ },
521
+ {
522
+ "epoch": 1.5046261186106475,
523
+ "grad_norm": 1.9737666845321655,
524
+ "learning_rate": 1.5703424106423335e-05,
525
+ "loss": 0.091,
526
+ "step": 620
527
+ },
528
+ {
529
+ "epoch": 1.5288942818140452,
530
+ "grad_norm": 0.018516847863793373,
531
+ "learning_rate": 1.5528150254015225e-05,
532
+ "loss": 0.0205,
533
+ "step": 630
534
+ },
535
+ {
536
+ "epoch": 1.5531624450174428,
537
+ "grad_norm": 0.0974857360124588,
538
+ "learning_rate": 1.5350395662799925e-05,
539
+ "loss": 0.0156,
540
+ "step": 640
541
+ },
542
+ {
543
+ "epoch": 1.5774306082208402,
544
+ "grad_norm": 1.012096881866455,
545
+ "learning_rate": 1.5170240099551547e-05,
546
+ "loss": 0.0101,
547
+ "step": 650
548
+ },
549
+ {
550
+ "epoch": 1.6016987714242377,
551
+ "grad_norm": 0.4372600317001343,
552
+ "learning_rate": 1.4987764408472327e-05,
553
+ "loss": 0.022,
554
+ "step": 660
555
+ },
556
+ {
557
+ "epoch": 1.6259669346276353,
558
+ "grad_norm": 1.3607388734817505,
559
+ "learning_rate": 1.4803050474914034e-05,
560
+ "loss": 0.0135,
561
+ "step": 670
562
+ },
563
+ {
564
+ "epoch": 1.650235097831033,
565
+ "grad_norm": 0.1327061802148819,
566
+ "learning_rate": 1.4616181188632229e-05,
567
+ "loss": 0.0226,
568
+ "step": 680
569
+ },
570
+ {
571
+ "epoch": 1.6745032610344306,
572
+ "grad_norm": 0.31588563323020935,
573
+ "learning_rate": 1.4427240406589727e-05,
574
+ "loss": 0.0032,
575
+ "step": 690
576
+ },
577
+ {
578
+ "epoch": 1.698771424237828,
579
+ "grad_norm": 1.2134084701538086,
580
+ "learning_rate": 1.4236312915326108e-05,
581
+ "loss": 0.0071,
582
+ "step": 700
583
+ },
584
+ {
585
+ "epoch": 1.7230395874412254,
586
+ "grad_norm": 0.06816510111093521,
587
+ "learning_rate": 1.4043484392910014e-05,
588
+ "loss": 0.028,
589
+ "step": 710
590
+ },
591
+ {
592
+ "epoch": 1.747307750644623,
593
+ "grad_norm": 0.3962950110435486,
594
+ "learning_rate": 1.3848841370491416e-05,
595
+ "loss": 0.0351,
596
+ "step": 720
597
+ },
598
+ {
599
+ "epoch": 1.7715759138480207,
600
+ "grad_norm": 0.06974906474351883,
601
+ "learning_rate": 1.3652471193471049e-05,
602
+ "loss": 0.0021,
603
+ "step": 730
604
+ },
605
+ {
606
+ "epoch": 1.7958440770514181,
607
+ "grad_norm": 0.08050140738487244,
608
+ "learning_rate": 1.345446198230446e-05,
609
+ "loss": 0.0073,
610
+ "step": 740
611
+ },
612
+ {
613
+ "epoch": 1.8201122402548155,
614
+ "grad_norm": 0.04942511394619942,
615
+ "learning_rate": 1.3254902592958242e-05,
616
+ "loss": 0.0103,
617
+ "step": 750
618
+ },
619
+ {
620
+ "epoch": 1.8443804034582132,
621
+ "grad_norm": 0.17193569242954254,
622
+ "learning_rate": 1.3053882577036236e-05,
623
+ "loss": 0.0219,
624
+ "step": 760
625
+ },
626
+ {
627
+ "epoch": 1.8686485666616108,
628
+ "grad_norm": 0.011188509874045849,
629
+ "learning_rate": 1.2851492141593531e-05,
630
+ "loss": 0.0035,
631
+ "step": 770
632
+ },
633
+ {
634
+ "epoch": 1.8929167298650085,
635
+ "grad_norm": 21.107633590698242,
636
+ "learning_rate": 1.264782210865637e-05,
637
+ "loss": 0.0579,
638
+ "step": 780
639
+ },
640
+ {
641
+ "epoch": 1.917184893068406,
642
+ "grad_norm": 0.6288430690765381,
643
+ "learning_rate": 1.2442963874466044e-05,
644
+ "loss": 0.0298,
645
+ "step": 790
646
+ },
647
+ {
648
+ "epoch": 1.9414530562718033,
649
+ "grad_norm": 0.9807838201522827,
650
+ "learning_rate": 1.2237009368465171e-05,
651
+ "loss": 0.0076,
652
+ "step": 800
653
+ },
654
+ {
655
+ "epoch": 1.965721219475201,
656
+ "grad_norm": 0.4862402379512787,
657
+ "learning_rate": 1.2030051012044644e-05,
658
+ "loss": 0.0038,
659
+ "step": 810
660
+ },
661
+ {
662
+ "epoch": 1.9899893826785986,
663
+ "grad_norm": 0.32241472601890564,
664
+ "learning_rate": 1.1822181677069855e-05,
665
+ "loss": 0.0016,
666
+ "step": 820
667
+ },
668
+ {
669
+ "epoch": 1.9996966479599574,
670
+ "eval_dim_128_cosine_accuracy@1": 0.007503410641200546,
671
+ "eval_dim_128_cosine_accuracy@10": 0.665075034106412,
672
+ "eval_dim_128_cosine_accuracy@3": 0.06070941336971351,
673
+ "eval_dim_128_cosine_accuracy@5": 0.37312414733969984,
674
+ "eval_dim_128_cosine_map@100": 0.15984371570467878,
675
+ "eval_dim_128_cosine_mrr@10": 0.1428284501613273,
676
+ "eval_dim_128_cosine_ndcg@10": 0.2641617300886433,
677
+ "eval_dim_128_cosine_precision@1": 0.007503410641200546,
678
+ "eval_dim_128_cosine_precision@10": 0.0665075034106412,
679
+ "eval_dim_128_cosine_precision@3": 0.020236471123237832,
680
+ "eval_dim_128_cosine_precision@5": 0.07462482946793998,
681
+ "eval_dim_128_cosine_recall@1": 0.007503410641200546,
682
+ "eval_dim_128_cosine_recall@10": 0.665075034106412,
683
+ "eval_dim_128_cosine_recall@3": 0.06070941336971351,
684
+ "eval_dim_128_cosine_recall@5": 0.37312414733969984,
685
+ "eval_dim_256_cosine_accuracy@1": 0.009549795361527967,
686
+ "eval_dim_256_cosine_accuracy@10": 0.713506139154161,
687
+ "eval_dim_256_cosine_accuracy@3": 0.0723055934515689,
688
+ "eval_dim_256_cosine_accuracy@5": 0.4106412005457026,
689
+ "eval_dim_256_cosine_map@100": 0.17096884521775468,
690
+ "eval_dim_256_cosine_mrr@10": 0.1559981268541958,
691
+ "eval_dim_256_cosine_ndcg@10": 0.28559481472300186,
692
+ "eval_dim_256_cosine_precision@1": 0.009549795361527967,
693
+ "eval_dim_256_cosine_precision@10": 0.07135061391541608,
694
+ "eval_dim_256_cosine_precision@3": 0.024101864483856296,
695
+ "eval_dim_256_cosine_precision@5": 0.08212824010914052,
696
+ "eval_dim_256_cosine_recall@1": 0.009549795361527967,
697
+ "eval_dim_256_cosine_recall@10": 0.713506139154161,
698
+ "eval_dim_256_cosine_recall@3": 0.0723055934515689,
699
+ "eval_dim_256_cosine_recall@5": 0.4106412005457026,
700
+ "eval_dim_512_cosine_accuracy@1": 0.007503410641200546,
701
+ "eval_dim_512_cosine_accuracy@10": 0.7285129604365621,
702
+ "eval_dim_512_cosine_accuracy@3": 0.0688949522510232,
703
+ "eval_dim_512_cosine_accuracy@5": 0.40654843110504774,
704
+ "eval_dim_512_cosine_map@100": 0.1702634278904753,
705
+ "eval_dim_512_cosine_mrr@10": 0.15564731804499674,
706
+ "eval_dim_512_cosine_ndcg@10": 0.28864373602538085,
707
+ "eval_dim_512_cosine_precision@1": 0.007503410641200546,
708
+ "eval_dim_512_cosine_precision@10": 0.0728512960436562,
709
+ "eval_dim_512_cosine_precision@3": 0.022964984083674395,
710
+ "eval_dim_512_cosine_precision@5": 0.08130968622100954,
711
+ "eval_dim_512_cosine_recall@1": 0.007503410641200546,
712
+ "eval_dim_512_cosine_recall@10": 0.7285129604365621,
713
+ "eval_dim_512_cosine_recall@3": 0.0688949522510232,
714
+ "eval_dim_512_cosine_recall@5": 0.40654843110504774,
715
+ "eval_dim_64_cosine_accuracy@1": 0.0047748976807639835,
716
+ "eval_dim_64_cosine_accuracy@10": 0.6125511596180082,
717
+ "eval_dim_64_cosine_accuracy@3": 0.05798090040927694,
718
+ "eval_dim_64_cosine_accuracy@5": 0.33901773533424284,
719
+ "eval_dim_64_cosine_map@100": 0.14541967837644934,
720
+ "eval_dim_64_cosine_mrr@10": 0.12895282487710774,
721
+ "eval_dim_64_cosine_ndcg@10": 0.24113965638184232,
722
+ "eval_dim_64_cosine_precision@1": 0.0047748976807639835,
723
+ "eval_dim_64_cosine_precision@10": 0.06125511596180082,
724
+ "eval_dim_64_cosine_precision@3": 0.019326966803092312,
725
+ "eval_dim_64_cosine_precision@5": 0.06780354706684857,
726
+ "eval_dim_64_cosine_recall@1": 0.0047748976807639835,
727
+ "eval_dim_64_cosine_recall@10": 0.6125511596180082,
728
+ "eval_dim_64_cosine_recall@3": 0.05798090040927694,
729
+ "eval_dim_64_cosine_recall@5": 0.33901773533424284,
730
+ "eval_dim_768_cosine_accuracy@1": 0.008867667121418827,
731
+ "eval_dim_768_cosine_accuracy@10": 0.742837653478854,
732
+ "eval_dim_768_cosine_accuracy@3": 0.07025920873124147,
733
+ "eval_dim_768_cosine_accuracy@5": 0.40313778990450205,
734
+ "eval_dim_768_cosine_map@100": 0.17294783798650806,
735
+ "eval_dim_768_cosine_mrr@10": 0.15909747937373914,
736
+ "eval_dim_768_cosine_ndcg@10": 0.29453813752341906,
737
+ "eval_dim_768_cosine_precision@1": 0.008867667121418827,
738
+ "eval_dim_768_cosine_precision@10": 0.0742837653478854,
739
+ "eval_dim_768_cosine_precision@3": 0.023419736243747154,
740
+ "eval_dim_768_cosine_precision@5": 0.08062755798090042,
741
+ "eval_dim_768_cosine_recall@1": 0.008867667121418827,
742
+ "eval_dim_768_cosine_recall@10": 0.742837653478854,
743
+ "eval_dim_768_cosine_recall@3": 0.07025920873124147,
744
+ "eval_dim_768_cosine_recall@5": 0.40313778990450205,
745
+ "eval_runtime": 312.3268,
746
+ "eval_samples_per_second": 0.0,
747
+ "eval_sequential_score": 0.24113965638184232,
748
+ "eval_steps_per_second": 0.0,
749
+ "step": 824
750
+ },
751
+ {
752
+ "epoch": 2.0142575458819962,
753
+ "grad_norm": 0.6989903450012207,
754
+ "learning_rate": 1.1613494644204755e-05,
755
+ "loss": 0.0715,
756
+ "step": 830
757
+ },
758
+ {
759
+ "epoch": 2.0385257090853934,
760
+ "grad_norm": 0.031900301575660706,
761
+ "learning_rate": 1.1404083561052454e-05,
762
+ "loss": 0.0021,
763
+ "step": 840
764
+ },
765
+ {
766
+ "epoch": 2.062793872288791,
767
+ "grad_norm": 0.8742988109588623,
768
+ "learning_rate": 1.1194042400131213e-05,
769
+ "loss": 0.0065,
770
+ "step": 850
771
+ },
772
+ {
773
+ "epoch": 2.0870620354921887,
774
+ "grad_norm": 1.0062671899795532,
775
+ "learning_rate": 1.098346541670455e-05,
776
+ "loss": 0.0105,
777
+ "step": 860
778
+ },
779
+ {
780
+ "epoch": 2.1113301986955864,
781
+ "grad_norm": 0.1330879032611847,
782
+ "learning_rate": 1.0772447106484544e-05,
783
+ "loss": 0.0024,
784
+ "step": 870
785
+ },
786
+ {
787
+ "epoch": 2.1355983618989836,
788
+ "grad_norm": 1.5431034564971924,
789
+ "learning_rate": 1.0561082163227173e-05,
790
+ "loss": 0.0025,
791
+ "step": 880
792
+ },
793
+ {
794
+ "epoch": 2.159866525102381,
795
+ "grad_norm": 0.20452944934368134,
796
+ "learning_rate": 1.0349465436238826e-05,
797
+ "loss": 0.014,
798
+ "step": 890
799
+ },
800
+ {
801
+ "epoch": 2.184134688305779,
802
+ "grad_norm": 3.1080780029296875,
803
+ "learning_rate": 1.0137691887812994e-05,
804
+ "loss": 0.0016,
805
+ "step": 900
806
+ },
807
+ {
808
+ "epoch": 2.2084028515091765,
809
+ "grad_norm": 1.0478427410125732,
810
+ "learning_rate": 9.925856550616272e-06,
811
+ "loss": 0.008,
812
+ "step": 910
813
+ },
814
+ {
815
+ "epoch": 2.232671014712574,
816
+ "grad_norm": 0.037069372832775116,
817
+ "learning_rate": 9.714054485042734e-06,
818
+ "loss": 0.0041,
819
+ "step": 920
820
+ },
821
+ {
822
+ "epoch": 2.2569391779159713,
823
+ "grad_norm": 0.2362644523382187,
824
+ "learning_rate": 9.502380736555945e-06,
825
+ "loss": 0.0308,
826
+ "step": 930
827
+ },
828
+ {
829
+ "epoch": 2.281207341119369,
830
+ "grad_norm": 3.4790825843811035,
831
+ "learning_rate": 9.290930293037599e-06,
832
+ "loss": 0.011,
833
+ "step": 940
834
+ },
835
+ {
836
+ "epoch": 2.3054755043227666,
837
+ "grad_norm": 0.30720242857933044,
838
+ "learning_rate": 9.079798042162046e-06,
839
+ "loss": 0.0207,
840
+ "step": 950
841
+ },
842
+ {
843
+ "epoch": 2.3297436675261642,
844
+ "grad_norm": 0.33387142419815063,
845
+ "learning_rate": 8.86907872881575e-06,
846
+ "loss": 0.0048,
847
+ "step": 960
848
+ },
849
+ {
850
+ "epoch": 2.3540118307295614,
851
+ "grad_norm": 0.01000495720654726,
852
+ "learning_rate": 8.658866912580852e-06,
853
+ "loss": 0.0215,
854
+ "step": 970
855
+ },
856
+ {
857
+ "epoch": 2.378279993932959,
858
+ "grad_norm": 0.8057634234428406,
859
+ "learning_rate": 8.449256925301883e-06,
860
+ "loss": 0.0061,
861
+ "step": 980
862
+ },
863
+ {
864
+ "epoch": 2.4025481571363567,
865
+ "grad_norm": 3.0753707885742188,
866
+ "learning_rate": 8.24034282875464e-06,
867
+ "loss": 0.0164,
868
+ "step": 990
869
+ },
870
+ {
871
+ "epoch": 2.4268163203397544,
872
+ "grad_norm": 1.1145414113998413,
873
+ "learning_rate": 8.032218372436314e-06,
874
+ "loss": 0.0255,
875
+ "step": 1000
876
+ },
877
+ {
878
+ "epoch": 2.451084483543152,
879
+ "grad_norm": 0.014523504301905632,
880
+ "learning_rate": 7.824976951495696e-06,
881
+ "loss": 0.0062,
882
+ "step": 1010
883
+ },
884
+ {
885
+ "epoch": 2.475352646746549,
886
+ "grad_norm": 0.09692133218050003,
887
+ "learning_rate": 7.618711564822419e-06,
888
+ "loss": 0.0079,
889
+ "step": 1020
890
+ },
891
+ {
892
+ "epoch": 2.499620809949947,
893
+ "grad_norm": 0.9156332015991211,
894
+ "learning_rate": 7.413514773314043e-06,
895
+ "loss": 0.005,
896
+ "step": 1030
897
+ },
898
+ {
899
+ "epoch": 2.5238889731533445,
900
+ "grad_norm": 0.18534983694553375,
901
+ "learning_rate": 7.209478658339626e-06,
902
+ "loss": 0.042,
903
+ "step": 1040
904
+ },
905
+ {
906
+ "epoch": 2.548157136356742,
907
+ "grad_norm": 0.10605430603027344,
908
+ "learning_rate": 7.006694780418558e-06,
909
+ "loss": 0.0057,
910
+ "step": 1050
911
+ },
912
+ {
913
+ "epoch": 2.5724252995601393,
914
+ "grad_norm": 0.0882348120212555,
915
+ "learning_rate": 6.805254138133061e-06,
916
+ "loss": 0.0384,
917
+ "step": 1060
918
+ },
919
+ {
920
+ "epoch": 2.596693462763537,
921
+ "grad_norm": 0.7285648584365845,
922
+ "learning_rate": 6.605247127292887e-06,
923
+ "loss": 0.009,
924
+ "step": 1070
925
+ },
926
+ {
927
+ "epoch": 2.6209616259669346,
928
+ "grad_norm": 0.013403256423771381,
929
+ "learning_rate": 6.406763500370515e-06,
930
+ "loss": 0.0089,
931
+ "step": 1080
932
+ },
933
+ {
934
+ "epoch": 2.6452297891703322,
935
+ "grad_norm": 0.07016568630933762,
936
+ "learning_rate": 6.2098923262250075e-06,
937
+ "loss": 0.0034,
938
+ "step": 1090
939
+ },
940
+ {
941
+ "epoch": 2.66949795237373,
942
+ "grad_norm": 16.01243782043457,
943
+ "learning_rate": 6.014721950132694e-06,
944
+ "loss": 0.026,
945
+ "step": 1100
946
+ },
947
+ {
948
+ "epoch": 2.6937661155771275,
949
+ "grad_norm": 16.028738021850586,
950
+ "learning_rate": 5.821339954142486e-06,
951
+ "loss": 0.0358,
952
+ "step": 1110
953
+ },
954
+ {
955
+ "epoch": 2.7180342787805247,
956
+ "grad_norm": 0.19954819977283478,
957
+ "learning_rate": 5.629833117773755e-06,
958
+ "loss": 0.0033,
959
+ "step": 1120
960
+ },
961
+ {
962
+ "epoch": 2.7423024419839224,
963
+ "grad_norm": 0.07437506318092346,
964
+ "learning_rate": 5.440287379074321e-06,
965
+ "loss": 0.0037,
966
+ "step": 1130
967
+ },
968
+ {
969
+ "epoch": 2.76657060518732,
970
+ "grad_norm": 0.047555409371852875,
971
+ "learning_rate": 5.252787796056005e-06,
972
+ "loss": 0.0195,
973
+ "step": 1140
974
+ },
975
+ {
976
+ "epoch": 2.790838768390717,
977
+ "grad_norm": 0.12791568040847778,
978
+ "learning_rate": 5.067418508525181e-06,
979
+ "loss": 0.0024,
980
+ "step": 1150
981
+ },
982
+ {
983
+ "epoch": 2.815106931594115,
984
+ "grad_norm": 1.663771629333496,
985
+ "learning_rate": 4.884262700325282e-06,
986
+ "loss": 0.0533,
987
+ "step": 1160
988
+ },
989
+ {
990
+ "epoch": 2.8393750947975125,
991
+ "grad_norm": 0.5862261056900024,
992
+ "learning_rate": 4.703402562008355e-06,
993
+ "loss": 0.0137,
994
+ "step": 1170
995
+ },
996
+ {
997
+ "epoch": 2.86364325800091,
998
+ "grad_norm": 0.08700157701969147,
999
+ "learning_rate": 4.52491925395232e-06,
1000
+ "loss": 0.0125,
1001
+ "step": 1180
1002
+ },
1003
+ {
1004
+ "epoch": 2.8879114212043078,
1005
+ "grad_norm": 0.02824460342526436,
1006
+ "learning_rate": 4.3488928699405135e-06,
1007
+ "loss": 0.0253,
1008
+ "step": 1190
1009
+ },
1010
+ {
1011
+ "epoch": 2.9121795844077054,
1012
+ "grad_norm": 0.005378555506467819,
1013
+ "learning_rate": 4.175402401219894e-06,
1014
+ "loss": 0.0068,
1015
+ "step": 1200
1016
+ },
1017
+ {
1018
+ "epoch": 2.9364477476111026,
1019
+ "grad_norm": 0.2840709984302521,
1020
+ "learning_rate": 4.004525701053964e-06,
1021
+ "loss": 0.0436,
1022
+ "step": 1210
1023
+ },
1024
+ {
1025
+ "epoch": 2.9607159108145003,
1026
+ "grad_norm": 0.3918948769569397,
1027
+ "learning_rate": 3.836339449786396e-06,
1028
+ "loss": 0.0021,
1029
+ "step": 1220
1030
+ },
1031
+ {
1032
+ "epoch": 2.984984074017898,
1033
+ "grad_norm": 1.3828555345535278,
1034
+ "learning_rate": 3.6709191204309845e-06,
1035
+ "loss": 0.0129,
1036
+ "step": 1230
1037
+ },
1038
+ {
1039
+ "epoch": 2.9995449719399363,
1040
+ "eval_dim_128_cosine_accuracy@1": 0.008185538881309686,
1041
+ "eval_dim_128_cosine_accuracy@10": 0.694406548431105,
1042
+ "eval_dim_128_cosine_accuracy@3": 0.05798090040927694,
1043
+ "eval_dim_128_cosine_accuracy@5": 0.3860845839017735,
1044
+ "eval_dim_128_cosine_map@100": 0.16363198200379098,
1045
+ "eval_dim_128_cosine_mrr@10": 0.14819208947789936,
1046
+ "eval_dim_128_cosine_ndcg@10": 0.2749254568568281,
1047
+ "eval_dim_128_cosine_precision@1": 0.008185538881309686,
1048
+ "eval_dim_128_cosine_precision@10": 0.06944065484311049,
1049
+ "eval_dim_128_cosine_precision@3": 0.019326966803092312,
1050
+ "eval_dim_128_cosine_precision@5": 0.07721691678035471,
1051
+ "eval_dim_128_cosine_recall@1": 0.008185538881309686,
1052
+ "eval_dim_128_cosine_recall@10": 0.694406548431105,
1053
+ "eval_dim_128_cosine_recall@3": 0.05798090040927694,
1054
+ "eval_dim_128_cosine_recall@5": 0.3860845839017735,
1055
+ "eval_dim_256_cosine_accuracy@1": 0.0034106412005457027,
1056
+ "eval_dim_256_cosine_accuracy@10": 0.7223738062755798,
1057
+ "eval_dim_256_cosine_accuracy@3": 0.06616643929058663,
1058
+ "eval_dim_256_cosine_accuracy@5": 0.417462482946794,
1059
+ "eval_dim_256_cosine_map@100": 0.1659963653118235,
1060
+ "eval_dim_256_cosine_mrr@10": 0.15151719396262187,
1061
+ "eval_dim_256_cosine_ndcg@10": 0.2841815053560014,
1062
+ "eval_dim_256_cosine_precision@1": 0.0034106412005457027,
1063
+ "eval_dim_256_cosine_precision@10": 0.07223738062755797,
1064
+ "eval_dim_256_cosine_precision@3": 0.022055479763528875,
1065
+ "eval_dim_256_cosine_precision@5": 0.08349249658935878,
1066
+ "eval_dim_256_cosine_recall@1": 0.0034106412005457027,
1067
+ "eval_dim_256_cosine_recall@10": 0.7223738062755798,
1068
+ "eval_dim_256_cosine_recall@3": 0.06616643929058663,
1069
+ "eval_dim_256_cosine_recall@5": 0.417462482946794,
1070
+ "eval_dim_512_cosine_accuracy@1": 0.0068212824010914054,
1071
+ "eval_dim_512_cosine_accuracy@10": 0.7503410641200545,
1072
+ "eval_dim_512_cosine_accuracy@3": 0.06753069577080491,
1073
+ "eval_dim_512_cosine_accuracy@5": 0.41609822646657574,
1074
+ "eval_dim_512_cosine_map@100": 0.17102359712258386,
1075
+ "eval_dim_512_cosine_mrr@10": 0.15798631412546613,
1076
+ "eval_dim_512_cosine_ndcg@10": 0.29545256337366416,
1077
+ "eval_dim_512_cosine_precision@1": 0.0068212824010914054,
1078
+ "eval_dim_512_cosine_precision@10": 0.07503410641200545,
1079
+ "eval_dim_512_cosine_precision@3": 0.022510231923601638,
1080
+ "eval_dim_512_cosine_precision@5": 0.08321964529331514,
1081
+ "eval_dim_512_cosine_recall@1": 0.0068212824010914054,
1082
+ "eval_dim_512_cosine_recall@10": 0.7503410641200545,
1083
+ "eval_dim_512_cosine_recall@3": 0.06753069577080491,
1084
+ "eval_dim_512_cosine_recall@5": 0.41609822646657574,
1085
+ "eval_dim_64_cosine_accuracy@1": 0.0068212824010914054,
1086
+ "eval_dim_64_cosine_accuracy@10": 0.6323328785811733,
1087
+ "eval_dim_64_cosine_accuracy@3": 0.06684856753069578,
1088
+ "eval_dim_64_cosine_accuracy@5": 0.36221009549795363,
1089
+ "eval_dim_64_cosine_map@100": 0.15255646759369407,
1090
+ "eval_dim_64_cosine_mrr@10": 0.13584827519002,
1091
+ "eval_dim_64_cosine_ndcg@10": 0.25115836351492093,
1092
+ "eval_dim_64_cosine_precision@1": 0.0068212824010914054,
1093
+ "eval_dim_64_cosine_precision@10": 0.06323328785811731,
1094
+ "eval_dim_64_cosine_precision@3": 0.022282855843565257,
1095
+ "eval_dim_64_cosine_precision@5": 0.07244201909959072,
1096
+ "eval_dim_64_cosine_recall@1": 0.0068212824010914054,
1097
+ "eval_dim_64_cosine_recall@10": 0.6323328785811733,
1098
+ "eval_dim_64_cosine_recall@3": 0.06684856753069578,
1099
+ "eval_dim_64_cosine_recall@5": 0.36221009549795363,
1100
+ "eval_dim_768_cosine_accuracy@1": 0.004092769440654843,
1101
+ "eval_dim_768_cosine_accuracy@10": 0.7612551159618008,
1102
+ "eval_dim_768_cosine_accuracy@3": 0.06412005457025921,
1103
+ "eval_dim_768_cosine_accuracy@5": 0.4208731241473397,
1104
+ "eval_dim_768_cosine_map@100": 0.1714890252442529,
1105
+ "eval_dim_768_cosine_mrr@10": 0.15883599688169725,
1106
+ "eval_dim_768_cosine_ndcg@10": 0.2986249242161157,
1107
+ "eval_dim_768_cosine_precision@1": 0.004092769440654843,
1108
+ "eval_dim_768_cosine_precision@10": 0.07612551159618008,
1109
+ "eval_dim_768_cosine_precision@3": 0.021373351523419733,
1110
+ "eval_dim_768_cosine_precision@5": 0.08417462482946794,
1111
+ "eval_dim_768_cosine_recall@1": 0.004092769440654843,
1112
+ "eval_dim_768_cosine_recall@10": 0.7612551159618008,
1113
+ "eval_dim_768_cosine_recall@3": 0.06412005457025921,
1114
+ "eval_dim_768_cosine_recall@5": 0.4208731241473397,
1115
+ "eval_runtime": 311.0822,
1116
+ "eval_samples_per_second": 0.0,
1117
+ "eval_sequential_score": 0.25115836351492093,
1118
+ "eval_steps_per_second": 0.0,
1119
+ "step": 1236
1120
+ },
1121
+ {
1122
+ "epoch": 3.0092522372212955,
1123
+ "grad_norm": 0.058822404593229294,
1124
+ "learning_rate": 3.508338944803371e-06,
1125
+ "loss": 0.0037,
1126
+ "step": 1240
1127
+ },
1128
+ {
1129
+ "epoch": 3.0335204004246927,
1130
+ "grad_norm": 2.0644218921661377,
1131
+ "learning_rate": 3.3486718802097904e-06,
1132
+ "loss": 0.0161,
1133
+ "step": 1250
1134
+ },
1135
+ {
1136
+ "epoch": 3.0577885636280904,
1137
+ "grad_norm": 0.24226796627044678,
1138
+ "learning_rate": 3.1919895767077024e-06,
1139
+ "loss": 0.0164,
1140
+ "step": 1260
1141
+ },
1142
+ {
1143
+ "epoch": 3.082056726831488,
1144
+ "grad_norm": 0.004309698939323425,
1145
+ "learning_rate": 3.038362344953082e-06,
1146
+ "loss": 0.0007,
1147
+ "step": 1270
1148
+ },
1149
+ {
1150
+ "epoch": 3.1063248900348857,
1151
+ "grad_norm": 0.0222060177475214,
1152
+ "learning_rate": 2.8878591246487496e-06,
1153
+ "loss": 0.0023,
1154
+ "step": 1280
1155
+ },
1156
+ {
1157
+ "epoch": 3.130593053238283,
1158
+ "grad_norm": 0.15199095010757446,
1159
+ "learning_rate": 2.7405474536079112e-06,
1160
+ "loss": 0.0073,
1161
+ "step": 1290
1162
+ },
1163
+ {
1164
+ "epoch": 3.1548612164416805,
1165
+ "grad_norm": 3.450101375579834,
1166
+ "learning_rate": 2.5964934374467886e-06,
1167
+ "loss": 0.0134,
1168
+ "step": 1300
1169
+ },
1170
+ {
1171
+ "epoch": 3.179129379645078,
1172
+ "grad_norm": 0.2848964035511017,
1173
+ "learning_rate": 2.4557617199199455e-06,
1174
+ "loss": 0.0021,
1175
+ "step": 1310
1176
+ },
1177
+ {
1178
+ "epoch": 3.2033975428484758,
1179
+ "grad_norm": 0.048863932490348816,
1180
+ "learning_rate": 2.318415453911623e-06,
1181
+ "loss": 0.0571,
1182
+ "step": 1320
1183
+ },
1184
+ {
1185
+ "epoch": 3.227665706051873,
1186
+ "grad_norm": 0.018151430413126945,
1187
+ "learning_rate": 2.184516273096099e-06,
1188
+ "loss": 0.0376,
1189
+ "step": 1330
1190
+ },
1191
+ {
1192
+ "epoch": 3.2519338692552706,
1193
+ "grad_norm": 0.29090723395347595,
1194
+ "learning_rate": 2.054124264279781e-06,
1195
+ "loss": 0.0049,
1196
+ "step": 1340
1197
+ },
1198
+ {
1199
+ "epoch": 3.2762020324586683,
1200
+ "grad_norm": 0.12183438986539841,
1201
+ "learning_rate": 1.927297940437457e-06,
1202
+ "loss": 0.0151,
1203
+ "step": 1350
1204
+ },
1205
+ {
1206
+ "epoch": 3.300470195662066,
1207
+ "grad_norm": 0.023617880418896675,
1208
+ "learning_rate": 1.8040942144547847e-06,
1209
+ "loss": 0.002,
1210
+ "step": 1360
1211
+ },
1212
+ {
1213
+ "epoch": 3.3247383588654635,
1214
+ "grad_norm": 0.026082368567585945,
1215
+ "learning_rate": 1.6845683735888362e-06,
1216
+ "loss": 0.0276,
1217
+ "step": 1370
1218
+ },
1219
+ {
1220
+ "epoch": 3.3490065220688607,
1221
+ "grad_norm": 0.17559580504894257,
1222
+ "learning_rate": 1.5687740546581309e-06,
1223
+ "loss": 0.0007,
1224
+ "step": 1380
1225
+ },
1226
+ {
1227
+ "epoch": 3.3732746852722584,
1228
+ "grad_norm": 0.6238240599632263,
1229
+ "learning_rate": 1.4567632199732795e-06,
1230
+ "loss": 0.0324,
1231
+ "step": 1390
1232
+ },
1233
+ {
1234
+ "epoch": 3.397542848475656,
1235
+ "grad_norm": 0.05853324756026268,
1236
+ "learning_rate": 1.3485861340190853e-06,
1237
+ "loss": 0.0043,
1238
+ "step": 1400
1239
+ },
1240
+ {
1241
+ "epoch": 3.4218110116790537,
1242
+ "grad_norm": 5.688457489013672,
1243
+ "learning_rate": 1.2442913408985247e-06,
1244
+ "loss": 0.0074,
1245
+ "step": 1410
1246
+ },
1247
+ {
1248
+ "epoch": 3.446079174882451,
1249
+ "grad_norm": 0.014380146749317646,
1250
+ "learning_rate": 1.143925642548729e-06,
1251
+ "loss": 0.005,
1252
+ "step": 1420
1253
+ },
1254
+ {
1255
+ "epoch": 3.4703473380858485,
1256
+ "grad_norm": 0.004129716195166111,
1257
+ "learning_rate": 1.0475340777387988e-06,
1258
+ "loss": 0.0066,
1259
+ "step": 1430
1260
+ },
1261
+ {
1262
+ "epoch": 3.494615501289246,
1263
+ "grad_norm": 2.045743465423584,
1264
+ "learning_rate": 9.55159901858783e-07,
1265
+ "loss": 0.0039,
1266
+ "step": 1440
1267
+ },
1268
+ {
1269
+ "epoch": 3.518883664492644,
1270
+ "grad_norm": 0.14692433178424835,
1271
+ "learning_rate": 8.668445675089843e-07,
1272
+ "loss": 0.0056,
1273
+ "step": 1450
1274
+ },
1275
+ {
1276
+ "epoch": 3.5431518276960414,
1277
+ "grad_norm": 0.016420599073171616,
1278
+ "learning_rate": 7.826277058982401e-07,
1279
+ "loss": 0.0039,
1280
+ "step": 1460
1281
+ },
1282
+ {
1283
+ "epoch": 3.567419990899439,
1284
+ "grad_norm": 0.018839633092284203,
1285
+ "learning_rate": 7.025471090595459e-07,
1286
+ "loss": 0.0148,
1287
+ "step": 1470
1288
+ },
1289
+ {
1290
+ "epoch": 3.5916881541028363,
1291
+ "grad_norm": 0.10725314170122147,
1292
+ "learning_rate": 6.266387128910167e-07,
1293
+ "loss": 0.0029,
1294
+ "step": 1480
1295
+ },
1296
+ {
1297
+ "epoch": 3.615956317306234,
1298
+ "grad_norm": 0.3421079218387604,
1299
+ "learning_rate": 5.549365810297646e-07,
1300
+ "loss": 0.011,
1301
+ "step": 1490
1302
+ },
1303
+ {
1304
+ "epoch": 3.6402244805096315,
1305
+ "grad_norm": 0.10575210303068161,
1306
+ "learning_rate": 4.874728895659664e-07,
1307
+ "loss": 0.0029,
1308
+ "step": 1500
1309
+ },
1310
+ {
1311
+ "epoch": 3.6644926437130287,
1312
+ "grad_norm": 0.37251242995262146,
1313
+ "learning_rate": 4.242779126039387e-07,
1314
+ "loss": 0.0057,
1315
+ "step": 1510
1316
+ },
1317
+ {
1318
+ "epoch": 3.6887608069164264,
1319
+ "grad_norm": 0.06366808712482452,
1320
+ "learning_rate": 3.653800086767489e-07,
1321
+ "loss": 0.0013,
1322
+ "step": 1520
1323
+ },
1324
+ {
1325
+ "epoch": 3.713028970119824,
1326
+ "grad_norm": 0.03356878086924553,
1327
+ "learning_rate": 3.108056080204136e-07,
1328
+ "loss": 0.0618,
1329
+ "step": 1530
1330
+ },
1331
+ {
1332
+ "epoch": 3.7372971333232217,
1333
+ "grad_norm": 0.009979511611163616,
1334
+ "learning_rate": 2.6057920071341115e-07,
1335
+ "loss": 0.0102,
1336
+ "step": 1540
1337
+ },
1338
+ {
1339
+ "epoch": 3.7615652965266193,
1340
+ "grad_norm": 0.009158286266028881,
1341
+ "learning_rate": 2.147233256868564e-07,
1342
+ "loss": 0.0009,
1343
+ "step": 1550
1344
+ },
1345
+ {
1346
+ "epoch": 3.785833459730017,
1347
+ "grad_norm": 0.745036780834198,
1348
+ "learning_rate": 1.7325856061022106e-07,
1349
+ "loss": 0.023,
1350
+ "step": 1560
1351
+ },
1352
+ {
1353
+ "epoch": 3.810101622933414,
1354
+ "grad_norm": 0.15607702732086182,
1355
+ "learning_rate": 1.362035126571748e-07,
1356
+ "loss": 0.0067,
1357
+ "step": 1570
1358
+ },
1359
+ {
1360
+ "epoch": 3.834369786136812,
1361
+ "grad_norm": 0.025057826191186905,
1362
+ "learning_rate": 1.0357481015568217e-07,
1363
+ "loss": 0.011,
1364
+ "step": 1580
1365
+ },
1366
+ {
1367
+ "epoch": 3.8586379493402094,
1368
+ "grad_norm": 0.2385823130607605,
1369
+ "learning_rate": 7.538709512609488e-08,
1370
+ "loss": 0.0023,
1371
+ "step": 1590
1372
+ },
1373
+ {
1374
+ "epoch": 3.8829061125436066,
1375
+ "grad_norm": 0.34772989153862,
1376
+ "learning_rate": 5.165301671059331e-08,
1377
+ "loss": 0.0154,
1378
+ "step": 1600
1379
+ },
1380
+ {
1381
+ "epoch": 3.9071742757470043,
1382
+ "grad_norm": 0.3472934663295746,
1383
+ "learning_rate": 3.2383225496929185e-08,
1384
+ "loss": 0.0014,
1385
+ "step": 1610
1386
+ },
1387
+ {
1388
+ "epoch": 3.931442438950402,
1389
+ "grad_norm": 0.021597877144813538,
1390
+ "learning_rate": 1.7586368739005433e-08,
1391
+ "loss": 0.0024,
1392
+ "step": 1620
1393
+ },
1394
+ {
1395
+ "epoch": 3.9557106021537995,
1396
+ "grad_norm": 2.3207926750183105,
1397
+ "learning_rate": 7.269086476456855e-09,
1398
+ "loss": 0.0034,
1399
+ "step": 1630
1400
+ },
1401
+ {
1402
+ "epoch": 3.979978765357197,
1403
+ "grad_norm": 0.03757787495851517,
1404
+ "learning_rate": 1.4360085549480762e-09,
1405
+ "loss": 0.0022,
1406
+ "step": 1640
1407
+ },
1408
+ {
1409
+ "epoch": 3.999393295919915,
1410
+ "eval_dim_128_cosine_accuracy@1": 0.008185538881309686,
1411
+ "eval_dim_128_cosine_accuracy@10": 0.6950886766712142,
1412
+ "eval_dim_128_cosine_accuracy@3": 0.05593451568894952,
1413
+ "eval_dim_128_cosine_accuracy@5": 0.3840381991814461,
1414
+ "eval_dim_128_cosine_map@100": 0.16389295635755213,
1415
+ "eval_dim_128_cosine_mrr@10": 0.14822809069057183,
1416
+ "eval_dim_128_cosine_ndcg@10": 0.27519563194479246,
1417
+ "eval_dim_128_cosine_precision@1": 0.008185538881309686,
1418
+ "eval_dim_128_cosine_precision@10": 0.0695088676671214,
1419
+ "eval_dim_128_cosine_precision@3": 0.018644838562983174,
1420
+ "eval_dim_128_cosine_precision@5": 0.07680763983628923,
1421
+ "eval_dim_128_cosine_recall@1": 0.008185538881309686,
1422
+ "eval_dim_128_cosine_recall@10": 0.6950886766712142,
1423
+ "eval_dim_128_cosine_recall@3": 0.05593451568894952,
1424
+ "eval_dim_128_cosine_recall@5": 0.3840381991814461,
1425
+ "eval_dim_256_cosine_accuracy@1": 0.008185538881309686,
1426
+ "eval_dim_256_cosine_accuracy@10": 0.7271487039563438,
1427
+ "eval_dim_256_cosine_accuracy@3": 0.06207366984993179,
1428
+ "eval_dim_256_cosine_accuracy@5": 0.41678035470668484,
1429
+ "eval_dim_256_cosine_map@100": 0.1692974551068429,
1430
+ "eval_dim_256_cosine_mrr@10": 0.15479628185971772,
1431
+ "eval_dim_256_cosine_ndcg@10": 0.2876701680743724,
1432
+ "eval_dim_256_cosine_precision@1": 0.008185538881309686,
1433
+ "eval_dim_256_cosine_precision@10": 0.07271487039563437,
1434
+ "eval_dim_256_cosine_precision@3": 0.020691223283310595,
1435
+ "eval_dim_256_cosine_precision@5": 0.08335607094133697,
1436
+ "eval_dim_256_cosine_recall@1": 0.008185538881309686,
1437
+ "eval_dim_256_cosine_recall@10": 0.7271487039563438,
1438
+ "eval_dim_256_cosine_recall@3": 0.06207366984993179,
1439
+ "eval_dim_256_cosine_recall@5": 0.41678035470668484,
1440
+ "eval_dim_512_cosine_accuracy@1": 0.0068212824010914054,
1441
+ "eval_dim_512_cosine_accuracy@10": 0.7448840381991815,
1442
+ "eval_dim_512_cosine_accuracy@3": 0.059345156889495224,
1443
+ "eval_dim_512_cosine_accuracy@5": 0.4311050477489768,
1444
+ "eval_dim_512_cosine_map@100": 0.1710230677531375,
1445
+ "eval_dim_512_cosine_mrr@10": 0.15735047315879294,
1446
+ "eval_dim_512_cosine_ndcg@10": 0.29381415276343026,
1447
+ "eval_dim_512_cosine_precision@1": 0.0068212824010914054,
1448
+ "eval_dim_512_cosine_precision@10": 0.07448840381991814,
1449
+ "eval_dim_512_cosine_precision@3": 0.019781718963165072,
1450
+ "eval_dim_512_cosine_precision@5": 0.08622100954979535,
1451
+ "eval_dim_512_cosine_recall@1": 0.0068212824010914054,
1452
+ "eval_dim_512_cosine_recall@10": 0.7448840381991815,
1453
+ "eval_dim_512_cosine_recall@3": 0.059345156889495224,
1454
+ "eval_dim_512_cosine_recall@5": 0.4311050477489768,
1455
+ "eval_dim_64_cosine_accuracy@1": 0.007503410641200546,
1456
+ "eval_dim_64_cosine_accuracy@10": 0.6412005457025921,
1457
+ "eval_dim_64_cosine_accuracy@3": 0.06275579809004093,
1458
+ "eval_dim_64_cosine_accuracy@5": 0.3792633015006821,
1459
+ "eval_dim_64_cosine_map@100": 0.15410585003942584,
1460
+ "eval_dim_64_cosine_mrr@10": 0.13775254986032456,
1461
+ "eval_dim_64_cosine_ndcg@10": 0.2546507438265754,
1462
+ "eval_dim_64_cosine_precision@1": 0.007503410641200546,
1463
+ "eval_dim_64_cosine_precision@10": 0.0641200545702592,
1464
+ "eval_dim_64_cosine_precision@3": 0.020918599363346974,
1465
+ "eval_dim_64_cosine_precision@5": 0.07585266030013643,
1466
+ "eval_dim_64_cosine_recall@1": 0.007503410641200546,
1467
+ "eval_dim_64_cosine_recall@10": 0.6412005457025921,
1468
+ "eval_dim_64_cosine_recall@3": 0.06275579809004093,
1469
+ "eval_dim_64_cosine_recall@5": 0.3792633015006821,
1470
+ "eval_dim_768_cosine_accuracy@1": 0.007503410641200546,
1471
+ "eval_dim_768_cosine_accuracy@10": 0.76193724420191,
1472
+ "eval_dim_768_cosine_accuracy@3": 0.06002728512960437,
1473
+ "eval_dim_768_cosine_accuracy@5": 0.4304229195088677,
1474
+ "eval_dim_768_cosine_map@100": 0.17310179565186012,
1475
+ "eval_dim_768_cosine_mrr@10": 0.1604208622967127,
1476
+ "eval_dim_768_cosine_ndcg@10": 0.3000127641618364,
1477
+ "eval_dim_768_cosine_precision@1": 0.007503410641200546,
1478
+ "eval_dim_768_cosine_precision@10": 0.07619372442019098,
1479
+ "eval_dim_768_cosine_precision@3": 0.020009095043201454,
1480
+ "eval_dim_768_cosine_precision@5": 0.08608458390177355,
1481
+ "eval_dim_768_cosine_recall@1": 0.007503410641200546,
1482
+ "eval_dim_768_cosine_recall@10": 0.76193724420191,
1483
+ "eval_dim_768_cosine_recall@3": 0.06002728512960437,
1484
+ "eval_dim_768_cosine_recall@5": 0.4304229195088677,
1485
+ "eval_runtime": 311.0424,
1486
+ "eval_samples_per_second": 0.0,
1487
+ "eval_sequential_score": 0.2546507438265754,
1488
+ "eval_steps_per_second": 0.0,
1489
+ "step": 1648
1490
+ }
1491
+ ],
1492
+ "logging_steps": 10,
1493
+ "max_steps": 1648,
1494
+ "num_input_tokens_seen": 0,
1495
+ "num_train_epochs": 4,
1496
+ "save_steps": 500,
1497
+ "stateful_callbacks": {
1498
+ "TrainerControl": {
1499
+ "args": {
1500
+ "should_epoch_stop": false,
1501
+ "should_evaluate": false,
1502
+ "should_log": false,
1503
+ "should_save": true,
1504
+ "should_training_stop": true
1505
+ },
1506
+ "attributes": {}
1507
+ }
1508
+ },
1509
+ "total_flos": 0.0,
1510
+ "train_batch_size": 2,
1511
+ "trial_name": null,
1512
+ "trial_params": null
1513
+ }
checkpoint-1648/training_args.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:c4cc2f888d304cc638d9229cee4d97273e72d5cd4109d5e994883f9da6feea4d
3
+ size 5496
checkpoint-824/1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
checkpoint-824/README.md ADDED
@@ -0,0 +1,1003 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - en
4
+ license: apache-2.0
5
+ tags:
6
+ - sentence-transformers
7
+ - sentence-similarity
8
+ - feature-extraction
9
+ - generated_from_trainer
10
+ - dataset_size:13186
11
+ - loss:MatryoshkaLoss
12
+ - loss:MultipleNegativesRankingLoss
13
+ base_model: nomic-ai/nomic-embed-text-v2-moe
14
+ widget:
15
+ - source_sentence: ООО "Сибирские ягоды" зарегистрировало географическое указание
16
+ на свою продукцию. В связи с реорганизацией общества, оно изменило свое наименование
17
+ на АО "Ягодный край". Какие действия необходимо предпринять АО "Ягодный край"
18
+ в соответствии с предоставленным текстом статьи закона для внесения изменений
19
+ в Государственный реестр?
20
+ sentences:
21
+ - <p>5. Если в силу договора факторинга финансовый агент (фактор) несет обязанности
22
+ по оплате цены приобретенных им денежных требований, по предоставлению клиенту
23
+ займа (кредита) или по оказанию клиенту услуг, к отношениям сторон по договору
24
+ факторинга применяются правила соответственно о купле-продаже, займе (кредите),
25
+ возмездном оказании услуг постольку, поскольку это не противоречит положениям
26
+ настоящей главы и существу отношений по договору факторинга.</p><p>(Статья в редакции
27
+ Федерального закона <a href="102439953">от 26.07.2017 № 212-ФЗ</a>)</p>
28
+ - <p>1. В случае, когда договором купли-продажи предусмотрена оплата товара через
29
+ определенное время после его передачи покупателю (продажа товара в кредит), покупатель
30
+ должен произвести оплату в срок, предусмотренный договором, а если такой срок
31
+ договором не предусмотрен, в срок, определенный в соответствии со статьей 314
32
+ настоящего Кодекса.</p><p>2. В случае неисполнения продавцом обязанности по передаче
33
+ товара применяются правила, предусмотренные статьей 328 настоящего Кодекса.</p><p>3.
34
+ В случае, когда покупатель, получивший товар, не исполняет обязанность по его
35
+ оплате в установленный договором купли-продажи срок, продавец вправе потребовать
36
+ оплаты переданного товара или возврата неоплаченных товаров.</p><p>4. В случае,
37
+ когда покупатель не исполняет обязанность по оплате переданного товара в установленный
38
+ договором срок и иное не предусмотрено настоящим Кодексом или договором купли-продажи,
39
+ на просроченную сумму подлежат уплате проценты в соответствии со статьей 395 настоящего
40
+ Кодекса со дня, когда по договору товар должен был быть оплачен, до дня оплаты
41
+ товара покупателем.</p><p>Договором может быть предусмотрена обязанность покупателя
42
+ уплачивать проценты на сумму, соответствующую цене товара, начиная со дня передачи
43
+ товара продавцом.</p><p>5. Если иное не предусмотрено договором купли-продажи,
44
+ с момента передачи товара покупателю и до его оплаты товар, проданный в кредит,
45
+ признается находящимся в залоге у продавца для обеспечения исполнения покупателем
46
+ его обязанности по оплате товара.</p>
47
+ - <p>1. Федеральный орган исполнительной власти по интеллектуальной собственности
48
+ вносит по заявлению правообладателя в Государственный реестр указаний и ��аименований
49
+ изменения, относящиеся к государственной регистрации географического указания
50
+ или наименования места происхождения товара и предоставлению исключительного права
51
+ на географическое указание или наименование места происхождения товара (пункт
52
+ 2 статьи 1529), в том числе к наименованию или имени правообладателя, его месту
53
+ нахождения или месту жительства, адресу для переписки, сведениям, касающимся перечня
54
+ лиц, имеющих право использования географического указания или наименования места
55
+ происхождения товара, условий использования географического указания или наименования
56
+ места происхождения товара входящими в объединение лицами, а также изменения для
57
+ исправления очевидных и технических ошибок.</p><p>2. К заявлению о внесении изменений
58
+ в сведения, относящиеся к государственной регистрации географического указания
59
+ или наименования места происхождения товара, в том числе указанные в подпунктах
60
+ 1 - 4, 6 - 9 пункта 2 статьи 1522, пункте 1 статьи 15221 настоящего Кодекса, прилагаются
61
+ документы или заключение уполномоченного органа, подтверждающие обоснованность
62
+ и необходимость внесения таких изменений.</p><p class="P">(Статья в редакции Федерального
63
+ закона <a href="102577263">от 26.07.2019 № 230-ФЗ</a>)</p>
64
+ - source_sentence: Какие возражения может выдвинуть должник против требования третьего
65
+ лица, если договор предусматривает исполнение в пользу третьего лица, но не указывает
66
+ его конкретно, и третье лицо заявило о своих правах?
67
+ sentences:
68
+ - <p>1. В случаях стихийных бедствий, аварий, эпидемий, эпизоотий и при иных обстоятельствах,
69
+ носящих чрезвычайный характер, имущество в интересах общества по решению государственных
70
+ органов может быть изъято у собственника в порядке и на условиях, установленных
71
+ законом, с выплатой ему стоимости имущества (реквизиция).</p><p>2. Оценка, по
72
+ которой собственнику возмещается стоимость реквизированного имущества, может быть
73
+ оспорена им в суде.</p><p>3. Лицо, имущество которого реквизировано, вправе при
74
+ прекращении действия обстоятельств, в связи с которыми произведена реквизиция,
75
+ требовать по суду возврата ему сохранившегося имущества.</p>
76
+ - <p>1. Собственники помещений в многоквартирном доме или нескольких многоквартирных
77
+ домах либо собственники нескольких жилых домов для совместного управления общим
78
+ имуществом в многоквартирном доме либо имуществом собственников помещений в нескольких
79
+ многоквартирных домах или имуществом собственников нескольких жилых домов и осуществления
80
+ деятельности по созданию, содержанию, сохранению и приращению такого имущества,
81
+ а также для осуществления иной деятельности, направленной на достижение целей
82
+ управления многоквартирными домами либо на совместное использование имущества,
83
+ принадлежащего собственникам помещений в нескольких м��огоквартирных домах, или
84
+ имущества собственников нескольких жилых домов, могут создавать товарищества собственников
85
+ жилья. (В редакции Федерального закона <a href="102387998">от 31.01.2016 № 7-ФЗ</a>)</p><p>2.
86
+ Товарищество собственников жилья является некоммерческой организацией, создаваемой
87
+ и действующей в соответствии с законом о товариществах собственников жилья.</p>
88
+ - <p>1. Договором в пользу третьего лица признается договор, в котором стороны установили,
89
+ что должник обязан произвести исполнение не кредитору, а указанному или не указанному
90
+ в договоре третьему лицу, имеющему право требовать от должника исполнения обязательства
91
+ в свою пользу.</p><p>2. Если иное не предусмотрено законом, иными правовыми актами
92
+ или договором, с момента выражения третьим лицом должнику намерения воспользоваться
93
+ своим правом по договору стороны не могут расторгать или изменять заключенный
94
+ ими договор без согласия третьего лица.</p><p>3. Должник в договоре вправе выдвигать
95
+ против требования третьего лица возражения, которые он мог бы выдвинуть против
96
+ кредитора.</p><p>4. В случае, когда третье лицо отказалось от права, предоставленного
97
+ ему по договору, кредитор может воспользоваться этим правом, если это не противоречит
98
+ закону, иным правовым актам и договору.</p>
99
+ - source_sentence: Заявитель на полезную модель внес изменения в описание технического
100
+ результата через 14 месяцев после подачи заявки. Эти изменения касаются уточнения
101
+ способа достижения заявленного технического результата, но не меняют сам результат.
102
+ Будут ли эти изменения учтены при публикации сведений о заявке согласно пункту
103
+ 5 статьи?
104
+ sentences:
105
+ - <p>указание на технический результат, который обеспечивается изобретением или
106
+ полезной моделью и не связан с техническим результатом, содержащимся в тех же
107
+ документах.</p><p>3. Дополнительные материалы изменяют заявку на промышленный
108
+ образец по существу, если они содержат изображения изделия, на которых:</p><p>представлен
109
+ иной промышленный образец, не удовлетворяющий требованию единства промышленного
110
+ образца в отношении промышленного образца или группы промышленных образцов, раскрытых
111
+ на изображениях, принятых к рассмотрению;</p><p>представлены существенные признаки
112
+ промышленного образца, отсутствующие на изображениях, представленных на дату подачи
113
+ заявки, либо представлены изображения изделия, с которых удалены существенные
114
+ признаки промышленного образца, имеющиеся на изображениях, представленных на дату
115
+ подачи заявки.</p><p>4. Изменения сведений об авторе, о заявителе, в том числе
116
+ при передаче права на получение патента другому лицу либо вследствие изменения
117
+ имени автора, имени или наименования заявителя, а также исправления очевидных
118
+ и технических ошибок могут быть внесены заявителем в документы заявки по ��обственной
119
+ инициативе до регистрации изобретения, полезной модели или промышленного образца.</p><p>5.
120
+ Изменения, внесенные заявителем в документы заявки на изобретение, учитываются
121
+ при публикации сведений о заявке, если такие изменения представлены в федеральный
122
+ орган исполнительной власти по интеллектуальной собственности в течение пятнадцати
123
+ месяцев с даты подачи заявки.</p><p>(Статья в редакции Федерального закона <a
124
+ href="102171743">от 12.03.2014 № 35-ФЗ</a>)</p>
125
+ - <p>1. Опекун или попечитель распоряжается доходами подопечного, в том числе доходами,
126
+ причитающимися подопечному от управления его имуществом, за исключением доходов,
127
+ которыми подопечный вправе распоряжаться самостоятельно, исключительно в интересах
128
+ подопечного и с предварительного разрешения органа опеки и попечительства. Суммы
129
+ алиментов, пенсий, пособий, возмещения вреда здоровью и вреда, понесенного в случае
130
+ смерти кормильца, а также иные выплачиваемые на содержание подопечного средства,
131
+ за исключением доходов, которыми подопечный вправе распоряжаться самостоятельно,
132
+ подлежат зачислению на отдельный номинальный счет, открываемый опекуном или попечителем
133
+ в соответствии с главой 45 настоящего Кодекса, и расходуются опекуном или попечителем
134
+ без предварительного разрешения органа опеки и попечительства. Опекун или попечитель
135
+ предоставляет отчет о расходовании сумм, зачисляемых на отдельный номинальный
136
+ счет, в порядке, установленном Федеральным законом <a href="102121401">"Об опеке
137
+ и попечительстве"</a>. Случаи, при которых опекун вправе не предоставлять отчет
138
+ о расходовании сумм, зачисляемых на отдельный номинальный счет, устанавливаются
139
+ Федеральным законом <a href="102121401">"Об опеке и попечительстве"</a>. (В редакции
140
+ федеральных законов <a href="102162486">от 30.12.2012 № 302-ФЗ</a>; <a href="102456108">от
141
+ 29.12.2017 № 459-ФЗ</a>)</p><p>2. Опекун не вправе без предварительного разрешения
142
+ органа опеки и попечительства совершать, а попечитель - давать согласие на совершение
143
+ сделок по отчуждению, в том числе обмену или дарению имущества подопечного, сдаче
144
+ его внаем (в аренду), в безвозмездное пользование или в залог, сделок, влекущих
145
+ отказ от принадлежащих подопечному прав, раздел его имущества или выдел из него
146
+ долей, а также любых других действий, влекущих уменьшение имущества подопечного.
147
+ (В редакции Федерального закона <a href="102162486">от 30.12.2012 № 302-ФЗ</a>)</p>
148
+ - <p>1. Заказчик обязан в сроки и в порядке, которые предусмотрены договором подряда,
149
+ с участием подрядчика осмотреть и принять выполненную работу (ее результат), а
150
+ при обнаружении отступлений от договора, ухудшающих результат работы, или иных
151
+ недостатков в работе немедленно заявить об этом подрядчику.</p><p>2. Заказчик,
152
+ обнаруживший недостатки в работе при ее приемке, вправе ссылаться на них в случаях,
153
+ если в акте либо в ином документе, удостоверяющем приемку, были оговорены эти
154
+ недостатки либо возможность последующего предъявления требования об их устранении.</p><p>3.
155
+ Если иное не предусмотрено договором подряда, заказчик, принявший работу без проверки,
156
+ лишается права ссылаться на недостатки работы, которые могли быть установлены
157
+ при обычном способе ее приемки (явные недостатки).</p><p>4. Заказчик, обнаруживший
158
+ после приемки работы отступления в ней от договора подряда или иные недостатки,
159
+ которые не могли быть установлены при обычном способе приемки (скрытые недостатки),
160
+ в том числе такие, которые были умышленно скрыты подрядчиком, обязан известить
161
+ об этом подрядчика в разумный срок по их обнаружении.</p><p>5. При возникновении
162
+ между заказчиком и подрядчиком спора по поводу недостатков выполненной работы
163
+ или их причин по требованию любой из сторон должна быть назначена экспертиза.
164
+ Расходы на экспертизу несет подрядчик, за исключением случаев, когда экспертизой
165
+ установлено отсутствие нарушений подрядчиком договора подряда или причинной связи
166
+ между действиями подрядчика и обнаруженными недостатками. В указанных случаях
167
+ расходы на экспертизу несет сторона, потребовавшая назначения экспертизы, а если
168
+ она назначена по соглашению между сторонами, обе стороны поровну.</p>
169
+ - source_sentence: Владелец квартиры на верхнем этаже многоквартирного дома хочет
170
+ установить кондиционер, труба которого будет проходить через стену соседней квартиры,
171
+ не затрагивая земельный участок. Может ли быть установлен сервитут на стену соседней
172
+ квартиры для прокладки трубы кондиционера, согласно приведенному тексту статьи?
173
+ sentences:
174
+ - <p>1. Комиссионер не отвечает перед комитентом за неисполнение третьим лицом сделки,
175
+ заключенной с ним за счет комитента, кроме случаев, когда комиссионер не проявил
176
+ необходимой осмотрительности в выборе этого лица либо принял на себя ручательство
177
+ за исполнение сделки (делькредере).</p><p>2. В случае неисполнения третьим лицом
178
+ сделки, заключенной с ним комиссионером, комиссионер обязан немедленно сообщить
179
+ об этом комитенту, собрать необходимые доказательства, а также по требованию комитента
180
+ передать ему права по такой сделке с соблюдением правил об уступке требования
181
+ (статьи 382 - 386, 388, 389).</p><p>3. Уступка прав комитенту по сделке на основании
182
+ пункта 2 настоящей статьи допускается независимо от соглашения комиссионера с
183
+ третьим лицом, запрещающего или ограничивающего такую уступку. Это не освобождает
184
+ комиссионера от ответственности перед третьим лицом в связи с уступкой права в
185
+ нарушение соглашения о ее запрете или об ограничении.</p>
186
+ - <p>Применительно к правилам, предусмотренным статьями 274 - 276 настоящего Кодекса,
187
+ сервитутом могут обременяться здания, сооружения и другое недвижимое иму��ество,
188
+ ограниченное пользование которым необходимо вне связи с пользованием земельным
189
+ участком.</p>
190
+ - <p>1. Завещатель вправе отменить или изменить составленное им завещание в любое
191
+ время после его совершения, не указывая при этом причины его отмены или изменения.</p><p>Для
192
+ отмены или изменения завещания не требуется чье-либо согласие, в том числе лиц,
193
+ назначенных наследниками в отменяемом или изменяемом завещании.</p><p>2. Завещатель
194
+ вправе посредством нового завещания отменить прежнее завещание в целом либо изменить
195
+ его посредством отмены или изменения отдельных содержащихся в нем завещательных
196
+ распоряжений.</p><p>Последующее завещание, не содержащее прямых указаний об отмене
197
+ прежнего завещания или отдельных содержащихся в нем завещательных распоряжений,
198
+ отменяет это прежнее завещание полностью или в части, в которой оно противоречит
199
+ последующему завещанию.</p><p>Завещание, отмененное полностью или частично последующим
200
+ завещанием, не восстанавливается, если последующее завещание отменено завещателем
201
+ полностью или в соответствующей части.</p><p>3. В случае недействительности последующего
202
+ завещания наследование осуществляется в соответствии с прежним завещанием.</p><p>4.
203
+ Завещание может быть отменено также посредством распоряжения о его отмене. Распоряжение
204
+ об отмене завещания должно быть совершено в форме, установленной настоящим Кодексом
205
+ для совершения завещания. К распоряжению об отмене завещания соответственно применяются
206
+ правила пункта 3 настоящей статьи.</p><p>5. Завещанием, совершенным в чрезвычайных
207
+ обстоятельствах (статья 1129), может быть отменено или изменено только такое же
208
+ завещание.</p><p>6. Завещательным распоряжением в банке (статья 1128) может быть
209
+ отменено или изменено только завещательное распоряжение правами на денежные средства
210
+ в соответствующем банке.</p>
211
+ - source_sentence: Компания «Альфа» заключила договор с инженером Петровским на разработку
212
+ нового программного обеспечения. В процессе работы Петровский создал изобретение,
213
+ защищаемое патентом. Договор не содержал пунктов, касающихся прав на интеллектуальную
214
+ собственность. Кто является правообладателем патента на изобретение, и может
215
+ ли компания «Альфа» использовать это изобретение без выплаты дополнительного вознаграждения?
216
+ sentences:
217
+ - <p>передаче в порядке, установленном частью 11 статьи 154 Федерального закона
218
+ <a href="102088491">от 22 августа 2004 года № 122-ФЗ</a> "О внесении изменений
219
+ в законодательные акты Российской Федерации и признании утратившими силу некоторых
220
+ законодательных актов Российской Федерации в связи с принятием федеральных законов
221
+ <a href="102067003">"О внесении изменений и дополнений в Федеральный закон "Об
222
+ общих принципах организации законодательных (представительных) и исполнительных
223
+ органов государственной власти субъектов Российской Федерации"</a> и <a href="102083574">"Об
224
+ общих принципах организации местного самоуправления в Российской Федерации"</a>,
225
+ акций из федеральной собственности в собственность субъекта Российской Федерации
226
+ или муниципальную собственность, из собственности субъекта Российской Федерации
227
+ в федеральную собственность или муниципальную собственность, из муниципальной
228
+ собственности в федеральную собственность или собственность субъекта Российской
229
+ Федерации. (Дополнение абзацем - Федеральный закон <a href="102157372">от 14.06.2012
230
+ № 77-ФЗ</a>)</p>
231
+ - <p>4. Если учрежденное за границей юридическое лицо осуществляет свою предпринимательскую
232
+ деятельность преимущественно на территории Российской Федерации, к требованиям
233
+ об ответственности по обязательствам юридического лица его учредителей (участников),
234
+ других лиц, которые имеют право давать обязательные для него указания или иным
235
+ образом имеют возможность определять его действия, применяется российское право
236
+ либо по выбору кредитора личный закон такого юридического лица. (Дополнение пунктом
237
+ - Федеральный закон <a href="102168115">от 30.09.2013 № 260-ФЗ</a>)</p>
238
+ - <p>1. Право на получение патента и исключительное право на изобретение, полезную
239
+ модель или промышленный образец, созданные при выполнении договора подряда или
240
+ договора на выполнение научно-исследовательских, опытно-конструкторских или технологических
241
+ работ, которые прямо не предусматривали их создание, принадлежат подрядчику (исполнителю),
242
+ если договором между ним и заказчиком не предусмотрено иное. (В редакции Федерального
243
+ закона <a href="102171743">от 12.03.2014 № 35-ФЗ</a>)</p><p>В этом случае заказчик
244
+ вправе, если договором не предусмотрено иное, использовать созданные таким образом
245
+ изобретение, полезную модель или промышленный образец в целях, для достижения
246
+ которых был заключен соответствующий договор, на условиях простой (неисключительной)
247
+ лицензии в течение всего срока действия патента без выплаты за это использование
248
+ дополнительного вознаграждения. При передаче подрядчиком (исполнителем) права
249
+ на получение патента или отчуждении самого патента другому лицу заказчик сохраняет
250
+ право использования изобретения, полезной модели или промышленного образца на
251
+ указанных условиях.</p><p>2. В случае, когда в соответствии с договором между
252
+ подрядчиком (исполнителем) и заказчиком право на получение патента или исключительное
253
+ право на изобретение, полезную модель или промышленный образец передано заказчику
254
+ либо указанному им третьему лицу, подрядчик (исполнитель) вправе использовать
255
+ созданные изобретение, полезную модель или промышленный образец для собственных
256
+ нужд на условиях безвозмездной простой (неисключительной) лицензии в течение всего
257
+ срока действия патента, если договором не предусмотрено иное.</p><p>3. Автору
258
+ указанных в пункте 1 настоящей статьи изобретения, полезной модели или промышленного
259
+ образца, не являющемуся патентообладателем, выплачивается вознаграждение в соответствии
260
+ с пунктом 4 статьи 1370 настоящего Кодекса.</p>
261
+ pipeline_tag: sentence-similarity
262
+ library_name: sentence-transformers
263
+ metrics:
264
+ - cosine_accuracy@1
265
+ - cosine_accuracy@3
266
+ - cosine_accuracy@5
267
+ - cosine_accuracy@10
268
+ - cosine_precision@1
269
+ - cosine_precision@3
270
+ - cosine_precision@5
271
+ - cosine_precision@10
272
+ - cosine_recall@1
273
+ - cosine_recall@3
274
+ - cosine_recall@5
275
+ - cosine_recall@10
276
+ - cosine_ndcg@10
277
+ - cosine_mrr@10
278
+ - cosine_map@100
279
+ model-index:
280
+ - name: tuned nomic v2
281
+ results:
282
+ - task:
283
+ type: information-retrieval
284
+ name: Information Retrieval
285
+ dataset:
286
+ name: dim 768
287
+ type: dim_768
288
+ metrics:
289
+ - type: cosine_accuracy@1
290
+ value: 0.008867667121418827
291
+ name: Cosine Accuracy@1
292
+ - type: cosine_accuracy@3
293
+ value: 0.07025920873124147
294
+ name: Cosine Accuracy@3
295
+ - type: cosine_accuracy@5
296
+ value: 0.40313778990450205
297
+ name: Cosine Accuracy@5
298
+ - type: cosine_accuracy@10
299
+ value: 0.742837653478854
300
+ name: Cosine Accuracy@10
301
+ - type: cosine_precision@1
302
+ value: 0.008867667121418827
303
+ name: Cosine Precision@1
304
+ - type: cosine_precision@3
305
+ value: 0.023419736243747154
306
+ name: Cosine Precision@3
307
+ - type: cosine_precision@5
308
+ value: 0.08062755798090042
309
+ name: Cosine Precision@5
310
+ - type: cosine_precision@10
311
+ value: 0.0742837653478854
312
+ name: Cosine Precision@10
313
+ - type: cosine_recall@1
314
+ value: 0.008867667121418827
315
+ name: Cosine Recall@1
316
+ - type: cosine_recall@3
317
+ value: 0.07025920873124147
318
+ name: Cosine Recall@3
319
+ - type: cosine_recall@5
320
+ value: 0.40313778990450205
321
+ name: Cosine Recall@5
322
+ - type: cosine_recall@10
323
+ value: 0.742837653478854
324
+ name: Cosine Recall@10
325
+ - type: cosine_ndcg@10
326
+ value: 0.29453813752341906
327
+ name: Cosine Ndcg@10
328
+ - type: cosine_mrr@10
329
+ value: 0.15909747937373914
330
+ name: Cosine Mrr@10
331
+ - type: cosine_map@100
332
+ value: 0.17294783798650806
333
+ name: Cosine Map@100
334
+ - task:
335
+ type: information-retrieval
336
+ name: Information Retrieval
337
+ dataset:
338
+ name: dim 512
339
+ type: dim_512
340
+ metrics:
341
+ - type: cosine_accuracy@1
342
+ value: 0.007503410641200546
343
+ name: Cosine Accuracy@1
344
+ - type: cosine_accuracy@3
345
+ value: 0.0688949522510232
346
+ name: Cosine Accuracy@3
347
+ - type: cosine_accuracy@5
348
+ value: 0.40654843110504774
349
+ name: Cosine Accuracy@5
350
+ - type: cosine_accuracy@10
351
+ value: 0.7285129604365621
352
+ name: Cosine Accuracy@10
353
+ - type: cosine_precision@1
354
+ value: 0.007503410641200546
355
+ name: Cosine Precision@1
356
+ - type: cosine_precision@3
357
+ value: 0.022964984083674395
358
+ name: Cosine Precision@3
359
+ - type: cosine_precision@5
360
+ value: 0.08130968622100954
361
+ name: Cosine Precision@5
362
+ - type: cosine_precision@10
363
+ value: 0.0728512960436562
364
+ name: Cosine Precision@10
365
+ - type: cosine_recall@1
366
+ value: 0.007503410641200546
367
+ name: Cosine Recall@1
368
+ - type: cosine_recall@3
369
+ value: 0.0688949522510232
370
+ name: Cosine Recall@3
371
+ - type: cosine_recall@5
372
+ value: 0.40654843110504774
373
+ name: Cosine Recall@5
374
+ - type: cosine_recall@10
375
+ value: 0.7285129604365621
376
+ name: Cosine Recall@10
377
+ - type: cosine_ndcg@10
378
+ value: 0.28864373602538085
379
+ name: Cosine Ndcg@10
380
+ - type: cosine_mrr@10
381
+ value: 0.15564731804499674
382
+ name: Cosine Mrr@10
383
+ - type: cosine_map@100
384
+ value: 0.1702634278904753
385
+ name: Cosine Map@100
386
+ - task:
387
+ type: information-retrieval
388
+ name: Information Retrieval
389
+ dataset:
390
+ name: dim 256
391
+ type: dim_256
392
+ metrics:
393
+ - type: cosine_accuracy@1
394
+ value: 0.009549795361527967
395
+ name: Cosine Accuracy@1
396
+ - type: cosine_accuracy@3
397
+ value: 0.0723055934515689
398
+ name: Cosine Accuracy@3
399
+ - type: cosine_accuracy@5
400
+ value: 0.4106412005457026
401
+ name: Cosine Accuracy@5
402
+ - type: cosine_accuracy@10
403
+ value: 0.713506139154161
404
+ name: Cosine Accuracy@10
405
+ - type: cosine_precision@1
406
+ value: 0.009549795361527967
407
+ name: Cosine Precision@1
408
+ - type: cosine_precision@3
409
+ value: 0.024101864483856296
410
+ name: Cosine Precision@3
411
+ - type: cosine_precision@5
412
+ value: 0.08212824010914052
413
+ name: Cosine Precision@5
414
+ - type: cosine_precision@10
415
+ value: 0.07135061391541608
416
+ name: Cosine Precision@10
417
+ - type: cosine_recall@1
418
+ value: 0.009549795361527967
419
+ name: Cosine Recall@1
420
+ - type: cosine_recall@3
421
+ value: 0.0723055934515689
422
+ name: Cosine Recall@3
423
+ - type: cosine_recall@5
424
+ value: 0.4106412005457026
425
+ name: Cosine Recall@5
426
+ - type: cosine_recall@10
427
+ value: 0.713506139154161
428
+ name: Cosine Recall@10
429
+ - type: cosine_ndcg@10
430
+ value: 0.28559481472300186
431
+ name: Cosine Ndcg@10
432
+ - type: cosine_mrr@10
433
+ value: 0.1559981268541958
434
+ name: Cosine Mrr@10
435
+ - type: cosine_map@100
436
+ value: 0.17096884521775468
437
+ name: Cosine Map@100
438
+ - task:
439
+ type: information-retrieval
440
+ name: Information Retrieval
441
+ dataset:
442
+ name: dim 128
443
+ type: dim_128
444
+ metrics:
445
+ - type: cosine_accuracy@1
446
+ value: 0.007503410641200546
447
+ name: Cosine Accuracy@1
448
+ - type: cosine_accuracy@3
449
+ value: 0.06070941336971351
450
+ name: Cosine Accuracy@3
451
+ - type: cosine_accuracy@5
452
+ value: 0.37312414733969984
453
+ name: Cosine Accuracy@5
454
+ - type: cosine_accuracy@10
455
+ value: 0.665075034106412
456
+ name: Cosine Accuracy@10
457
+ - type: cosine_precision@1
458
+ value: 0.007503410641200546
459
+ name: Cosine Precision@1
460
+ - type: cosine_precision@3
461
+ value: 0.020236471123237832
462
+ name: Cosine Precision@3
463
+ - type: cosine_precision@5
464
+ value: 0.07462482946793998
465
+ name: Cosine Precision@5
466
+ - type: cosine_precision@10
467
+ value: 0.0665075034106412
468
+ name: Cosine Precision@10
469
+ - type: cosine_recall@1
470
+ value: 0.007503410641200546
471
+ name: Cosine Recall@1
472
+ - type: cosine_recall@3
473
+ value: 0.06070941336971351
474
+ name: Cosine Recall@3
475
+ - type: cosine_recall@5
476
+ value: 0.37312414733969984
477
+ name: Cosine Recall@5
478
+ - type: cosine_recall@10
479
+ value: 0.665075034106412
480
+ name: Cosine Recall@10
481
+ - type: cosine_ndcg@10
482
+ value: 0.2641617300886433
483
+ name: Cosine Ndcg@10
484
+ - type: cosine_mrr@10
485
+ value: 0.1428284501613273
486
+ name: Cosine Mrr@10
487
+ - type: cosine_map@100
488
+ value: 0.15984371570467878
489
+ name: Cosine Map@100
490
+ - task:
491
+ type: information-retrieval
492
+ name: Information Retrieval
493
+ dataset:
494
+ name: dim 64
495
+ type: dim_64
496
+ metrics:
497
+ - type: cosine_accuracy@1
498
+ value: 0.0047748976807639835
499
+ name: Cosine Accuracy@1
500
+ - type: cosine_accuracy@3
501
+ value: 0.05798090040927694
502
+ name: Cosine Accuracy@3
503
+ - type: cosine_accuracy@5
504
+ value: 0.33901773533424284
505
+ name: Cosine Accuracy@5
506
+ - type: cosine_accuracy@10
507
+ value: 0.6125511596180082
508
+ name: Cosine Accuracy@10
509
+ - type: cosine_precision@1
510
+ value: 0.0047748976807639835
511
+ name: Cosine Precision@1
512
+ - type: cosine_precision@3
513
+ value: 0.019326966803092312
514
+ name: Cosine Precision@3
515
+ - type: cosine_precision@5
516
+ value: 0.06780354706684857
517
+ name: Cosine Precision@5
518
+ - type: cosine_precision@10
519
+ value: 0.06125511596180082
520
+ name: Cosine Precision@10
521
+ - type: cosine_recall@1
522
+ value: 0.0047748976807639835
523
+ name: Cosine Recall@1
524
+ - type: cosine_recall@3
525
+ value: 0.05798090040927694
526
+ name: Cosine Recall@3
527
+ - type: cosine_recall@5
528
+ value: 0.33901773533424284
529
+ name: Cosine Recall@5
530
+ - type: cosine_recall@10
531
+ value: 0.6125511596180082
532
+ name: Cosine Recall@10
533
+ - type: cosine_ndcg@10
534
+ value: 0.24113965638184232
535
+ name: Cosine Ndcg@10
536
+ - type: cosine_mrr@10
537
+ value: 0.12895282487710774
538
+ name: Cosine Mrr@10
539
+ - type: cosine_map@100
540
+ value: 0.14541967837644934
541
+ name: Cosine Map@100
542
+ ---
543
+
544
+ # tuned nomic v2
545
+
546
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [nomic-ai/nomic-embed-text-v2-moe](https://huggingface.co/nomic-ai/nomic-embed-text-v2-moe) on the json dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
547
+
548
+ ## Model Details
549
+
550
+ ### Model Description
551
+ - **Model Type:** Sentence Transformer
552
+ - **Base model:** [nomic-ai/nomic-embed-text-v2-moe](https://huggingface.co/nomic-ai/nomic-embed-text-v2-moe) <!-- at revision f6a8873b415144a69ffc529ec1e234d1e00ee765 -->
553
+ - **Maximum Sequence Length:** 512 tokens
554
+ - **Output Dimensionality:** 768 dimensions
555
+ - **Similarity Function:** Cosine Similarity
556
+ - **Training Dataset:**
557
+ - json
558
+ - **Language:** en
559
+ - **License:** apache-2.0
560
+
561
+ ### Model Sources
562
+
563
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
564
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
565
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
566
+
567
+ ### Full Model Architecture
568
+
569
+ ```
570
+ SentenceTransformer(
571
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: NomicBertModel
572
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
573
+ (2): Normalize()
574
+ )
575
+ ```
576
+
577
+ ## Usage
578
+
579
+ ### Direct Usage (Sentence Transformers)
580
+
581
+ First install the Sentence Transformers library:
582
+
583
+ ```bash
584
+ pip install -U sentence-transformers
585
+ ```
586
+
587
+ Then you can load this model and run inference.
588
+ ```python
589
+ from sentence_transformers import SentenceTransformer
590
+
591
+ # Download from the 🤗 Hub
592
+ model = SentenceTransformer("sentence_transformers_model_id")
593
+ # Run inference
594
+ sentences = [
595
+ 'Компания «Альфа» заключила договор с инженером Петровским на разработку нового программного обеспечения. В процессе работы Петровский создал изобретение, защищаемое патентом. Договор не содержал пунктов, касающихся прав на интеллектуальную собственность. Кто является правообладателем патента на изобретение, и может ли компания «Альфа» использовать это изобретение без выплаты дополнительного вознаграждения?',
596
+ '<p>1. Право на получение патента и исключительное право на изобретение, полезную модель или промышленный образец, созданные при выполнении договора подряда или договора на выполнение научно-исследовательских, опытно-конструкторских или технологических работ, которые прямо не предусматривали их создание, принадлежат подрядчику (исполнителю), если договором между ним и заказчиком не предусмотрено иное. (В редакции Федерального закона <a href="102171743">от 12.03.2014 № 35-ФЗ</a>)</p><p>В этом случае заказчик вправе, если договором не предусмотрено иное, использовать созданные таким образом изобретение, полезную модель или промышленный образец в целях, для достижения которых был заключен соответствующий договор, на условиях простой (неисключительной) лицензии в течение всего срока действия патента без выплаты за это использование дополнительного вознаграждения. При передаче подрядчиком (исполнителем) права на получение патента или отчуждении самого патента другому лицу заказчик сохраняет право использования изобретения, полезной модели или промышленного образца на указанных условиях.</p><p>2. В случае, когда в соответствии с договором между подрядчиком (исполнителем) и заказчиком право на получение патента или исключительное право на изобретение, полезную модель или промышленный образец передано заказчику либо указанному им третьему лицу, подрядчик (исполнитель) вправе использовать созданные изобретение, полезную модель или промышленный образец для собственных нужд на условиях безвозмездной простой (неисключительной) лицензии в течение всего срока действия патента, если договором не предусмотрено иное.</p><p>3. Автору указанных в пункте 1 настоящей статьи изобретения, полезной модели или промышленного образца, не являющемуся патентообладателем, выплачивается вознаграждение в соответствии с пунктом 4 статьи 1370 настоящего Кодекса.</p>',
597
+ '<p>передаче в порядке, установленном частью 11 статьи 154 Федерального закона <a href="102088491">от 22 августа 2004 года № 122-ФЗ</a> "О внесении изменений в законодательны�� акты Российской Федерации и признании утратившими силу некоторых законодательных актов Российской Федерации в связи с принятием федеральных законов <a href="102067003">"О внесении изменений и дополнений в Федеральный закон "Об общих принципах организации законодательных (представительных) и исполнительных органов государственной власти субъектов Российской Федерации"</a> и <a href="102083574">"Об общих принципах организации местного самоуправления в Российской Федерации"</a>, акций из федеральной собственности в собственность субъекта Российской Федерации или муниципальную собственность, из собственности субъекта Российской Федерации в федеральную собственность или муниципальную собственность, из муниципальной собственности в федеральную собственность или собственность субъекта Российской Федерации. (Дополнение абзацем - Федеральный закон <a href="102157372">от 14.06.2012 № 77-ФЗ</a>)</p>',
598
+ ]
599
+ embeddings = model.encode(sentences)
600
+ print(embeddings.shape)
601
+ # [3, 768]
602
+
603
+ # Get the similarity scores for the embeddings
604
+ similarities = model.similarity(embeddings, embeddings)
605
+ print(similarities.shape)
606
+ # [3, 3]
607
+ ```
608
+
609
+ <!--
610
+ ### Direct Usage (Transformers)
611
+
612
+ <details><summary>Click to see the direct usage in Transformers</summary>
613
+
614
+ </details>
615
+ -->
616
+
617
+ <!--
618
+ ### Downstream Usage (Sentence Transformers)
619
+
620
+ You can finetune this model on your own dataset.
621
+
622
+ <details><summary>Click to expand</summary>
623
+
624
+ </details>
625
+ -->
626
+
627
+ <!--
628
+ ### Out-of-Scope Use
629
+
630
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
631
+ -->
632
+
633
+ ## Evaluation
634
+
635
+ ### Metrics
636
+
637
+ #### Information Retrieval
638
+
639
+ * Datasets: `dim_768`, `dim_512`, `dim_256`, `dim_128` and `dim_64`
640
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
641
+
642
+ | Metric | dim_768 | dim_512 | dim_256 | dim_128 | dim_64 |
643
+ |:--------------------|:-----------|:-----------|:-----------|:-----------|:-----------|
644
+ | cosine_accuracy@1 | 0.0089 | 0.0075 | 0.0095 | 0.0075 | 0.0048 |
645
+ | cosine_accuracy@3 | 0.0703 | 0.0689 | 0.0723 | 0.0607 | 0.058 |
646
+ | cosine_accuracy@5 | 0.4031 | 0.4065 | 0.4106 | 0.3731 | 0.339 |
647
+ | cosine_accuracy@10 | 0.7428 | 0.7285 | 0.7135 | 0.6651 | 0.6126 |
648
+ | cosine_precision@1 | 0.0089 | 0.0075 | 0.0095 | 0.0075 | 0.0048 |
649
+ | cosine_precision@3 | 0.0234 | 0.023 | 0.0241 | 0.0202 | 0.0193 |
650
+ | cosine_precision@5 | 0.0806 | 0.0813 | 0.0821 | 0.0746 | 0.0678 |
651
+ | cosine_precision@10 | 0.0743 | 0.0729 | 0.0714 | 0.0665 | 0.0613 |
652
+ | cosine_recall@1 | 0.0089 | 0.0075 | 0.0095 | 0.0075 | 0.0048 |
653
+ | cosine_recall@3 | 0.0703 | 0.0689 | 0.0723 | 0.0607 | 0.058 |
654
+ | cosine_recall@5 | 0.4031 | 0.4065 | 0.4106 | 0.3731 | 0.339 |
655
+ | cosine_recall@10 | 0.7428 | 0.7285 | 0.7135 | 0.6651 | 0.6126 |
656
+ | **cosine_ndcg@10** | **0.2945** | **0.2886** | **0.2856** | **0.2642** | **0.2411** |
657
+ | cosine_mrr@10 | 0.1591 | 0.1556 | 0.156 | 0.1428 | 0.129 |
658
+ | cosine_map@100 | 0.1729 | 0.1703 | 0.171 | 0.1598 | 0.1454 |
659
+
660
+ <!--
661
+ ## Bias, Risks and Limitations
662
+
663
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
664
+ -->
665
+
666
+ <!--
667
+ ### Recommendations
668
+
669
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
670
+ -->
671
+
672
+ ## Training Details
673
+
674
+ ### Training Dataset
675
+
676
+ #### json
677
+
678
+ * Dataset: json
679
+ * Size: 13,186 training samples
680
+ * Columns: <code>anchor</code> and <code>positive</code>
681
+ * Approximate statistics based on the first 1000 samples:
682
+ | | anchor | positive |
683
+ |:--------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
684
+ | type | string | string |
685
+ | details | <ul><li>min: 18 tokens</li><li>mean: 61.09 tokens</li><li>max: 162 tokens</li></ul> | <ul><li>min: 40 tokens</li><li>mean: 258.71 tokens</li><li>max: 512 tokens</li></ul> |
686
+ * Samples:
687
+ | anchor | positive |
688
+ |:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
689
+ | <code>Студент разработал базу данных и подал заявку на государственную регистрацию, приложив к ней описание базы данных, реферат и заявление с указанием себя в качестве правообладателя и автора. В заявке он указал две разные базы данных. Соответствует ли заявка студента требованиям статьи закона?</code> | <code><p>1. Правообладатель в течение срока действия исключительного права на программу для ЭВМ или на базу данных может по своему желанию зарегистрировать такую программу или такую базу данных в федеральном органе исполнительной власти по интеллектуальной собственности.</p><p>Программы для ЭВМ и базы данных, в которых содержатся сведения, составляющие государственную тайну, государственной регистрации не подлежат. Лицо, подавшее заявку на государственную регистрацию (заявитель), несет ответственность за разглашение сведений о программах для ЭВМ и базах данных, в которых содержатся сведения, составляющие государственную тайну, в соответствии с законодательством Российской Федерации.</p><p>2. Заявка на государственную регистрацию программы для ЭВМ или базы данных (заявка на регистрацию) должна относиться к одной программе для ЭВМ или к одной базе данных.</p><p>Заявка на регистрацию должна содержать:</p><p>заявление о государственной регистрации программы для ЭВМ или базы данных с указанием пр...</code> |
690
+ | <code>Предположим, наследственный договор предусматривает переход права собственности на дом к А, но А отказывается от наследства. Может ли Б, другая сторона договора, потребовать исполнения договора в отношении дома, если договор не содержал бы условий о передаче дома Б в случае отказа А?</code> | <code><p>1. Наследодатель вправе заключить с любым из лиц, которые могут призываться к наследованию (статья 1116), договор, условия которого определяют круг наследников и порядок перехода прав на имущество наследодателя после его смерти к пережившим наследодателя сторонам договора или к пережившим третьим лицам, которые могут призываться к наследованию (наследственный договор). Наследственный договор может также содержать условие о душеприказчике и возлагать на участвующих в наследственном договоре лиц, которые могут призываться к наследованию, обязанность совершить какие-либо не противоречащие закону действия имущественного или неимущественного характера, в том числе исполнить завещательные отказы или завещательные возложения.</p><p>Последствия, предусмотренные наследственным договором, могут быть поставлены в зависимость от наступивших ко дню открытия наследства обстоятельств, относительно которых при заключении наследственного договора было неизвестно, наступят они или не наступят, в том ...</code> |
691
+ | <code>В чем заключается различие в порядке оспаривания патента в зависимости от характера нарушения, указанного в пункте 1 настоящей статьи?</code> | <code><p>2. Патент на изобретение, полезную модель или промышленный образец в течение срока его действия, установленного пунктами 1 - 3 статьи 1363 настоящего Кодекса, может быть оспорен путем подачи возражения в федеральный орган исполнительной власти по интеллектуальной собственности любым лицом, которому стало известно о нарушениях, предусмотренных подпунктами 1 - 4 пункта 1 настоящей статьи.</p><p>Патент на изобретение, полезную модель или промышленный образец в течение срока его действия, установленного пунктами 1 - 3 статьи 1363 настоящего Кодекса, может быть оспорен в судебном порядке любым лицом, которому стало известно о нарушениях, предусмотренных подпунктом 5 пункта 1 настоящей статьи.</p><p>Патент на изобретение, полезную модель или промышленный образец может быть оспорен заинтересованным лицом и по истечении срока его действия по основаниям и в порядке, которые установлены абзацами первым и вторым настоящего пункта.</p></code> |
692
+ * Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
693
+ ```json
694
+ {
695
+ "loss": "MultipleNegativesRankingLoss",
696
+ "matryoshka_dims": [
697
+ 768,
698
+ 512,
699
+ 256,
700
+ 128,
701
+ 64
702
+ ],
703
+ "matryoshka_weights": [
704
+ 1,
705
+ 1,
706
+ 1,
707
+ 1,
708
+ 1
709
+ ],
710
+ "n_dims_per_step": -1
711
+ }
712
+ ```
713
+
714
+ ### Training Hyperparameters
715
+ #### Non-Default Hyperparameters
716
+
717
+ - `eval_strategy`: epoch
718
+ - `per_device_train_batch_size`: 2
719
+ - `per_device_eval_batch_size`: 2
720
+ - `gradient_accumulation_steps`: 16
721
+ - `learning_rate`: 2e-05
722
+ - `num_train_epochs`: 4
723
+ - `lr_scheduler_type`: cosine
724
+ - `warmup_ratio`: 0.1
725
+ - `bf16`: True
726
+ - `load_best_model_at_end`: True
727
+ - `optim`: adamw_torch_fused
728
+ - `batch_sampler`: no_duplicates
729
+
730
+ #### All Hyperparameters
731
+ <details><summary>Click to expand</summary>
732
+
733
+ - `overwrite_output_dir`: False
734
+ - `do_predict`: False
735
+ - `eval_strategy`: epoch
736
+ - `prediction_loss_only`: True
737
+ - `per_device_train_batch_size`: 2
738
+ - `per_device_eval_batch_size`: 2
739
+ - `per_gpu_train_batch_size`: None
740
+ - `per_gpu_eval_batch_size`: None
741
+ - `gradient_accumulation_steps`: 16
742
+ - `eval_accumulation_steps`: None
743
+ - `torch_empty_cache_steps`: None
744
+ - `learning_rate`: 2e-05
745
+ - `weight_decay`: 0.0
746
+ - `adam_beta1`: 0.9
747
+ - `adam_beta2`: 0.999
748
+ - `adam_epsilon`: 1e-08
749
+ - `max_grad_norm`: 1.0
750
+ - `num_train_epochs`: 4
751
+ - `max_steps`: -1
752
+ - `lr_scheduler_type`: cosine
753
+ - `lr_scheduler_kwargs`: {}
754
+ - `warmup_ratio`: 0.1
755
+ - `warmup_steps`: 0
756
+ - `log_level`: passive
757
+ - `log_level_replica`: warning
758
+ - `log_on_each_node`: True
759
+ - `logging_nan_inf_filter`: True
760
+ - `save_safetensors`: True
761
+ - `save_on_each_node`: False
762
+ - `save_only_model`: False
763
+ - `restore_callback_states_from_checkpoint`: False
764
+ - `no_cuda`: False
765
+ - `use_cpu`: False
766
+ - `use_mps_device`: False
767
+ - `seed`: 42
768
+ - `data_seed`: None
769
+ - `jit_mode_eval`: False
770
+ - `use_ipex`: False
771
+ - `bf16`: True
772
+ - `fp16`: False
773
+ - `fp16_opt_level`: O1
774
+ - `half_precision_backend`: auto
775
+ - `bf16_full_eval`: False
776
+ - `fp16_full_eval`: False
777
+ - `tf32`: None
778
+ - `local_rank`: 0
779
+ - `ddp_backend`: None
780
+ - `tpu_num_cores`: None
781
+ - `tpu_metrics_debug`: False
782
+ - `debug`: []
783
+ - `dataloader_drop_last`: False
784
+ - `dataloader_num_workers`: 0
785
+ - `dataloader_prefetch_factor`: None
786
+ - `past_index`: -1
787
+ - `disable_tqdm`: False
788
+ - `remove_unused_columns`: True
789
+ - `label_names`: None
790
+ - `load_best_model_at_end`: True
791
+ - `ignore_data_skip`: False
792
+ - `fsdp`: []
793
+ - `fsdp_min_num_params`: 0
794
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
795
+ - `fsdp_transformer_layer_cls_to_wrap`: None
796
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
797
+ - `deepspeed`: None
798
+ - `label_smoothing_factor`: 0.0
799
+ - `optim`: adamw_torch_fused
800
+ - `optim_args`: None
801
+ - `adafactor`: False
802
+ - `group_by_length`: False
803
+ - `length_column_name`: length
804
+ - `ddp_find_unused_parameters`: None
805
+ - `ddp_bucket_cap_mb`: None
806
+ - `ddp_broadcast_buffers`: False
807
+ - `dataloader_pin_memory`: True
808
+ - `dataloader_persistent_workers`: False
809
+ - `skip_memory_metrics`: True
810
+ - `use_legacy_prediction_loop`: False
811
+ - `push_to_hub`: False
812
+ - `resume_from_checkpoint`: None
813
+ - `hub_model_id`: None
814
+ - `hub_strategy`: every_save
815
+ - `hub_private_repo`: False
816
+ - `hub_always_push`: False
817
+ - `gradient_checkpointing`: False
818
+ - `gradient_checkpointing_kwargs`: None
819
+ - `include_inputs_for_metrics`: False
820
+ - `eval_do_concat_batches`: True
821
+ - `fp16_backend`: auto
822
+ - `push_to_hub_model_id`: None
823
+ - `push_to_hub_organization`: None
824
+ - `mp_parameters`:
825
+ - `auto_find_batch_size`: False
826
+ - `full_determinism`: False
827
+ - `torchdynamo`: None
828
+ - `ray_scope`: last
829
+ - `ddp_timeout`: 1800
830
+ - `torch_compile`: False
831
+ - `torch_compile_backend`: None
832
+ - `torch_compile_mode`: None
833
+ - `dispatch_batches`: None
834
+ - `split_batches`: None
835
+ - `include_tokens_per_second`: False
836
+ - `include_num_input_tokens_seen`: False
837
+ - `neftune_noise_alpha`: None
838
+ - `optim_target_modules`: None
839
+ - `batch_eval_metrics`: False
840
+ - `eval_on_start`: False
841
+ - `eval_use_gather_object`: False
842
+ - `prompts`: None
843
+ - `batch_sampler`: no_duplicates
844
+ - `multi_dataset_batch_sampler`: proportional
845
+
846
+ </details>
847
+
848
+ ### Training Logs
849
+ | Epoch | Step | Training Loss | dim_768_cosine_ndcg@10 | dim_512_cosine_ndcg@10 | dim_256_cosine_ndcg@10 | dim_128_cosine_ndcg@10 | dim_64_cosine_ndcg@10 |
850
+ |:------:|:----:|:-------------:|:----------------------:|:----------------------:|:----------------------:|:----------------------:|:---------------------:|
851
+ | 0.0243 | 10 | 0.2108 | - | - | - | - | - |
852
+ | 0.0485 | 20 | 0.1169 | - | - | - | - | - |
853
+ | 0.0728 | 30 | 0.1334 | - | - | - | - | - |
854
+ | 0.0971 | 40 | 0.0963 | - | - | - | - | - |
855
+ | 0.1213 | 50 | 0.127 | - | - | - | - | - |
856
+ | 0.1456 | 60 | 0.1254 | - | - | - | - | - |
857
+ | 0.1699 | 70 | 0.048 | - | - | - | - | - |
858
+ | 0.1941 | 80 | 0.0358 | - | - | - | - | - |
859
+ | 0.2184 | 90 | 0.0673 | - | - | - | - | - |
860
+ | 0.2427 | 100 | 0.049 | - | - | - | - | - |
861
+ | 0.2669 | 110 | 0.0222 | - | - | - | - | - |
862
+ | 0.2912 | 120 | 0.0657 | - | - | - | - | - |
863
+ | 0.3155 | 130 | 0.0878 | - | - | - | - | - |
864
+ | 0.3398 | 140 | 0.0396 | - | - | - | - | - |
865
+ | 0.3640 | 150 | 0.033 | - | - | - | - | - |
866
+ | 0.3883 | 160 | 0.0562 | - | - | - | - | - |
867
+ | 0.4126 | 170 | 0.0329 | - | - | - | - | - |
868
+ | 0.4368 | 180 | 0.0918 | - | - | - | - | - |
869
+ | 0.4611 | 190 | 0.0198 | - | - | - | - | - |
870
+ | 0.4854 | 200 | 0.0181 | - | - | - | - | - |
871
+ | 0.5096 | 210 | 0.0119 | - | - | - | - | - |
872
+ | 0.5339 | 220 | 0.0139 | - | - | - | - | - |
873
+ | 0.5582 | 230 | 0.057 | - | - | - | - | - |
874
+ | 0.5824 | 240 | 0.0293 | - | - | - | - | - |
875
+ | 0.6067 | 250 | 0.0482 | - | - | - | - | - |
876
+ | 0.6310 | 260 | 0.017 | - | - | - | - | - |
877
+ | 0.6552 | 270 | 0.0927 | - | - | - | - | - |
878
+ | 0.6795 | 280 | 0.0187 | - | - | - | - | - |
879
+ | 0.7038 | 290 | 0.0553 | - | - | - | - | - |
880
+ | 0.7280 | 300 | 0.015 | - | - | - | - | - |
881
+ | 0.7523 | 310 | 0.0438 | - | - | - | - | - |
882
+ | 0.7766 | 320 | 0.0087 | - | - | - | - | - |
883
+ | 0.8008 | 330 | 0.038 | - | - | - | - | - |
884
+ | 0.8251 | 340 | 0.0243 | - | - | - | - | - |
885
+ | 0.8494 | 350 | 0.015 | - | - | - | - | - |
886
+ | 0.8737 | 360 | 0.0199 | - | - | - | - | - |
887
+ | 0.8979 | 370 | 0.0516 | - | - | - | - | - |
888
+ | 0.9222 | 380 | 0.0561 | - | - | - | - | - |
889
+ | 0.9465 | 390 | 0.0851 | - | - | - | - | - |
890
+ | 0.9707 | 400 | 0.0394 | - | - | - | - | - |
891
+ | 0.9950 | 410 | 0.0114 | - | - | - | - | - |
892
+ | 0.9998 | 412 | - | 0.2806 | 0.2779 | 0.2742 | 0.2597 | 0.2253 |
893
+ | 1.0193 | 420 | 0.0136 | - | - | - | - | - |
894
+ | 1.0435 | 430 | 0.1219 | - | - | - | - | - |
895
+ | 1.0678 | 440 | 0.0164 | - | - | - | - | - |
896
+ | 1.0921 | 450 | 0.0927 | - | - | - | - | - |
897
+ | 1.1163 | 460 | 0.0268 | - | - | - | - | - |
898
+ | 1.1406 | 470 | 0.0384 | - | - | - | - | - |
899
+ | 1.1649 | 480 | 0.0034 | - | - | - | - | - |
900
+ | 1.1891 | 490 | 0.0183 | - | - | - | - | - |
901
+ | 1.2134 | 500 | 0.0594 | - | - | - | - | - |
902
+ | 1.2377 | 510 | 0.0145 | - | - | - | - | - |
903
+ | 1.2619 | 520 | 0.0768 | - | - | - | - | - |
904
+ | 1.2862 | 530 | 0.0084 | - | - | - | - | - |
905
+ | 1.3105 | 540 | 0.0528 | - | - | - | - | - |
906
+ | 1.3347 | 550 | 0.0619 | - | - | - | - | - |
907
+ | 1.3590 | 560 | 0.0326 | - | - | - | - | - |
908
+ | 1.3833 | 570 | 0.0135 | - | - | - | - | - |
909
+ | 1.4076 | 580 | 0.0143 | - | - | - | - | - |
910
+ | 1.4318 | 590 | 0.0952 | - | - | - | - | - |
911
+ | 1.4561 | 600 | 0.0188 | - | - | - | - | - |
912
+ | 1.4804 | 610 | 0.01 | - | - | - | - | - |
913
+ | 1.5046 | 620 | 0.091 | - | - | - | - | - |
914
+ | 1.5289 | 630 | 0.0205 | - | - | - | - | - |
915
+ | 1.5532 | 640 | 0.0156 | - | - | - | - | - |
916
+ | 1.5774 | 650 | 0.0101 | - | - | - | - | - |
917
+ | 1.6017 | 660 | 0.022 | - | - | - | - | - |
918
+ | 1.6260 | 670 | 0.0135 | - | - | - | - | - |
919
+ | 1.6502 | 680 | 0.0226 | - | - | - | - | - |
920
+ | 1.6745 | 690 | 0.0032 | - | - | - | - | - |
921
+ | 1.6988 | 700 | 0.0071 | - | - | - | - | - |
922
+ | 1.7230 | 710 | 0.028 | - | - | - | - | - |
923
+ | 1.7473 | 720 | 0.0351 | - | - | - | - | - |
924
+ | 1.7716 | 730 | 0.0021 | - | - | - | - | - |
925
+ | 1.7958 | 740 | 0.0073 | - | - | - | - | - |
926
+ | 1.8201 | 750 | 0.0103 | - | - | - | - | - |
927
+ | 1.8444 | 760 | 0.0219 | - | - | - | - | - |
928
+ | 1.8686 | 770 | 0.0035 | - | - | - | - | - |
929
+ | 1.8929 | 780 | 0.0579 | - | - | - | - | - |
930
+ | 1.9172 | 790 | 0.0298 | - | - | - | - | - |
931
+ | 1.9415 | 800 | 0.0076 | - | - | - | - | - |
932
+ | 1.9657 | 810 | 0.0038 | - | - | - | - | - |
933
+ | 1.9900 | 820 | 0.0016 | - | - | - | - | - |
934
+ | 1.9997 | 824 | - | 0.2945 | 0.2886 | 0.2856 | 0.2642 | 0.2411 |
935
+
936
+
937
+ ### Framework Versions
938
+ - Python: 3.11.11
939
+ - Sentence Transformers: 3.4.1
940
+ - Transformers: 4.43.0
941
+ - PyTorch: 2.6.0+cu124
942
+ - Accelerate: 1.3.0
943
+ - Datasets: 3.3.2
944
+ - Tokenizers: 0.19.1
945
+
946
+ ## Citation
947
+
948
+ ### BibTeX
949
+
950
+ #### Sentence Transformers
951
+ ```bibtex
952
+ @inproceedings{reimers-2019-sentence-bert,
953
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
954
+ author = "Reimers, Nils and Gurevych, Iryna",
955
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
956
+ month = "11",
957
+ year = "2019",
958
+ publisher = "Association for Computational Linguistics",
959
+ url = "https://arxiv.org/abs/1908.10084",
960
+ }
961
+ ```
962
+
963
+ #### MatryoshkaLoss
964
+ ```bibtex
965
+ @misc{kusupati2024matryoshka,
966
+ title={Matryoshka Representation Learning},
967
+ author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
968
+ year={2024},
969
+ eprint={2205.13147},
970
+ archivePrefix={arXiv},
971
+ primaryClass={cs.LG}
972
+ }
973
+ ```
974
+
975
+ #### MultipleNegativesRankingLoss
976
+ ```bibtex
977
+ @misc{henderson2017efficient,
978
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
979
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
980
+ year={2017},
981
+ eprint={1705.00652},
982
+ archivePrefix={arXiv},
983
+ primaryClass={cs.CL}
984
+ }
985
+ ```
986
+
987
+ <!--
988
+ ## Glossary
989
+
990
+ *Clearly define terms in order to be accessible across audiences.*
991
+ -->
992
+
993
+ <!--
994
+ ## Model Card Authors
995
+
996
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
997
+ -->
998
+
999
+ <!--
1000
+ ## Model Card Contact
1001
+
1002
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
1003
+ -->
checkpoint-824/config.json ADDED
@@ -0,0 +1,74 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "nomic-ai/nomic-embed-text-v2-moe",
3
+ "activation_function": "gelu",
4
+ "add_pooling_layer": false,
5
+ "architectures": [
6
+ "NomicBertModel"
7
+ ],
8
+ "attn_pdrop": 0.0,
9
+ "auto_map": {
10
+ "AutoConfig": "nomic-ai/nomic-bert-2048--configuration_hf_nomic_bert.NomicBertConfig",
11
+ "AutoModel": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertModel",
12
+ "AutoModelForMaskedLM": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForPreTraining",
13
+ "AutoModelForMultipleChoice": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForMultipleChoice",
14
+ "AutoModelForQuestionAnswering": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForQuestionAnswering",
15
+ "AutoModelForSequenceClassification": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForSequenceClassification",
16
+ "AutoModelForTokenClassification": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForTokenClassification"
17
+ },
18
+ "bos_token_id": null,
19
+ "causal": false,
20
+ "dense_seq_output": true,
21
+ "embd_pdrop": 0.1,
22
+ "eos_token_id": null,
23
+ "expert_choice_router": false,
24
+ "ffn_div": 1,
25
+ "fused_bias_fc": true,
26
+ "fused_dropout_add_ln": true,
27
+ "initializer_range": 0.02,
28
+ "layer_norm_epsilon": 1e-05,
29
+ "max_trained_positions": 2048,
30
+ "mlp_fc1_bias": true,
31
+ "mlp_fc2_bias": true,
32
+ "model_type": "nomic_bert",
33
+ "moe_every_n_layers": 2,
34
+ "moe_impl": "megablocks",
35
+ "moe_normalize_expert_weights": false,
36
+ "moe_resid_pdrop": 0.0,
37
+ "moe_top_k": 2,
38
+ "n_embd": 768,
39
+ "n_head": 12,
40
+ "n_inner": 3072,
41
+ "n_layer": 12,
42
+ "n_positions": 2048,
43
+ "num_experts": 8,
44
+ "num_shared_experts": 0,
45
+ "pad_token_id": 1,
46
+ "pad_vocab_size_multiple": 64,
47
+ "parallel_block": false,
48
+ "parallel_block_tied_norm": false,
49
+ "prenorm": false,
50
+ "qkv_proj_bias": true,
51
+ "reorder_and_upcast_attn": false,
52
+ "resid_pdrop": 0.0,
53
+ "rotary_emb_base": 10000,
54
+ "rotary_emb_fraction": 1.0,
55
+ "rotary_emb_interleaved": false,
56
+ "rotary_emb_scale_base": null,
57
+ "rotary_scaling_factor": null,
58
+ "router_aux_loss_coef": 0.1,
59
+ "scale_attn_by_inverse_layer_idx": false,
60
+ "scale_attn_weights": true,
61
+ "summary_activation": null,
62
+ "summary_first_dropout": 0.1,
63
+ "summary_proj_to_labels": true,
64
+ "summary_type": "cls_index",
65
+ "summary_use_proj": true,
66
+ "torch_dtype": "float32",
67
+ "transformers_version": "4.43.0",
68
+ "type_vocab_size": 1,
69
+ "use_cache": true,
70
+ "use_flash_attn": true,
71
+ "use_rms_norm": null,
72
+ "use_xentropy": true,
73
+ "vocab_size": 250048
74
+ }
checkpoint-824/config_sentence_transformers.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.4.1",
4
+ "transformers": "4.43.0",
5
+ "pytorch": "2.6.0+cu124"
6
+ },
7
+ "prompts": {
8
+ "query": "search_query: ",
9
+ "passage": "search_document: ",
10
+ "Classification": "classification: ",
11
+ "MultilabelClassification": "classification: ",
12
+ "Clustering": "clustering: ",
13
+ "PairClassification": "classification: ",
14
+ "STS": "classification: ",
15
+ "Summarization": "classification: ",
16
+ "Speed": "search_document: "
17
+ },
18
+ "default_prompt_name": null,
19
+ "similarity_fn_name": "cosine"
20
+ }
checkpoint-824/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:68f2f4ba072bfa7c6627b309c57fecf3fb2906e1c2c335b351950b19645d224c
3
+ size 1901187232
checkpoint-824/modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
checkpoint-824/optimizer.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:55a9b814f52a6e224cb9d7b4865d3be8baa7e34f8f7fdd1ce8b6125599ed7d03
3
+ size 3802469370
checkpoint-824/rng_state.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:906504a436fbb1c5d023f09ec27c57dc3e2511770b1be28fd786d515abcb25f0
3
+ size 14244
checkpoint-824/scheduler.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:e31275b8609ead53eee7566b29cc534ba993ece49f2d45fa4ebb91647939b16e
3
+ size 1064
checkpoint-824/sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
checkpoint-824/sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
checkpoint-824/special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
checkpoint-824/tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
3
+ size 17082987
checkpoint-824/tokenizer_config.json ADDED
@@ -0,0 +1,54 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "mask_token": "<mask>",
49
+ "model_max_length": 512,
50
+ "pad_token": "<pad>",
51
+ "sep_token": "</s>",
52
+ "tokenizer_class": "XLMRobertaTokenizer",
53
+ "unk_token": "<unk>"
54
+ }
checkpoint-824/trainer_state.json ADDED
@@ -0,0 +1,773 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "best_metric": 0.2641617300886433,
3
+ "best_model_checkpoint": "Nomic/nomic-v2-tuned-1/checkpoint-824",
4
+ "epoch": 1.9996966479599574,
5
+ "eval_steps": 500,
6
+ "global_step": 824,
7
+ "is_hyper_param_search": false,
8
+ "is_local_process_zero": true,
9
+ "is_world_process_zero": true,
10
+ "log_history": [
11
+ {
12
+ "epoch": 0.024268163203397544,
13
+ "grad_norm": 6.184824466705322,
14
+ "learning_rate": 1.2121212121212122e-06,
15
+ "loss": 0.2108,
16
+ "step": 10
17
+ },
18
+ {
19
+ "epoch": 0.04853632640679509,
20
+ "grad_norm": 7.719327449798584,
21
+ "learning_rate": 2.4242424242424244e-06,
22
+ "loss": 0.1169,
23
+ "step": 20
24
+ },
25
+ {
26
+ "epoch": 0.07280448961019263,
27
+ "grad_norm": 4.0327959060668945,
28
+ "learning_rate": 3.6363636363636366e-06,
29
+ "loss": 0.1334,
30
+ "step": 30
31
+ },
32
+ {
33
+ "epoch": 0.09707265281359018,
34
+ "grad_norm": 5.168394088745117,
35
+ "learning_rate": 4.848484848484849e-06,
36
+ "loss": 0.0963,
37
+ "step": 40
38
+ },
39
+ {
40
+ "epoch": 0.12134081601698772,
41
+ "grad_norm": 14.108105659484863,
42
+ "learning_rate": 6.060606060606061e-06,
43
+ "loss": 0.127,
44
+ "step": 50
45
+ },
46
+ {
47
+ "epoch": 0.14560897922038527,
48
+ "grad_norm": 0.29993921518325806,
49
+ "learning_rate": 7.272727272727273e-06,
50
+ "loss": 0.1254,
51
+ "step": 60
52
+ },
53
+ {
54
+ "epoch": 0.1698771424237828,
55
+ "grad_norm": 1.5108305215835571,
56
+ "learning_rate": 8.484848484848486e-06,
57
+ "loss": 0.048,
58
+ "step": 70
59
+ },
60
+ {
61
+ "epoch": 0.19414530562718035,
62
+ "grad_norm": 2.570068836212158,
63
+ "learning_rate": 9.696969696969698e-06,
64
+ "loss": 0.0358,
65
+ "step": 80
66
+ },
67
+ {
68
+ "epoch": 0.21841346883057788,
69
+ "grad_norm": 13.097607612609863,
70
+ "learning_rate": 1.0909090909090909e-05,
71
+ "loss": 0.0673,
72
+ "step": 90
73
+ },
74
+ {
75
+ "epoch": 0.24268163203397544,
76
+ "grad_norm": 4.809088230133057,
77
+ "learning_rate": 1.2121212121212122e-05,
78
+ "loss": 0.049,
79
+ "step": 100
80
+ },
81
+ {
82
+ "epoch": 0.26694979523737294,
83
+ "grad_norm": 0.4637127220630646,
84
+ "learning_rate": 1.3333333333333333e-05,
85
+ "loss": 0.0222,
86
+ "step": 110
87
+ },
88
+ {
89
+ "epoch": 0.29121795844077053,
90
+ "grad_norm": 3.315945625305176,
91
+ "learning_rate": 1.4545454545454546e-05,
92
+ "loss": 0.0657,
93
+ "step": 120
94
+ },
95
+ {
96
+ "epoch": 0.31548612164416806,
97
+ "grad_norm": 1.816904067993164,
98
+ "learning_rate": 1.575757575757576e-05,
99
+ "loss": 0.0878,
100
+ "step": 130
101
+ },
102
+ {
103
+ "epoch": 0.3397542848475656,
104
+ "grad_norm": 0.5492209792137146,
105
+ "learning_rate": 1.6969696969696972e-05,
106
+ "loss": 0.0396,
107
+ "step": 140
108
+ },
109
+ {
110
+ "epoch": 0.3640224480509631,
111
+ "grad_norm": 0.6514124274253845,
112
+ "learning_rate": 1.8181818181818182e-05,
113
+ "loss": 0.033,
114
+ "step": 150
115
+ },
116
+ {
117
+ "epoch": 0.3882906112543607,
118
+ "grad_norm": 0.20525218546390533,
119
+ "learning_rate": 1.9393939393939395e-05,
120
+ "loss": 0.0562,
121
+ "step": 160
122
+ },
123
+ {
124
+ "epoch": 0.41255877445775824,
125
+ "grad_norm": 12.202320098876953,
126
+ "learning_rate": 1.999943905097692e-05,
127
+ "loss": 0.0329,
128
+ "step": 170
129
+ },
130
+ {
131
+ "epoch": 0.43682693766115577,
132
+ "grad_norm": 7.067898273468018,
133
+ "learning_rate": 1.9994951836381796e-05,
134
+ "loss": 0.0918,
135
+ "step": 180
136
+ },
137
+ {
138
+ "epoch": 0.4610951008645533,
139
+ "grad_norm": 0.13020876049995422,
140
+ "learning_rate": 1.998597942081397e-05,
141
+ "loss": 0.0198,
142
+ "step": 190
143
+ },
144
+ {
145
+ "epoch": 0.4853632640679509,
146
+ "grad_norm": 0.3073924779891968,
147
+ "learning_rate": 1.9972525830614725e-05,
148
+ "loss": 0.0181,
149
+ "step": 200
150
+ },
151
+ {
152
+ "epoch": 0.5096314272713484,
153
+ "grad_norm": 0.40409696102142334,
154
+ "learning_rate": 1.9954597103037342e-05,
155
+ "loss": 0.0119,
156
+ "step": 210
157
+ },
158
+ {
159
+ "epoch": 0.5338995904747459,
160
+ "grad_norm": 2.918846845626831,
161
+ "learning_rate": 1.9932201283537935e-05,
162
+ "loss": 0.0139,
163
+ "step": 220
164
+ },
165
+ {
166
+ "epoch": 0.5581677536781435,
167
+ "grad_norm": 8.526318550109863,
168
+ "learning_rate": 1.9905348422165075e-05,
169
+ "loss": 0.057,
170
+ "step": 230
171
+ },
172
+ {
173
+ "epoch": 0.5824359168815411,
174
+ "grad_norm": 10.81310749053955,
175
+ "learning_rate": 1.987405056904986e-05,
176
+ "loss": 0.0293,
177
+ "step": 240
178
+ },
179
+ {
180
+ "epoch": 0.6067040800849386,
181
+ "grad_norm": 0.8693222999572754,
182
+ "learning_rate": 1.9838321768998462e-05,
183
+ "loss": 0.0482,
184
+ "step": 250
185
+ },
186
+ {
187
+ "epoch": 0.6309722432883361,
188
+ "grad_norm": 5.930874347686768,
189
+ "learning_rate": 1.9798178055189563e-05,
190
+ "loss": 0.017,
191
+ "step": 260
192
+ },
193
+ {
194
+ "epoch": 0.6552404064917337,
195
+ "grad_norm": 4.582831859588623,
196
+ "learning_rate": 1.9753637441979533e-05,
197
+ "loss": 0.0927,
198
+ "step": 270
199
+ },
200
+ {
201
+ "epoch": 0.6795085696951312,
202
+ "grad_norm": 0.19732092320919037,
203
+ "learning_rate": 1.970471991681853e-05,
204
+ "loss": 0.0187,
205
+ "step": 280
206
+ },
207
+ {
208
+ "epoch": 0.7037767328985287,
209
+ "grad_norm": 0.7359830141067505,
210
+ "learning_rate": 1.9651447431281213e-05,
211
+ "loss": 0.0553,
212
+ "step": 290
213
+ },
214
+ {
215
+ "epoch": 0.7280448961019262,
216
+ "grad_norm": 0.4606100618839264,
217
+ "learning_rate": 1.9593843891216035e-05,
218
+ "loss": 0.015,
219
+ "step": 300
220
+ },
221
+ {
222
+ "epoch": 0.7523130593053239,
223
+ "grad_norm": 0.9894680380821228,
224
+ "learning_rate": 1.9531935146017595e-05,
225
+ "loss": 0.0438,
226
+ "step": 310
227
+ },
228
+ {
229
+ "epoch": 0.7765812225087214,
230
+ "grad_norm": 0.13739630579948425,
231
+ "learning_rate": 1.9465748977026782e-05,
232
+ "loss": 0.0087,
233
+ "step": 320
234
+ },
235
+ {
236
+ "epoch": 0.8008493857121189,
237
+ "grad_norm": 0.3315618336200714,
238
+ "learning_rate": 1.9395315085064007e-05,
239
+ "loss": 0.038,
240
+ "step": 330
241
+ },
242
+ {
243
+ "epoch": 0.8251175489155165,
244
+ "grad_norm": 0.17197982966899872,
245
+ "learning_rate": 1.9320665077101066e-05,
246
+ "loss": 0.0243,
247
+ "step": 340
248
+ },
249
+ {
250
+ "epoch": 0.849385712118914,
251
+ "grad_norm": 4.819814682006836,
252
+ "learning_rate": 1.92418324520776e-05,
253
+ "loss": 0.015,
254
+ "step": 350
255
+ },
256
+ {
257
+ "epoch": 0.8736538753223115,
258
+ "grad_norm": 4.6382365226745605,
259
+ "learning_rate": 1.9158852585868575e-05,
260
+ "loss": 0.0199,
261
+ "step": 360
262
+ },
263
+ {
264
+ "epoch": 0.8979220385257091,
265
+ "grad_norm": 0.15649013221263885,
266
+ "learning_rate": 1.9071762715409474e-05,
267
+ "loss": 0.0516,
268
+ "step": 370
269
+ },
270
+ {
271
+ "epoch": 0.9221902017291066,
272
+ "grad_norm": 9.212163925170898,
273
+ "learning_rate": 1.8980601921986332e-05,
274
+ "loss": 0.0561,
275
+ "step": 380
276
+ },
277
+ {
278
+ "epoch": 0.9464583649325041,
279
+ "grad_norm": 1.8409303426742554,
280
+ "learning_rate": 1.888541111369816e-05,
281
+ "loss": 0.0851,
282
+ "step": 390
283
+ },
284
+ {
285
+ "epoch": 0.9707265281359018,
286
+ "grad_norm": 0.0260617733001709,
287
+ "learning_rate": 1.878623300709957e-05,
288
+ "loss": 0.0394,
289
+ "step": 400
290
+ },
291
+ {
292
+ "epoch": 0.9949946913392993,
293
+ "grad_norm": 0.475887656211853,
294
+ "learning_rate": 1.8683112108031856e-05,
295
+ "loss": 0.0114,
296
+ "step": 410
297
+ },
298
+ {
299
+ "epoch": 0.9998483239799788,
300
+ "eval_dim_128_cosine_accuracy@1": 0.0034106412005457027,
301
+ "eval_dim_128_cosine_accuracy@10": 0.6609822646657572,
302
+ "eval_dim_128_cosine_accuracy@3": 0.06207366984993179,
303
+ "eval_dim_128_cosine_accuracy@5": 0.35129604365620737,
304
+ "eval_dim_128_cosine_map@100": 0.15352648780478836,
305
+ "eval_dim_128_cosine_mrr@10": 0.1384457762186259,
306
+ "eval_dim_128_cosine_ndcg@10": 0.25968761539611496,
307
+ "eval_dim_128_cosine_precision@1": 0.0034106412005457027,
308
+ "eval_dim_128_cosine_precision@10": 0.06609822646657572,
309
+ "eval_dim_128_cosine_precision@3": 0.020691223283310592,
310
+ "eval_dim_128_cosine_precision@5": 0.07025920873124147,
311
+ "eval_dim_128_cosine_recall@1": 0.0034106412005457027,
312
+ "eval_dim_128_cosine_recall@10": 0.6609822646657572,
313
+ "eval_dim_128_cosine_recall@3": 0.06207366984993179,
314
+ "eval_dim_128_cosine_recall@5": 0.35129604365620737,
315
+ "eval_dim_256_cosine_accuracy@1": 0.006139154160982265,
316
+ "eval_dim_256_cosine_accuracy@10": 0.6957708049113234,
317
+ "eval_dim_256_cosine_accuracy@3": 0.059345156889495224,
318
+ "eval_dim_256_cosine_accuracy@5": 0.3969986357435198,
319
+ "eval_dim_256_cosine_map@100": 0.1608969666312337,
320
+ "eval_dim_256_cosine_mrr@10": 0.14680563676129663,
321
+ "eval_dim_256_cosine_ndcg@10": 0.2742190784977125,
322
+ "eval_dim_256_cosine_precision@1": 0.006139154160982265,
323
+ "eval_dim_256_cosine_precision@10": 0.06957708049113233,
324
+ "eval_dim_256_cosine_precision@3": 0.019781718963165072,
325
+ "eval_dim_256_cosine_precision@5": 0.07939972714870396,
326
+ "eval_dim_256_cosine_recall@1": 0.006139154160982265,
327
+ "eval_dim_256_cosine_recall@10": 0.6957708049113234,
328
+ "eval_dim_256_cosine_recall@3": 0.059345156889495224,
329
+ "eval_dim_256_cosine_recall@5": 0.3969986357435198,
330
+ "eval_dim_512_cosine_accuracy@1": 0.004092769440654843,
331
+ "eval_dim_512_cosine_accuracy@10": 0.708731241473397,
332
+ "eval_dim_512_cosine_accuracy@3": 0.054570259208731244,
333
+ "eval_dim_512_cosine_accuracy@5": 0.4045020463847203,
334
+ "eval_dim_512_cosine_map@100": 0.16179009192949412,
335
+ "eval_dim_512_cosine_mrr@10": 0.14763068710885704,
336
+ "eval_dim_512_cosine_ndcg@10": 0.2778537691360626,
337
+ "eval_dim_512_cosine_precision@1": 0.004092769440654843,
338
+ "eval_dim_512_cosine_precision@10": 0.07087312414733969,
339
+ "eval_dim_512_cosine_precision@3": 0.01819008640291041,
340
+ "eval_dim_512_cosine_precision@5": 0.08090040927694407,
341
+ "eval_dim_512_cosine_recall@1": 0.004092769440654843,
342
+ "eval_dim_512_cosine_recall@10": 0.708731241473397,
343
+ "eval_dim_512_cosine_recall@3": 0.054570259208731244,
344
+ "eval_dim_512_cosine_recall@5": 0.4045020463847203,
345
+ "eval_dim_64_cosine_accuracy@1": 0.004092769440654843,
346
+ "eval_dim_64_cosine_accuracy@10": 0.5750341064120055,
347
+ "eval_dim_64_cosine_accuracy@3": 0.048431105047748974,
348
+ "eval_dim_64_cosine_accuracy@5": 0.3144611186903138,
349
+ "eval_dim_64_cosine_map@100": 0.1367884100889619,
350
+ "eval_dim_64_cosine_mrr@10": 0.11982692349336187,
351
+ "eval_dim_64_cosine_ndcg@10": 0.2252854715830182,
352
+ "eval_dim_64_cosine_precision@1": 0.004092769440654843,
353
+ "eval_dim_64_cosine_precision@10": 0.05750341064120054,
354
+ "eval_dim_64_cosine_precision@3": 0.01614370168258299,
355
+ "eval_dim_64_cosine_precision@5": 0.06289222373806276,
356
+ "eval_dim_64_cosine_recall@1": 0.004092769440654843,
357
+ "eval_dim_64_cosine_recall@10": 0.5750341064120055,
358
+ "eval_dim_64_cosine_recall@3": 0.048431105047748974,
359
+ "eval_dim_64_cosine_recall@5": 0.3144611186903138,
360
+ "eval_dim_768_cosine_accuracy@1": 0.002728512960436562,
361
+ "eval_dim_768_cosine_accuracy@10": 0.7175989085948158,
362
+ "eval_dim_768_cosine_accuracy@3": 0.059345156889495224,
363
+ "eval_dim_768_cosine_accuracy@5": 0.40109140518417463,
364
+ "eval_dim_768_cosine_map@100": 0.1621927494042191,
365
+ "eval_dim_768_cosine_mrr@10": 0.1485466878884321,
366
+ "eval_dim_768_cosine_ndcg@10": 0.2805856733257871,
367
+ "eval_dim_768_cosine_precision@1": 0.002728512960436562,
368
+ "eval_dim_768_cosine_precision@10": 0.07175989085948158,
369
+ "eval_dim_768_cosine_precision@3": 0.019781718963165072,
370
+ "eval_dim_768_cosine_precision@5": 0.08021828103683493,
371
+ "eval_dim_768_cosine_recall@1": 0.002728512960436562,
372
+ "eval_dim_768_cosine_recall@10": 0.7175989085948158,
373
+ "eval_dim_768_cosine_recall@3": 0.059345156889495224,
374
+ "eval_dim_768_cosine_recall@5": 0.40109140518417463,
375
+ "eval_runtime": 311.6214,
376
+ "eval_samples_per_second": 0.0,
377
+ "eval_sequential_score": 0.2252854715830182,
378
+ "eval_steps_per_second": 0.0,
379
+ "step": 412
380
+ },
381
+ {
382
+ "epoch": 1.0192628545426967,
383
+ "grad_norm": 0.07392042130231857,
384
+ "learning_rate": 1.8576094691651153e-05,
385
+ "loss": 0.0136,
386
+ "step": 420
387
+ },
388
+ {
389
+ "epoch": 1.0435310177460944,
390
+ "grad_norm": 3.5508384704589844,
391
+ "learning_rate": 1.8465228781662618e-05,
392
+ "loss": 0.1219,
393
+ "step": 430
394
+ },
395
+ {
396
+ "epoch": 1.0677991809494918,
397
+ "grad_norm": 5.711903095245361,
398
+ "learning_rate": 1.8350564128769955e-05,
399
+ "loss": 0.0164,
400
+ "step": 440
401
+ },
402
+ {
403
+ "epoch": 1.0920673441528894,
404
+ "grad_norm": 1.1452428102493286,
405
+ "learning_rate": 1.8232152188349946e-05,
406
+ "loss": 0.0927,
407
+ "step": 450
408
+ },
409
+ {
410
+ "epoch": 1.116335507356287,
411
+ "grad_norm": 1.4943727254867554,
412
+ "learning_rate": 1.8110046097362033e-05,
413
+ "loss": 0.0268,
414
+ "step": 460
415
+ },
416
+ {
417
+ "epoch": 1.1406036705596845,
418
+ "grad_norm": 1.8914352655410767,
419
+ "learning_rate": 1.7984300650503282e-05,
420
+ "loss": 0.0384,
421
+ "step": 470
422
+ },
423
+ {
424
+ "epoch": 1.1648718337630821,
425
+ "grad_norm": 0.11347553879022598,
426
+ "learning_rate": 1.7854972275619453e-05,
427
+ "loss": 0.0034,
428
+ "step": 480
429
+ },
430
+ {
431
+ "epoch": 1.1891399969664795,
432
+ "grad_norm": 8.961676597595215,
433
+ "learning_rate": 1.772211900838318e-05,
434
+ "loss": 0.0183,
435
+ "step": 490
436
+ },
437
+ {
438
+ "epoch": 1.2134081601698772,
439
+ "grad_norm": 21.69032096862793,
440
+ "learning_rate": 1.758580046625068e-05,
441
+ "loss": 0.0594,
442
+ "step": 500
443
+ },
444
+ {
445
+ "epoch": 1.2376763233732746,
446
+ "grad_norm": 3.1777877807617188,
447
+ "learning_rate": 1.7446077821708596e-05,
448
+ "loss": 0.0145,
449
+ "step": 510
450
+ },
451
+ {
452
+ "epoch": 1.2619444865766722,
453
+ "grad_norm": 1.400813102722168,
454
+ "learning_rate": 1.730301377482307e-05,
455
+ "loss": 0.0768,
456
+ "step": 520
457
+ },
458
+ {
459
+ "epoch": 1.2862126497800697,
460
+ "grad_norm": 0.12172400206327438,
461
+ "learning_rate": 1.715667252510329e-05,
462
+ "loss": 0.0084,
463
+ "step": 530
464
+ },
465
+ {
466
+ "epoch": 1.3104808129834673,
467
+ "grad_norm": 0.021951694041490555,
468
+ "learning_rate": 1.700711974269218e-05,
469
+ "loss": 0.0528,
470
+ "step": 540
471
+ },
472
+ {
473
+ "epoch": 1.334748976186865,
474
+ "grad_norm": 0.030643614009022713,
475
+ "learning_rate": 1.6854422538897136e-05,
476
+ "loss": 0.0619,
477
+ "step": 550
478
+ },
479
+ {
480
+ "epoch": 1.3590171393902624,
481
+ "grad_norm": 4.491604804992676,
482
+ "learning_rate": 1.6698649436074063e-05,
483
+ "loss": 0.0326,
484
+ "step": 560
485
+ },
486
+ {
487
+ "epoch": 1.38328530259366,
488
+ "grad_norm": 0.42146193981170654,
489
+ "learning_rate": 1.65398703368782e-05,
490
+ "loss": 0.0135,
491
+ "step": 570
492
+ },
493
+ {
494
+ "epoch": 1.4075534657970574,
495
+ "grad_norm": 0.09300685673952103,
496
+ "learning_rate": 1.6378156492895524e-05,
497
+ "loss": 0.0143,
498
+ "step": 580
499
+ },
500
+ {
501
+ "epoch": 1.431821629000455,
502
+ "grad_norm": 2.0742526054382324,
503
+ "learning_rate": 1.6213580472668856e-05,
504
+ "loss": 0.0952,
505
+ "step": 590
506
+ },
507
+ {
508
+ "epoch": 1.4560897922038527,
509
+ "grad_norm": 2.740499973297119,
510
+ "learning_rate": 1.604621612913297e-05,
511
+ "loss": 0.0188,
512
+ "step": 600
513
+ },
514
+ {
515
+ "epoch": 1.4803579554072501,
516
+ "grad_norm": 0.09577389806509018,
517
+ "learning_rate": 1.5876138566473327e-05,
518
+ "loss": 0.01,
519
+ "step": 610
520
+ },
521
+ {
522
+ "epoch": 1.5046261186106475,
523
+ "grad_norm": 1.9737666845321655,
524
+ "learning_rate": 1.5703424106423335e-05,
525
+ "loss": 0.091,
526
+ "step": 620
527
+ },
528
+ {
529
+ "epoch": 1.5288942818140452,
530
+ "grad_norm": 0.018516847863793373,
531
+ "learning_rate": 1.5528150254015225e-05,
532
+ "loss": 0.0205,
533
+ "step": 630
534
+ },
535
+ {
536
+ "epoch": 1.5531624450174428,
537
+ "grad_norm": 0.0974857360124588,
538
+ "learning_rate": 1.5350395662799925e-05,
539
+ "loss": 0.0156,
540
+ "step": 640
541
+ },
542
+ {
543
+ "epoch": 1.5774306082208402,
544
+ "grad_norm": 1.012096881866455,
545
+ "learning_rate": 1.5170240099551547e-05,
546
+ "loss": 0.0101,
547
+ "step": 650
548
+ },
549
+ {
550
+ "epoch": 1.6016987714242377,
551
+ "grad_norm": 0.4372600317001343,
552
+ "learning_rate": 1.4987764408472327e-05,
553
+ "loss": 0.022,
554
+ "step": 660
555
+ },
556
+ {
557
+ "epoch": 1.6259669346276353,
558
+ "grad_norm": 1.3607388734817505,
559
+ "learning_rate": 1.4803050474914034e-05,
560
+ "loss": 0.0135,
561
+ "step": 670
562
+ },
563
+ {
564
+ "epoch": 1.650235097831033,
565
+ "grad_norm": 0.1327061802148819,
566
+ "learning_rate": 1.4616181188632229e-05,
567
+ "loss": 0.0226,
568
+ "step": 680
569
+ },
570
+ {
571
+ "epoch": 1.6745032610344306,
572
+ "grad_norm": 0.31588563323020935,
573
+ "learning_rate": 1.4427240406589727e-05,
574
+ "loss": 0.0032,
575
+ "step": 690
576
+ },
577
+ {
578
+ "epoch": 1.698771424237828,
579
+ "grad_norm": 1.2134084701538086,
580
+ "learning_rate": 1.4236312915326108e-05,
581
+ "loss": 0.0071,
582
+ "step": 700
583
+ },
584
+ {
585
+ "epoch": 1.7230395874412254,
586
+ "grad_norm": 0.06816510111093521,
587
+ "learning_rate": 1.4043484392910014e-05,
588
+ "loss": 0.028,
589
+ "step": 710
590
+ },
591
+ {
592
+ "epoch": 1.747307750644623,
593
+ "grad_norm": 0.3962950110435486,
594
+ "learning_rate": 1.3848841370491416e-05,
595
+ "loss": 0.0351,
596
+ "step": 720
597
+ },
598
+ {
599
+ "epoch": 1.7715759138480207,
600
+ "grad_norm": 0.06974906474351883,
601
+ "learning_rate": 1.3652471193471049e-05,
602
+ "loss": 0.0021,
603
+ "step": 730
604
+ },
605
+ {
606
+ "epoch": 1.7958440770514181,
607
+ "grad_norm": 0.08050140738487244,
608
+ "learning_rate": 1.345446198230446e-05,
609
+ "loss": 0.0073,
610
+ "step": 740
611
+ },
612
+ {
613
+ "epoch": 1.8201122402548155,
614
+ "grad_norm": 0.04942511394619942,
615
+ "learning_rate": 1.3254902592958242e-05,
616
+ "loss": 0.0103,
617
+ "step": 750
618
+ },
619
+ {
620
+ "epoch": 1.8443804034582132,
621
+ "grad_norm": 0.17193569242954254,
622
+ "learning_rate": 1.3053882577036236e-05,
623
+ "loss": 0.0219,
624
+ "step": 760
625
+ },
626
+ {
627
+ "epoch": 1.8686485666616108,
628
+ "grad_norm": 0.011188509874045849,
629
+ "learning_rate": 1.2851492141593531e-05,
630
+ "loss": 0.0035,
631
+ "step": 770
632
+ },
633
+ {
634
+ "epoch": 1.8929167298650085,
635
+ "grad_norm": 21.107633590698242,
636
+ "learning_rate": 1.264782210865637e-05,
637
+ "loss": 0.0579,
638
+ "step": 780
639
+ },
640
+ {
641
+ "epoch": 1.917184893068406,
642
+ "grad_norm": 0.6288430690765381,
643
+ "learning_rate": 1.2442963874466044e-05,
644
+ "loss": 0.0298,
645
+ "step": 790
646
+ },
647
+ {
648
+ "epoch": 1.9414530562718033,
649
+ "grad_norm": 0.9807838201522827,
650
+ "learning_rate": 1.2237009368465171e-05,
651
+ "loss": 0.0076,
652
+ "step": 800
653
+ },
654
+ {
655
+ "epoch": 1.965721219475201,
656
+ "grad_norm": 0.4862402379512787,
657
+ "learning_rate": 1.2030051012044644e-05,
658
+ "loss": 0.0038,
659
+ "step": 810
660
+ },
661
+ {
662
+ "epoch": 1.9899893826785986,
663
+ "grad_norm": 0.32241472601890564,
664
+ "learning_rate": 1.1822181677069855e-05,
665
+ "loss": 0.0016,
666
+ "step": 820
667
+ },
668
+ {
669
+ "epoch": 1.9996966479599574,
670
+ "eval_dim_128_cosine_accuracy@1": 0.007503410641200546,
671
+ "eval_dim_128_cosine_accuracy@10": 0.665075034106412,
672
+ "eval_dim_128_cosine_accuracy@3": 0.06070941336971351,
673
+ "eval_dim_128_cosine_accuracy@5": 0.37312414733969984,
674
+ "eval_dim_128_cosine_map@100": 0.15984371570467878,
675
+ "eval_dim_128_cosine_mrr@10": 0.1428284501613273,
676
+ "eval_dim_128_cosine_ndcg@10": 0.2641617300886433,
677
+ "eval_dim_128_cosine_precision@1": 0.007503410641200546,
678
+ "eval_dim_128_cosine_precision@10": 0.0665075034106412,
679
+ "eval_dim_128_cosine_precision@3": 0.020236471123237832,
680
+ "eval_dim_128_cosine_precision@5": 0.07462482946793998,
681
+ "eval_dim_128_cosine_recall@1": 0.007503410641200546,
682
+ "eval_dim_128_cosine_recall@10": 0.665075034106412,
683
+ "eval_dim_128_cosine_recall@3": 0.06070941336971351,
684
+ "eval_dim_128_cosine_recall@5": 0.37312414733969984,
685
+ "eval_dim_256_cosine_accuracy@1": 0.009549795361527967,
686
+ "eval_dim_256_cosine_accuracy@10": 0.713506139154161,
687
+ "eval_dim_256_cosine_accuracy@3": 0.0723055934515689,
688
+ "eval_dim_256_cosine_accuracy@5": 0.4106412005457026,
689
+ "eval_dim_256_cosine_map@100": 0.17096884521775468,
690
+ "eval_dim_256_cosine_mrr@10": 0.1559981268541958,
691
+ "eval_dim_256_cosine_ndcg@10": 0.28559481472300186,
692
+ "eval_dim_256_cosine_precision@1": 0.009549795361527967,
693
+ "eval_dim_256_cosine_precision@10": 0.07135061391541608,
694
+ "eval_dim_256_cosine_precision@3": 0.024101864483856296,
695
+ "eval_dim_256_cosine_precision@5": 0.08212824010914052,
696
+ "eval_dim_256_cosine_recall@1": 0.009549795361527967,
697
+ "eval_dim_256_cosine_recall@10": 0.713506139154161,
698
+ "eval_dim_256_cosine_recall@3": 0.0723055934515689,
699
+ "eval_dim_256_cosine_recall@5": 0.4106412005457026,
700
+ "eval_dim_512_cosine_accuracy@1": 0.007503410641200546,
701
+ "eval_dim_512_cosine_accuracy@10": 0.7285129604365621,
702
+ "eval_dim_512_cosine_accuracy@3": 0.0688949522510232,
703
+ "eval_dim_512_cosine_accuracy@5": 0.40654843110504774,
704
+ "eval_dim_512_cosine_map@100": 0.1702634278904753,
705
+ "eval_dim_512_cosine_mrr@10": 0.15564731804499674,
706
+ "eval_dim_512_cosine_ndcg@10": 0.28864373602538085,
707
+ "eval_dim_512_cosine_precision@1": 0.007503410641200546,
708
+ "eval_dim_512_cosine_precision@10": 0.0728512960436562,
709
+ "eval_dim_512_cosine_precision@3": 0.022964984083674395,
710
+ "eval_dim_512_cosine_precision@5": 0.08130968622100954,
711
+ "eval_dim_512_cosine_recall@1": 0.007503410641200546,
712
+ "eval_dim_512_cosine_recall@10": 0.7285129604365621,
713
+ "eval_dim_512_cosine_recall@3": 0.0688949522510232,
714
+ "eval_dim_512_cosine_recall@5": 0.40654843110504774,
715
+ "eval_dim_64_cosine_accuracy@1": 0.0047748976807639835,
716
+ "eval_dim_64_cosine_accuracy@10": 0.6125511596180082,
717
+ "eval_dim_64_cosine_accuracy@3": 0.05798090040927694,
718
+ "eval_dim_64_cosine_accuracy@5": 0.33901773533424284,
719
+ "eval_dim_64_cosine_map@100": 0.14541967837644934,
720
+ "eval_dim_64_cosine_mrr@10": 0.12895282487710774,
721
+ "eval_dim_64_cosine_ndcg@10": 0.24113965638184232,
722
+ "eval_dim_64_cosine_precision@1": 0.0047748976807639835,
723
+ "eval_dim_64_cosine_precision@10": 0.06125511596180082,
724
+ "eval_dim_64_cosine_precision@3": 0.019326966803092312,
725
+ "eval_dim_64_cosine_precision@5": 0.06780354706684857,
726
+ "eval_dim_64_cosine_recall@1": 0.0047748976807639835,
727
+ "eval_dim_64_cosine_recall@10": 0.6125511596180082,
728
+ "eval_dim_64_cosine_recall@3": 0.05798090040927694,
729
+ "eval_dim_64_cosine_recall@5": 0.33901773533424284,
730
+ "eval_dim_768_cosine_accuracy@1": 0.008867667121418827,
731
+ "eval_dim_768_cosine_accuracy@10": 0.742837653478854,
732
+ "eval_dim_768_cosine_accuracy@3": 0.07025920873124147,
733
+ "eval_dim_768_cosine_accuracy@5": 0.40313778990450205,
734
+ "eval_dim_768_cosine_map@100": 0.17294783798650806,
735
+ "eval_dim_768_cosine_mrr@10": 0.15909747937373914,
736
+ "eval_dim_768_cosine_ndcg@10": 0.29453813752341906,
737
+ "eval_dim_768_cosine_precision@1": 0.008867667121418827,
738
+ "eval_dim_768_cosine_precision@10": 0.0742837653478854,
739
+ "eval_dim_768_cosine_precision@3": 0.023419736243747154,
740
+ "eval_dim_768_cosine_precision@5": 0.08062755798090042,
741
+ "eval_dim_768_cosine_recall@1": 0.008867667121418827,
742
+ "eval_dim_768_cosine_recall@10": 0.742837653478854,
743
+ "eval_dim_768_cosine_recall@3": 0.07025920873124147,
744
+ "eval_dim_768_cosine_recall@5": 0.40313778990450205,
745
+ "eval_runtime": 312.3268,
746
+ "eval_samples_per_second": 0.0,
747
+ "eval_sequential_score": 0.24113965638184232,
748
+ "eval_steps_per_second": 0.0,
749
+ "step": 824
750
+ }
751
+ ],
752
+ "logging_steps": 10,
753
+ "max_steps": 1648,
754
+ "num_input_tokens_seen": 0,
755
+ "num_train_epochs": 4,
756
+ "save_steps": 500,
757
+ "stateful_callbacks": {
758
+ "TrainerControl": {
759
+ "args": {
760
+ "should_epoch_stop": false,
761
+ "should_evaluate": false,
762
+ "should_log": false,
763
+ "should_save": true,
764
+ "should_training_stop": false
765
+ },
766
+ "attributes": {}
767
+ }
768
+ },
769
+ "total_flos": 0.0,
770
+ "train_batch_size": 2,
771
+ "trial_name": null,
772
+ "trial_params": null
773
+ }