End of training

Browse files

Files changed (8) hide show

README.md +30 -17
config.json +1 -2
model.safetensors +1 -1
special_tokens_map.json +5 -35
tokenizer.json +66 -66
tokenizer_config.json +4 -4
training_args.bin +1 -1
vocab.txt +63 -63

README.md CHANGED Viewed

@@ -1,8 +1,10 @@
 ---
 library_name: transformers
-base_model: dccuchile/bert-base-spanish-wwm-cased
 tags:
 - generated_from_trainer
 model-index:
 - name: fge-robos-qa-model
   results: []
@@ -13,9 +15,20 @@ should probably proofread and complete it, then remove this comment. -->
 # fge-robos-qa-model
-This model is a fine-tuned version of [dccuchile/bert-base-spanish-wwm-cased](https://huggingface.co/dccuchile/bert-base-spanish-wwm-cased) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.8956
 ## Model description
@@ -35,8 +48,8 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
-- train_batch_size: 16
-- eval_batch_size: 16
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
@@ -45,18 +58,18 @@ The following hyperparameters were used during training:
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss |
-|:-------------:|:-----:|:----:|:---------------:|
-| No log        | 1.0   | 229  | 1.0382          |
-| No log        | 2.0   | 458  | 1.0590          |
-| 0.6421        | 3.0   | 687  | 1.1701          |
-| 0.6421        | 4.0   | 916  | 1.3936          |
-| 0.4066        | 5.0   | 1145 | 1.5411          |
-| 0.4066        | 6.0   | 1374 | 1.5978          |
-| 0.2398        | 7.0   | 1603 | 1.7463          |
-| 0.2398        | 8.0   | 1832 | 1.8142          |
-| 0.1561        | 9.0   | 2061 | 1.8658          |
-| 0.1561        | 10.0  | 2290 | 1.8956          |
 ### Framework versions

 ---
 library_name: transformers
+base_model: mrm8488/bert-base-spanish-wwm-cased-finetuned-spa-squad2-es
 tags:
 - generated_from_trainer
+metrics:
+- f1
 model-index:
 - name: fge-robos-qa-model
   results: []
 # fge-robos-qa-model
+This model is a fine-tuned version of [mrm8488/bert-base-spanish-wwm-cased-finetuned-spa-squad2-es](https://huggingface.co/mrm8488/bert-base-spanish-wwm-cased-finetuned-spa-squad2-es) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.0088
+- Model Preparation Time: 0.0077
+- Exact: 55.7377
+- F1: 82.8805
+- Total: 915
+- Hasans Exact: 55.7377
+- Hasans F1: 82.8805
+- Hasans Total: 915
+- Best Exact: 55.7377
+- Best Exact Thresh: 0.0
+- Best F1: 82.8805
+- Best F1 Thresh: 0.0
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
+- train_batch_size: 64
+- eval_batch_size: 64
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss | Model Preparation Time | Exact   | F1      | Total | Hasans Exact | Hasans F1 | Hasans Total | Best Exact | Best Exact Thresh | Best F1 | Best F1 Thresh |
+|:-------------:|:-----:|:----:|:---------------:|:----------------------:|:-------:|:-------:|:-----:|:------------:|:---------:|:------------:|:----------:|:-----------------:|:-------:|:--------------:|
+| No log        | 1.0   | 58   | 0.8963          | 0.0077                 | 54.2077 | 81.4281 | 915   | 54.2077      | 81.4281   | 915          | 54.2077    | 0.0               | 81.4281 | 0.0            |
+| No log        | 2.0   | 116  | 0.9578          | 0.0077                 | 54.9727 | 82.3694 | 915   | 54.9727      | 82.3694   | 915          | 54.9727    | 0.0               | 82.3694 | 0.0            |
+| No log        | 3.0   | 174  | 1.0088          | 0.0077                 | 55.7377 | 82.8805 | 915   | 55.7377      | 82.8805   | 915          | 55.7377    | 0.0               | 82.8805 | 0.0            |
+| No log        | 4.0   | 232  | 1.0865          | 0.0077                 | 54.4262 | 81.7459 | 915   | 54.4262      | 81.7459   | 915          | 54.4262    | 0.0               | 81.7459 | 0.0            |
+| No log        | 5.0   | 290  | 1.2034          | 0.0077                 | 53.7705 | 81.5328 | 915   | 53.7705      | 81.5328   | 915          | 53.7705    | 0.0               | 81.5328 | 0.0            |
+| No log        | 6.0   | 348  | 1.2822          | 0.0077                 | 54.2077 | 81.9985 | 915   | 54.2077      | 81.9985   | 915          | 54.2077    | 0.0               | 81.9985 | 0.0            |
+| No log        | 7.0   | 406  | 1.3357          | 0.0077                 | 54.2077 | 81.7294 | 915   | 54.2077      | 81.7294   | 915          | 54.2077    | 0.0               | 81.7294 | 0.0            |
+| No log        | 8.0   | 464  | 1.3738          | 0.0077                 | 54.6448 | 81.9526 | 915   | 54.6448      | 81.9526   | 915          | 54.6448    | 0.0               | 81.9526 | 0.0            |
+| 0.4292        | 9.0   | 522  | 1.4215          | 0.0077                 | 54.7541 | 81.7385 | 915   | 54.7541      | 81.7385   | 915          | 54.7541    | 0.0               | 81.7385 | 0.0            |
+| 0.4292        | 10.0  | 580  | 1.4342          | 0.0077                 | 53.4426 | 81.3729 | 915   | 53.4426      | 81.3729   | 915          | 53.4426    | 0.0               | 81.3729 | 0.0            |
 ### Framework versions

config.json CHANGED Viewed

@@ -1,11 +1,10 @@
 {
-  "_name_or_path": "dccuchile/bert-base-spanish-wwm-cased",
   "architectures": [
     "BertForQuestionAnswering"
   ],
   "attention_probs_dropout_prob": 0.1,
   "classifier_dropout": null,
-  "gradient_checkpointing": false,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,

 {
+  "_name_or_path": "mrm8488/bert-base-spanish-wwm-cased-finetuned-spa-squad2-es",
   "architectures": [
     "BertForQuestionAnswering"
   ],
   "attention_probs_dropout_prob": 0.1,
   "classifier_dropout": null,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:def1b7240c3321a08f83491d81223d31411aaf21c641bd611f696520b000c89a
 size 437070648

 version https://git-lfs.github.com/spec/v1
+oid sha256:cc95f206a6a7e8fdaed4433af6fb5de672810c648563c455792dfa0832b0698e
 size 437070648

special_tokens_map.json CHANGED Viewed

@@ -1,37 +1,7 @@
 {
-  "cls_token": {
-    "content": "[CLS]",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "mask_token": {
-    "content": "[MASK]",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "pad_token": {
-    "content": "[PAD]",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "sep_token": {
-    "content": "[SEP]",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "unk_token": {
-    "content": "[UNK]",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  }
 }

 {
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
 }

tokenizer.json CHANGED Viewed

@@ -3,7 +3,7 @@
   "truncation": {
     "direction": "Right",
     "max_length": 384,
-    "strategy": "LongestFirst",
     "stride": 128
   },
   "padding": {
@@ -67,8 +67,8 @@
     "type": "BertNormalizer",
     "clean_text": true,
     "handle_chinese_chars": true,
-    "strip_accents": false,
-    "lowercase": false
   },
   "pre_tokenizer": {
     "type": "BertPreTokenizer"
@@ -1100,69 +1100,69 @@
       "[unused932]": 938,
       "[unused933]": 939,
       "[unused934]": 940,
-      "##|": 941,
-      "|": 942,
-      "##}": 943,
-      "}": 944,
-      "##{": 945,
-      "{": 946,
-      "##_": 947,
-      "_": 948,
-      "##+": 949,
-      "+": 950,
-      "##*": 951,
-      "*": 952,
-      "##&": 953,
-      "&": 954,
-      "##$": 955,
-      "$": 956,
-      "##]": 957,
-      "]": 958,
-      "##[": 959,
-      "[": 960,
-      "##=": 961,
-      "=": 962,
-      "##>": 963,
-      ">": 964,
-      "##<": 965,
-      "<": 966,
-      "##@": 967,
-      "@": 968,
-      "##\\": 969,
-      "\\": 970,
-      "##/": 971,
-      "/": 972,
-      "##%": 973,
-      "%": 974,
-      "##;": 975,
-      ";": 976,
-      "##7": 977,
-      "7": 978,
-      "##w": 979,
-      "ñ": 980,
-      "##k": 981,
-      "k": 982,
-      "##Z": 983,
-      "Z": 984,
-      "##X": 985,
-      "X": 986,
-      "##W": 987,
-      "##Ñ": 988,
-      "Ñ": 989,
-      "##K": 990,
-      "K": 991,
-      "##J": 992,
-      "J": 993,
-      "##Ú": 994,
-      "Ú": 995,
-      "##Ó": 996,
-      "Ó": 997,
-      "##Í": 998,
-      "Í": 999,
-      "##É": 1000,
-      "É": 1001,
-      "##Á": 1002,
-      "Á": 1003,
       "w": 1004,
       "W": 1005,
       "##de": 1006,

   "truncation": {
     "direction": "Right",
     "max_length": 384,
+    "strategy": "OnlySecond",
     "stride": 128
   },
   "padding": {
     "type": "BertNormalizer",
     "clean_text": true,
     "handle_chinese_chars": true,
+    "strip_accents": null,
+    "lowercase": true
   },
   "pre_tokenizer": {
     "type": "BertPreTokenizer"
       "[unused932]": 938,
       "[unused933]": 939,
       "[unused934]": 940,
+      "[unused935]": 941,
+      "[unused936]": 942,
+      "[unused937]": 943,
+      "[unused938]": 944,
+      "[unused939]": 945,
+      "[unused940]": 946,
+      "[unused941]": 947,
+      "[unused942]": 948,
+      "[unused943]": 949,
+      "[unused944]": 950,
+      "[unused945]": 951,
+      "[unused946]": 952,
+      "[unused947]": 953,
+      "[unused948]": 954,
+      "[unused949]": 955,
+      "[unused950]": 956,
+      "[unused951]": 957,
+      "[unused952]": 958,
+      "[unused953]": 959,
+      "[unused954]": 960,
+      "[unused955]": 961,
+      "[unused956]": 962,
+      "[unused957]": 963,
+      "[unused958]": 964,
+      "[unused959]": 965,
+      "[unused960]": 966,
+      "[unused961]": 967,
+      "[unused962]": 968,
+      "[unused963]": 969,
+      "[unused964]": 970,
+      "[unused965]": 971,
+      "[unused966]": 972,
+      "[unused967]": 973,
+      "[unused968]": 974,
+      "[unused969]": 975,
+      "[unused970]": 976,
+      "[unused971]": 977,
+      "[unused972]": 978,
+      "[unused973]": 979,
+      "[unused974]": 980,
+      "[unused975]": 981,
+      "[unused976]": 982,
+      "[unused977]": 983,
+      "[unused978]": 984,
+      "[unused979]": 985,
+      "[unused980]": 986,
+      "[unused981]": 987,
+      "[unused982]": 988,
+      "[unused983]": 989,
+      "[unused984]": 990,
+      "[unused985]": 991,
+      "[unused986]": 992,
+      "[unused987]": 993,
+      "[unused988]": 994,
+      "[unused989]": 995,
+      "[unused990]": 996,
+      "[unused991]": 997,
+      "[unused992]": 998,
+      "[unused993]": 999,
+      "[unused994]": 1000,
+      "[unused995]": 1001,
+      "[unused996]": 1002,
+      "[unused997]": 1003,
       "w": 1004,
       "W": 1005,
       "##de": 1006,

tokenizer_config.json CHANGED Viewed

@@ -41,17 +41,17 @@
       "special": true
     }
   },
-  "clean_up_tokenization_spaces": false,
   "cls_token": "[CLS]",
   "do_basic_tokenize": true,
-  "do_lower_case": false,
   "extra_special_tokens": {},
   "mask_token": "[MASK]",
-  "model_max_length": 512,
   "never_split": null,
   "pad_token": "[PAD]",
   "sep_token": "[SEP]",
-  "strip_accents": false,
   "tokenize_chinese_chars": true,
   "tokenizer_class": "BertTokenizer",
   "unk_token": "[UNK]"

       "special": true
     }
   },
+  "clean_up_tokenization_spaces": true,
   "cls_token": "[CLS]",
   "do_basic_tokenize": true,
+  "do_lower_case": true,
   "extra_special_tokens": {},
   "mask_token": "[MASK]",
+  "model_max_length": 1000000000000000019884624838656,
   "never_split": null,
   "pad_token": "[PAD]",
   "sep_token": "[SEP]",
+  "strip_accents": null,
   "tokenize_chinese_chars": true,
   "tokenizer_class": "BertTokenizer",
   "unk_token": "[UNK]"

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e6d50fdc9ba007fa724d3ccb08c3bd3861fa1efabce085e66184787c08410ab7
 size 5304

 version https://git-lfs.github.com/spec/v1
+oid sha256:4561a5c8ee9d15a87632b0372ae2f9221a0bb7c44395affa595398b178fb37cc
 size 5304

vocab.txt CHANGED Viewed

@@ -939,69 +939,69 @@
 [unused932]
 [unused933]
 [unused934]
-##|
-|
-##}
-}
-##{
-{
-##_
-_
-##+
-+
-##*
-*
-##&
-&
-##$
-$
-##]
-]
-##[
-[
-##=
-=
-##>
->
-##<
-<
-##@
-@
-##\
-\
-##/
-/
-##%
-%
-##;
-;
-##7
-7
-##w
-ñ
-##k
-k
-##Z
-Z
-##X
-X
-##W
-##Ñ
-Ñ
-##K
-K
-##J
-J
-##Ú
-Ú
-##Ó
-Ó
-##Í
-Í
-##É
-É
-##Á
-Á
 w
 W
 ##de

 [unused932]
 [unused933]
 [unused934]
+[unused935]
+[unused936]
+[unused937]
+[unused938]
+[unused939]
+[unused940]
+[unused941]
+[unused942]
+[unused943]
+[unused944]
+[unused945]
+[unused946]
+[unused947]
+[unused948]
+[unused949]
+[unused950]
+[unused951]
+[unused952]
+[unused953]
+[unused954]
+[unused955]
+[unused956]
+[unused957]
+[unused958]
+[unused959]
+[unused960]
+[unused961]
+[unused962]
+[unused963]
+[unused964]
+[unused965]
+[unused966]
+[unused967]
+[unused968]
+[unused969]
+[unused970]
+[unused971]
+[unused972]
+[unused973]
+[unused974]
+[unused975]
+[unused976]
+[unused977]
+[unused978]
+[unused979]
+[unused980]
+[unused981]
+[unused982]
+[unused983]
+[unused984]
+[unused985]
+[unused986]
+[unused987]
+[unused988]
+[unused989]
+[unused990]
+[unused991]
+[unused992]
+[unused993]
+[unused994]
+[unused995]
+[unused996]
+[unused997]
 w
 W
 ##de