ALLaM-AI
/

ALLaM-7B-Instruct-preview

@@ -127,10 +127,9 @@ All models were evaluated using our proprietary evaluation pipeline and [LM Eval
 The evaluation scores of ALLaM can be found in JSON format [here](https://huggingface.co/ALLaM-AI/ALLaM-7B-Instruct-preview/tree/main/evaluation).
 | Model                       |AVG | ETEC <br>0 shot   | IEN-MCQ <br>0 shot   | IEN-TF <br>0 shot   | AraPro <br>0 shot   | AraMath <br>5 shot   | Ar-IFEval <br>(prompt strict) <br>0 shot   | Ar-IFEval <br>(inst strict) <br>0 shot   | ExamsAR <br>5 shot   | ACVA  <br> 5 shot   | Arabic MMLU <br>0 Shot   | Openai MMLU <br>0 shot   | GAT  <br>0 shot   |
 |:----------------------------|:----------|:---------|:-----------------|:----------------|:----------------|:-----------------|:-----------------------------------|:---------------------------------|:------------------|:--------------|:--------------------|:--------------------|:-----------------------------|
-| ALLaM-7B-Instruct-preview         | 64.42     | 66.67    | **91.77**        | 82.95           | 69.71           | 66.78            | 31.34                              | 67.65                            | 51.58             | 76.33         | 67.78               | 55.91               | 44.53                        |
 | AceGPT-v2-8B-Chat           | 52.67     | 56.81    | 77.01            | 75.91           | 63.51           | 41.49            | 10.26                              | 39.25                            | 51.96             | 72.69         | 57.02               | 49.99               | 36.15                        |
 | AceGPT-v2-32B-Chat          | 62.23     | 64.81    | 81.6             | 80.35           | 67.19           | 64.46            | 25.75                              | 63.41                            | 55.31             | 71.57         | 68.3                | 60.8                | 43.21                        |
 | jais-family-6p7b-chat       | 46.31     | 45.47    | 46.22            | 63.92           | 54.31           | 25.29            | 13.99                              | 52.97                            | 46.93             | 73.8          | 56.15               | 44.96               | 31.71                        |
@@ -140,14 +139,14 @@ The evaluation scores of ALLaM can be found in JSON format [here](https://huggin
 | jais-adapted-7b-chat        | 45.19     | 40.49    | 57.38            | 67.18           | 50.59           | 28.43            | 14.93                              | 54.27                            | 40.6              | 70.44         | 49.75               | 38.54               | 29.68                        |
 | jais-adapted-13b-chat       | 51.86     | 48.12    | 69.65            | 71.85           | 59.07           | 37.02            | 23.32                              | 60.61                            | 48.23             | 67.78         | 56.42               | 46.83               | 33.4                         |
 | jais-adapted-70b-chat       | 58.32     | 56.81    | 74.51            | 76.47           | 64.59           | 45.62            | 27.05                              | 65.05                            | 54.75             | 73.33         | 65.74               | 56.82               | 39.15                        |
-| falcon-mamba-7b-instruct    | 40.98     | 37.52    | 52.65            | 57.63           | 41.47           | 56.53            | 8.58                               | 47.92                            | 28.49             | 63.52         | 39.27               | 28.45               | 29.69                        |
 | Qwen2.5-7B-Instruct         | 60.55     | 64.12    | 66.38            | 78.46           | 64.63           | 71.74            | 28.17                              | 65.19                            | 50.65             | 78.17         | 61.54               | 56.1                | 41.42                        |
 | Qwen2.5-14B-Instruct        | 71.26     | 72.18    | 80.51            | 77.64           | 69.11           | 82.81            | 68.66                              | 86.76                            | 57.54             | 75.04         | 69.36               | 63.8                | 51.7                         |
 | Qwen2.5-72B-Instruct        | **76.91** | **78.7** | 86.88            | **86.62**       | **74.69**       | **92.89**        | 67.72                              | 87.51                            | 60.71             | **79.92**     | **74.1**            | **73.59**           | **59.54**                    |
 | Mistral-7B-Instruct-v0.3    | 43.05     | 35.67    | 53.59            | 63.4            | 43.85           | 27.11            | 30.41                              | 64.03                            | 34.08             | 60.25         | 45.27               | 32.3                | 26.65                        |
 | Mistral-Nemo-Instruct-2407  | 53.79     | 49.28    | 68.43            | 71.78           | 57.61           | 40.0             | 35.82                              | 70.58                            | 47.49             | 76.92         | 55.97               | 46.15               | 25.44                        |
 | Mistral-Small-Instruct-2409 | 51.11     | 40.96    | 60.64            | 63.66           | 47.73           | 44.46            | 51.12                              | 78.16                            | 38.73             | 68.93         | 50.43               | 39.63               | 28.82                        |
-| Llama-3.1-8B-Instruct       | 54.39     | 45.68    | 59.23            | 71.73           | 52.51           | 34.38            | 53.36                              | 79.32                            | 54.0              | 70.54         | 56.53               | 44.67               | 30.76                        |
 | Llama-3.3-70B-Instruct      | 71.43     | 68.84    | 79.6             | 78.81           | 70.49           | 70.91            | **70.9**                           | **88.6**                         | **65.74**         | 76.93         | 72.01               | 70.25               | 44.12                        |
 Closed models evaluations:
@@ -164,8 +163,8 @@ Closed models evaluations:
 |:----------------------------------|:----------|:-----------------|:-----------------------|:--------------------------|:--------------------------|:--------------------|:-------------------|:------------------|:------------------|:----------------------|:--------------|:------------------------|:---------------------------------|:-------------------------------|:---------------|
 | ALLaM-7B-Instruct-preview         | 46.85     | 41.99            | 51.28                  | 22.77                     | 73.17                     | 70.48               | 76.26              | 16.07             | 30.4              | 17.3                  | 59.6          | 46.67                   | 38.08                            | 50.0                           | 61.79          |
 | AceGPT-v2-8B-Chat                 | 49.51     | 37.17            | 53.5                   | 25.67                     | 68.14                     | 73.72               | 79.21              | 67.65             | 37.38             | 17.58                 | 64.62         | 55.2                    | 23.48                            | 32.97                          | 56.86          |
-| AceGPT-v2-32B-Chat                |59.01 |      56.01 |                  53.92 |                    nan    |                     66.23 |               79.16 |              83.29 |             69.45 |             45.89 |                 32.8  |         74.03 |                   59.18 |                            27.54 |                          40.89 |          78.7  |
-| jais-family-6p7b-chat             | 38.34     | 30.56            | 44.62                  | 23.21                     | 65.7                      | 62.43               | 72.05              | 29.74             | 23.3              | 2.56                  | 49.62         | 40.99                   | 14.05                            | 23.5                           | 54.36          |
 | jais-family-13b-chat              | 42.62     | 30.31            | 47.87                  | 25.89                     | 65.91                     | 65.04               | 75.0               | 35.82             | 24.4              | 19.1                  | 51.91         | 40.57                   | 19.41                            | 30.82                          | 64.59          |
 | jais-family-30b-16k-chat          | 45.15     | 31.85            | 48.46                  | 23.88                     | 69.44                     | 68.19               | 76.21              | 43.99             | 29.11             | 22.3                  | 58.5          | 44.78                   | 18.3                             | 29.14                          | 67.93          |
 | jais-family-30b-8k-chat           | 47.59     | 36.65            | 48.38                  | 21.88                     | 69.28                     | 70.32               | 78.55              | 46.67             | 28.7              | 26.44                 | 57.46         | 49.49                   | 22.92                            | 37.05                          | 72.48          |
@@ -178,10 +177,9 @@ Closed models evaluations:
 | Mistral-7B-Instruct-v0.3          | 51.98     | 36.45            | 58.87                  | 23.21                     | 72.58                     | 73.95               | 82.93              | 67.97             | 33.18             | 13.44                 | 59.74         | 59.69                   | 42.51                            | 54.8                           | 48.37          |
 | Mistral-Nemo-Instruct-2407        | 54.0      | 39.65            | 59.04                  | 24.33                     | 67.86                     | 74.66               | 82.35              | 72.77             | 44.27             | 29.62                 | 65.56         | 54.88                   | 30.13                            | 38.97                          | 71.95          |
 | Mistral-Small-Instruct-2409       | 61.65     | 40.76            | 60.49                  | 25.89                     | 72.27                     | 78.53               | 85.35              | 79.11             | 47.47             | 39.42                 | 69.42         | 56.35                   | 58.23                            | 68.35                          | 81.43          |
-| falcon-mamba-7b-instruct          | 46.53     | 35.57            | 57.68                  | **27.46**                 | 67.68                     | 73.4                | 78.21              | 33.1              | 24.79             | 16.82                 | 60.51         | 53.19                   | 28.1                             | 38.61                          | 56.33          |
-| Llama-3.1-70B-Instruct            | 68.45     | 52.6             | 63.05                  | 27.01                     | **80.28**                 | **79.08**           | 84.67              | **82.09**         | 59.0              | 49.18                 | 82.36         | 59.92                   | **70.98**                        | **79.74**                      | 88.4           |
-| Llama-3.1-8B-Instruct             | 56.27     | 42.38            | 55.12                  | 27.01                     | 66.69                     | 73.88               | 79.28              | 70.08             | 41.16             | 34.14                 | 67.97         | 54.05                   | 42.7                             | 57.55                          | 75.82          |
 ### MT-bench

 The evaluation scores of ALLaM can be found in JSON format [here](https://huggingface.co/ALLaM-AI/ALLaM-7B-Instruct-preview/tree/main/evaluation).
 | Model                       |AVG | ETEC <br>0 shot   | IEN-MCQ <br>0 shot   | IEN-TF <br>0 shot   | AraPro <br>0 shot   | AraMath <br>5 shot   | Ar-IFEval <br>(prompt strict) <br>0 shot   | Ar-IFEval <br>(inst strict) <br>0 shot   | ExamsAR <br>5 shot   | ACVA  <br> 5 shot   | Arabic MMLU <br>0 Shot   | Openai MMLU <br>0 shot   | GAT  <br>0 shot   |
 |:----------------------------|:----------|:---------|:-----------------|:----------------|:----------------|:-----------------|:-----------------------------------|:---------------------------------|:------------------|:--------------|:--------------------|:--------------------|:-----------------------------|
+| ALLaM-7B-Instruct-preview   | 64.42     | 66.67    | **91.77**        | 82.95           | 69.71           | 66.78            | 31.34                              | 67.65                            | 51.58             | 76.33         | 67.78               | 55.91               | 44.53                        |
 | AceGPT-v2-8B-Chat           | 52.67     | 56.81    | 77.01            | 75.91           | 63.51           | 41.49            | 10.26                              | 39.25                            | 51.96             | 72.69         | 57.02               | 49.99               | 36.15                        |
 | AceGPT-v2-32B-Chat          | 62.23     | 64.81    | 81.6             | 80.35           | 67.19           | 64.46            | 25.75                              | 63.41                            | 55.31             | 71.57         | 68.3                | 60.8                | 43.21                        |
 | jais-family-6p7b-chat       | 46.31     | 45.47    | 46.22            | 63.92           | 54.31           | 25.29            | 13.99                              | 52.97                            | 46.93             | 73.8          | 56.15               | 44.96               | 31.71                        |
 | jais-adapted-7b-chat        | 45.19     | 40.49    | 57.38            | 67.18           | 50.59           | 28.43            | 14.93                              | 54.27                            | 40.6              | 70.44         | 49.75               | 38.54               | 29.68                        |
 | jais-adapted-13b-chat       | 51.86     | 48.12    | 69.65            | 71.85           | 59.07           | 37.02            | 23.32                              | 60.61                            | 48.23             | 67.78         | 56.42               | 46.83               | 33.4                         |
 | jais-adapted-70b-chat       | 58.32     | 56.81    | 74.51            | 76.47           | 64.59           | 45.62            | 27.05                              | 65.05                            | 54.75             | 73.33         | 65.74               | 56.82               | 39.15                        |
 | Qwen2.5-7B-Instruct         | 60.55     | 64.12    | 66.38            | 78.46           | 64.63           | 71.74            | 28.17                              | 65.19                            | 50.65             | 78.17         | 61.54               | 56.1                | 41.42                        |
 | Qwen2.5-14B-Instruct        | 71.26     | 72.18    | 80.51            | 77.64           | 69.11           | 82.81            | 68.66                              | 86.76                            | 57.54             | 75.04         | 69.36               | 63.8                | 51.7                         |
 | Qwen2.5-72B-Instruct        | **76.91** | **78.7** | 86.88            | **86.62**       | **74.69**       | **92.89**        | 67.72                              | 87.51                            | 60.71             | **79.92**     | **74.1**            | **73.59**           | **59.54**                    |
 | Mistral-7B-Instruct-v0.3    | 43.05     | 35.67    | 53.59            | 63.4            | 43.85           | 27.11            | 30.41                              | 64.03                            | 34.08             | 60.25         | 45.27               | 32.3                | 26.65                        |
 | Mistral-Nemo-Instruct-2407  | 53.79     | 49.28    | 68.43            | 71.78           | 57.61           | 40.0             | 35.82                              | 70.58                            | 47.49             | 76.92         | 55.97               | 46.15               | 25.44                        |
 | Mistral-Small-Instruct-2409 | 51.11     | 40.96    | 60.64            | 63.66           | 47.73           | 44.46            | 51.12                              | 78.16                            | 38.73             | 68.93         | 50.43               | 39.63               | 28.82                        |
+| Falcon3-7B-Instruct         | 41.3      | 37.52    | 52.65            | 57.63           | 41.47           | 56.53            | 8.58                               | 47.92                            | 31.84             | 58.98         | 42.08               | 32.36               | 27.99                        |
+| Meta-Llama-3.1-8B-Instruct  | 54.08     | 45.68    | 59.23            | 71.7            | 52.51           | 34.38            | 51.87                              | 79.11                            | 52.51             | 69.93         | 56.43               | 44.67               | 30.9                         |
 | Llama-3.3-70B-Instruct      | 71.43     | 68.84    | 79.6             | 78.81           | 70.49           | 70.91            | **70.9**                           | **88.6**                         | **65.74**         | 76.93         | 72.01               | 70.25               | 44.12                        |
 Closed models evaluations:
 |:----------------------------------|:----------|:-----------------|:-----------------------|:--------------------------|:--------------------------|:--------------------|:-------------------|:------------------|:------------------|:----------------------|:--------------|:------------------------|:---------------------------------|:-------------------------------|:---------------|
 | ALLaM-7B-Instruct-preview         | 46.85     | 41.99            | 51.28                  | 22.77                     | 73.17                     | 70.48               | 76.26              | 16.07             | 30.4              | 17.3                  | 59.6          | 46.67                   | 38.08                            | 50.0                           | 61.79          |
 | AceGPT-v2-8B-Chat                 | 49.51     | 37.17            | 53.5                   | 25.67                     | 68.14                     | 73.72               | 79.21              | 67.65             | 37.38             | 17.58                 | 64.62         | 55.2                    | 23.48                            | 32.97                          | 56.86          |
+| AceGPT-v2-32B-Chat                | 59.01     | 56.01            | 53.92                  | nan                       | 66.23                     | 79.16               | 83.29              | 69.45             | 45.89             | 32.8                  | 74.03         | 59.18                   | 27.54                            | 40.89                          | 78.7           |
+| jais-family-6p7b-chat             | 38.33     | 30.56            | 44.62                  | 23.21                     | 65.7                      | 62.43               | 72.05              | 29.74             | 23.3              | 2.56                  | 49.62         | 40.99                   | 14.05                            | 23.5                           | 54.36          |
 | jais-family-13b-chat              | 42.62     | 30.31            | 47.87                  | 25.89                     | 65.91                     | 65.04               | 75.0               | 35.82             | 24.4              | 19.1                  | 51.91         | 40.57                   | 19.41                            | 30.82                          | 64.59          |
 | jais-family-30b-16k-chat          | 45.15     | 31.85            | 48.46                  | 23.88                     | 69.44                     | 68.19               | 76.21              | 43.99             | 29.11             | 22.3                  | 58.5          | 44.78                   | 18.3                             | 29.14                          | 67.93          |
 | jais-family-30b-8k-chat           | 47.59     | 36.65            | 48.38                  | 21.88                     | 69.28                     | 70.32               | 78.55              | 46.67             | 28.7              | 26.44                 | 57.46         | 49.49                   | 22.92                            | 37.05                          | 72.48          |
 | Mistral-7B-Instruct-v0.3          | 51.98     | 36.45            | 58.87                  | 23.21                     | 72.58                     | 73.95               | 82.93              | 67.97             | 33.18             | 13.44                 | 59.74         | 59.69                   | 42.51                            | 54.8                           | 48.37          |
 | Mistral-Nemo-Instruct-2407        | 54.0      | 39.65            | 59.04                  | 24.33                     | 67.86                     | 74.66               | 82.35              | 72.77             | 44.27             | 29.62                 | 65.56         | 54.88                   | 30.13                            | 38.97                          | 71.95          |
 | Mistral-Small-Instruct-2409       | 61.65     | 40.76            | 60.49                  | 25.89                     | 72.27                     | 78.53               | 85.35              | 79.11             | 47.47             | 39.42                 | 69.42         | 56.35                   | 58.23                            | 68.35                          | 81.43          |
+| Falcon3-7B-Instruct               | 58.04     | 43.84            | 59.47                  | **33.71**                 | 70.39                     | 70.09               | 78.43              | 51.98             | 46.73             | 30.76                 | 68.14         | 55.53                   | 56.01                            | 68.59                          | 78.92          |
+| Meta-Llama-3.1-8B-Instruct        | 56.5      | 42.39            | 55.12                  | 27.23                     | 66.69                     | 73.95               | 79.28              | 70.05             | 40.641622         | 34.26                 | 67.96         | 54.05                   | 44.36                            | 58.51                          | 76.5           |
+| Llama-3.3-70B-Instruct            | 67.7      | 55.44            | 63.4                   | 25.89                     | **81.05**                 | **79.24**           | 84.39              | **81.7**              | 60.51             | 46.42                 | 81.99         | 60.91                   | **63.22**                           | **72.78**                          | 90.83          |
 ### MT-bench