Spaces:

fair-forward
/

evals-for-every-language

Running

App Files Files Community

David Pomerenke commited on Feb 16

Commit

c527cda

1 Parent(s): f18ff7d

Move data files

Browse files

Files changed (8) hide show

README.md +1 -1
observablehq.config.js +5 -9
src/{compare-ais.md → compare-ai-models.md} +0 -0
data.txt → src/data/data.txt +1 -1
src/data/languagebench.json +0 -62
src/data/languagebench.json.py +10 -9
languages.rq → src/data/languages.rq +0 -0
languages.tsv → src/data/languages.tsv +0 -0

README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 ---
 title: AI Language Monitor
-emoji: 👀
 colorFrom: purple
 colorTo: pink
 sdk: static

 ---
 title: AI Language Monitor
+emoji: 🌍
 colorFrom: purple
 colorTo: pink
 sdk: static

observablehq.config.js CHANGED Viewed

@@ -6,15 +6,11 @@ export default {
   // The pages and sections in the sidebar. If you don’t specify this option,
   // all pages will be listed in alphabetical order. Listing pages explicitly
   // lets you organize them into sections and have unlisted pages.
-  // pages: [
-  //   {
-  //     name: "Examples",
-  //     pages: [
-  //       {name: "Dashboard", path: "/example-dashboard"},
-  //       {name: "Report", path: "/example-report"}
-  //     ]
-  //   }
-  // ],
   // Content to add to the head of the page, e.g. for a favicon:
   head: '<link rel="icon" href="data:image/svg+xml,<svg xmlns=%22http://www.w3.org/2000/svg%22 viewBox=%220 0 100 100%22><text y=%22.9em%22 font-size=%2290%22 fill=%22black%22>🌍</text></svg>">',

   // The pages and sections in the sidebar. If you don’t specify this option,
   // all pages will be listed in alphabetical order. Listing pages explicitly
   // lets you organize them into sections and have unlisted pages.
+  pages: [
+    { name: "Compare Languages", path: "/compare-languages" },
+    { name: "Compare AI Models", path: "/compare-ai-models" },
+    { name: "Methodology", path: "/methodology" },
+  ],
   // Content to add to the head of the page, e.g. for a favicon:
   head: '<link rel="icon" href="data:image/svg+xml,<svg xmlns=%22http://www.w3.org/2000/svg%22 viewBox=%220 0 100 100%22><text y=%22.9em%22 font-size=%2290%22 fill=%22black%22>🌍</text></svg>">',

src/{compare-ais.md → compare-ai-models.md} RENAMED Viewed

File without changes

data.txt → src/data/data.txt RENAMED Viewed

@@ -1,4 +1,4 @@
 floresp-v2.0-rc.3: https://github.com/openlanguagedata/flores
 languages.csv: generated from https://query.wikidata.org/ using the languages.rq query
 LanguageCodes.tab: https://www.ethnologue.com/
-ScriptCodes.csv: https://www.unicode.org/iso15924/iso15924-codes.html

 floresp-v2.0-rc.3: https://github.com/openlanguagedata/flores
 languages.csv: generated from https://query.wikidata.org/ using the languages.rq query
 LanguageCodes.tab: https://www.ethnologue.com/
+ScriptCodes.csv: https://www.unicode.org/iso15924/iso15924-codes.html

src/data/languagebench.json DELETED Viewed

@@ -1,62 +0,0 @@
-[
-  {
-    "language_name": "English",
-    "language_code": "eng",
-    "speakers": 1132366680.0,
-    "scores": [
-      {
-        "model": "anthropic/claude-3.5-haiku",
-        "bleu": 0.4114123099745433
-      }
-    ],
-    "bleu": 0.4114123099745433
-  },
-  {
-    "language_name": "Mandarin Chinese",
-    "language_code": "cmn",
-    "speakers": 1074000000.0,
-    "scores": [
-      {
-        "model": "anthropic/claude-3.5-haiku",
-        "bleu": 0.22799274850984375
-      }
-    ],
-    "bleu": 0.22799274850984375
-  },
-  {
-    "language_name": "Spanish",
-    "language_code": "spa",
-    "speakers": 485000000.0,
-    "scores": [
-      {
-        "model": "anthropic/claude-3.5-haiku",
-        "bleu": 0.27814703404841756
-      }
-    ],
-    "bleu": 0.27814703404841756
-  },
-  {
-    "language_name": "Hindi",
-    "language_code": "hin",
-    "speakers": 341000000.0,
-    "scores": [
-      {
-        "model": "anthropic/claude-3.5-haiku",
-        "bleu": 0.2607691459848629
-      }
-    ],
-    "bleu": 0.2607691459848629
-  },
-  {
-    "language_name": "Bengali",
-    "language_code": "ben",
-    "speakers": 300000000.0,
-    "scores": [
-      {
-        "model": "anthropic/claude-3.5-haiku",
-        "bleu": 0.2504671437388243
-      }
-    ],
-    "bleu": 0.2504671437388243
-  }
-]

src/data/languagebench.json.py CHANGED Viewed

@@ -1,7 +1,9 @@
 import asyncio
 import json
 import os
 from os import getenv
 import evaluate
 import pandas as pd
@@ -43,9 +45,9 @@ def reorder(language_name):
         return language_name.split(",")[1] + " " + language_name.split(",")[0]
     return language_name
 # load benchmark languages and scripts
-benchmark_dir = "floresp-v2.0-rc.3/dev"
 benchmark_languages = pd.DataFrame(
     [f.split(".")[1].split("_", 1) for f in os.listdir(benchmark_dir)],
     columns=["language_code", "script_code"],
@@ -56,7 +58,7 @@ benchmark_languages["in_benchmark"] = True
 # load Ethnologue language names
 language_names = (
-    pd.read_csv("LanguageCodes.tab", sep="\t")
     .rename(columns={"LangID": "language_code", "Name": "language_name"})[
         ["language_code", "language_name"]
     ]
@@ -65,7 +67,7 @@ language_names = (
 # load Wikidata speaker stats
 language_stats = (
-    pd.read_csv("languages.tsv", sep="\t")
     .rename(columns={"iso639_3": "language_code", "maxSpeakers": "speakers"})[
         ["language_code", "speakers"]
     ]
@@ -84,7 +86,7 @@ language_stats = language_stats[
 ]
 # load unicode script names
-script_names = pd.read_csv("ScriptCodes.csv").rename(
     columns={"Code": "script_code", "English Name": "script_name"}
 )[["script_code", "script_name"]]
@@ -166,7 +168,7 @@ async def main():
             if not pd.isna(language.language_name)
             else language.language_code
         )
-        print(name)
         scores = []
         if language.in_benchmark:
             target_sentences = load_sentences(language)[:n_sentences]
@@ -185,7 +187,7 @@ async def main():
                     load_sentences(lang)[i]
                     for i, lang in enumerate(_original_languages.itertuples())
                 ]
-                print(model)
                 predictions = [
                     translate(
                         model, language.language_name, language.script_name, sentence
@@ -220,8 +222,7 @@ async def main():
                 # "bert_score": mean([s["bert_score"] for s in scores]),
             }
         )
-        with open("src/data/languagebench.json", "w") as f:
-            json.dump(results, f, indent=2, ensure_ascii=False)
 if __name__ == "__main__":

 import asyncio
 import json
 import os
+import sys
 from os import getenv
+from pathlib import Path
 import evaluate
 import pandas as pd
         return language_name.split(",")[1] + " " + language_name.split(",")[0]
     return language_name
 # load benchmark languages and scripts
+data = Path("src/data")
+benchmark_dir = data / "floresp-v2.0-rc.3/dev"
 benchmark_languages = pd.DataFrame(
     [f.split(".")[1].split("_", 1) for f in os.listdir(benchmark_dir)],
     columns=["language_code", "script_code"],
 # load Ethnologue language names
 language_names = (
+    pd.read_csv(data / "LanguageCodes.tab", sep="\t")
     .rename(columns={"LangID": "language_code", "Name": "language_name"})[
         ["language_code", "language_name"]
     ]
 # load Wikidata speaker stats
 language_stats = (
+    pd.read_csv(data / "languages.tsv", sep="\t")
     .rename(columns={"iso639_3": "language_code", "maxSpeakers": "speakers"})[
         ["language_code", "speakers"]
     ]
 ]
 # load unicode script names
+script_names = pd.read_csv(data / "ScriptCodes.csv").rename(
     columns={"Code": "script_code", "English Name": "script_name"}
 )[["script_code", "script_name"]]
             if not pd.isna(language.language_name)
             else language.language_code
         )
+        print(name, file=sys.stderr)
         scores = []
         if language.in_benchmark:
             target_sentences = load_sentences(language)[:n_sentences]
                     load_sentences(lang)[i]
                     for i, lang in enumerate(_original_languages.itertuples())
                 ]
+                print(model, file=sys.stderr)
                 predictions = [
                     translate(
                         model, language.language_name, language.script_name, sentence
                 # "bert_score": mean([s["bert_score"] for s in scores]),
             }
         )
+    print(json.dumps(results, indent=2, ensure_ascii=False))
 if __name__ == "__main__":

languages.rq → src/data/languages.rq RENAMED Viewed

File without changes

languages.tsv → src/data/languages.tsv RENAMED Viewed

File without changes