Spaces:

snap-stanford
/

stark-leaderboard

Running

Shiyu Zhao commited on Nov 14, 2024

Commit

9698e43

1 Parent(s): 1db5c80

Update space

Files changed (4) hide show

app.py CHANGED Viewed

@@ -75,13 +75,13 @@ def process_single_instance(args):
             print(f"Warning: pred_rank is not a list for query_id {query_id}")
             return None
-        valid_ranks = [rank for rank in pred_rank if isinstance(rank, (int, np.integer)) and 0 <= rank < max_candidate_id]
-        if len(valid_ranks) == 0:
-            print(f"Warning: No valid predictions for query_id {query_id}")
-            return None
         # Use only valid predictions
-        pred_dict = {valid_ranks[i]: -i for i in range(min(100, len(valid_ranks)))}
         answer_ids = torch.LongTensor(answer_ids)
         result = evaluator.evaluate(pred_dict, answer_ids, metrics=eval_metrics)
@@ -997,12 +997,12 @@ with gr.Blocks(css=css) as demo:
             dataset = gr.Dropdown(
                 choices=["amazon", "mag", "prime"],
                 label="Dataset*",
-                value="amazon"
             )
             split = gr.Dropdown(
                 choices=["test", "test-0.1", "human_generated_eval"],
                 label="Split*",
-                value="test"
             )
             team_name = gr.Textbox(
                 label="Team Name (max 25 chars)*",

             print(f"Warning: pred_rank is not a list for query_id {query_id}")
             return None
+        # valid_ranks = [rank for rank in pred_rank if isinstance(rank, (int, np.integer)) and 0 <= rank < max_candidate_id]
+        # if len(valid_ranks) == 0:
+        #     print(f"Warning: No valid predictions for query_id {query_id}")
+        #     return None
         # Use only valid predictions
+        pred_dict = {pred_rank[i]: -i for i in range(min(100, len(pred_rank)))}
         answer_ids = torch.LongTensor(answer_ids)
         result = evaluator.evaluate(pred_dict, answer_ids, metrics=eval_metrics)
             dataset = gr.Dropdown(
                 choices=["amazon", "mag", "prime"],
                 label="Dataset*",
+                value="prime"
             )
             split = gr.Dropdown(
                 choices=["test", "test-0.1", "human_generated_eval"],
                 label="Split*",
+                value="human_generated_eval"
             )
             team_name = gr.Textbox(
                 label="Team Name (max 25 chars)*",

submissions/a_t_attt/latest.json DELETED Viewed

@@ -1,6 +0,0 @@
-{
-    "latest_submission": "20241115_003152",
-    "status": "approved",
-    "method_name": "a-t",
-    "team_name": "attt"
-}

submissions/a_t_attt/metadata_20241115_003152.json DELETED Viewed

@@ -1,21 +0,0 @@
-{
-    "Method Name": "a-t",
-    "Team Name": "attt",
-    "Dataset": "prime",
-    "Split": "human_generated_eval",
-    "Contact Email(s)": "a@stanford.edu",
-    "Code Repository": "https://github.com/",
-    "Model Description": "abc",
-    "Hardware": "a100",
-    "(Optional) Paper link": "",
-    "Model Type": "Others",
-    "results": {
-        "hit@1": 0.0,
-        "hit@5": 0.0,
-        "recall@20": 0.0,
-        "mrr": 0.02
-    },
-    "status": "approved",
-    "submission_date": "2024-11-15 00:31:57",
-    "csv_path": "submissions/a_t_attt/predictions_20241115_003152.csv"
-}

submissions/a_t_attt/predictions_20241115_003152.csv DELETED Viewed

The diff for this file is too large to render. See raw diff