bunyaminergen
/

Qwen2.5-Coder-1.5B-Instruct-Reasoning

Text Generation

Model card Files Files and versions

bunyaminergen commited on Apr 28

Commit

939ee59

·

1 Parent(s): 78fb48b

Initial

Files changed (1) hide show

README.md +29 -27

README.md CHANGED Viewed

@@ -137,42 +137,44 @@ print(tokenizer.decode(outputs[0], skip_special_tokens=True))
 | bnb_4bit_quant_type       | `nf4`                              |
 | bnb_4bit_use_double_quant | `true`                             |
-### Dataset
-- **Dataset Name:** `nvidia/OpenCodeReasoning`
-- **Split:** `split_0`
-- **Number of Rows:** `8000`
-- **Max Token Length:** `8192`
-- **Shuffle:** `True`
-- **Number of Processes:** `4`
-### Tokenizer Configuration
-- **Truncation:** Enabled (`max_length=8192`)
-- **Masked Language Modeling (MLM):** `False`
 #### Speeds, Sizes, Times
-- **Total Training Time:** ~3.5 hours
-- **Checkpoint Frequency:** every `10000` steps
-- **Checkpoint Steps:**
-    - `checkpoint-10000`
-    - `checkpoint-20000`
-    - `checkpoint-24000` *(final checkpoint)*
 #### Compute Infrastructure
-**Hardware:**
-- GPU: **1 × NVIDIA H100 SXM (80 GB VRAM)**
-- RAM: **125 GB**
-- CPU: **16 vCPU**
-**Software:**
-- OS: **Ubuntu 22.04**
-- Frameworks: **PyTorch 2.4.0**
-- CUDA Version: **12.4.1**
 ---

 | bnb_4bit_quant_type       | `nf4`                              |
 | bnb_4bit_use_double_quant | `true`                             |
+Aşağıda her başlık için ayrı birer tablo oluşturdum:
+#### Dataset
+| Parameter            | Value                          |
+|----------------------|--------------------------------|
+| Dataset Name         | `nvidia/OpenCodeReasoning`     |
+| Split                | `split_0`                      |
+| Number of Rows       | `8000`                         |
+| Max Token Length     | `8192`                         |
+| Shuffle              | `True`                         |
+| Number of Processes  | `4`                            |
+#### Tokenizer
+| Parameter                      | Value                         |
+|--------------------------------|-------------------------------|
+| Truncation                     | Enabled (`max_length=8192`)   |
+| Masked Language Modeling (MLM) | `False`                       |
 #### Speeds, Sizes, Times
+| Parameter               | Value                                                       |
+|-------------------------|-------------------------------------------------------------|
+| Total Training Time     | ~3.5 hours                                                  |
+| Checkpoint Frequency    | every `10000` steps                                         |
+| Checkpoint Steps        | `checkpoint-10000`, `checkpoint-20000`, `checkpoint-24000`  |
 #### Compute Infrastructure
+| Parameter    | Value                                |
+|--------------|--------------------------------------|
+| GPU          | 1 × NVIDIA H100 SXM (80 GB VRAM)     |
+| RAM          | 125 GB                               |
+| CPU          | 16 vCPU                              |
+| OS           | Ubuntu 22.04                         |
+| Frameworks   | PyTorch 2.4.0                        |
+| CUDA Version | 12.4.1                               |
 ---