|
--- |
|
license: apache-2.0 |
|
language: |
|
- ko |
|
base_model: |
|
- Qwen/Qwen2.5-14B |
|
tags: |
|
- RAG |
|
- Ko-LLM |
|
- QA |
|
datasets: |
|
- kyujinpy/KoCoT_2000 |
|
- MarkrAI/KoCommercial-Dataset |
|
- CarrotAI/ko-instruction-dataset |
|
- heegyu/CoT-collection-ko |
|
pipeline_tag: text-generation |
|
--- |
|
|
|
## Introduction |
|
Command r plus ๋ชจ๋ธ์ ์ด์ฉํ์ฌ ์์ฒด ๊ตฌ์ถํ RAG ํนํ ๋ฐ์ดํฐ์
, CoT ๋ฐ์ดํฐ์
, ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์
์ผ๋ก Qwen2.5 14B ๋ชจ๋ธ์ Full fine-tuning ํ ๋ชจ๋ธ์
๋๋ค. |
|
ํด๋น ๋ชจ๋ธ์ ์ผ๋ฐ์ ์ธ RAG ์๋น์ค์ ์
๋ ฅ๋ฐ์ดํฐ์ ๋ํด์ ์ ํํ ๋ต๋ณ๊ณผ ๋ต๋ณ ์ถ์ฒ๋ฅผ ์์ฑํ ์ ์์ผ๋ฉฐ, Json ํํ๋ก ๋ต๋ณ์ ์ถ๋ ฅํ๋ ํน์ง์ ๊ฐ์ง๊ณ ์์ต๋๋ค. |
|
์ถ๋ ฅ ํค๊ฐ์ ์๋์ ๊ฐ์ต๋๋ค. |
|
1. "related_document"์ ๊ฐ : ์ง๋ฌธ๊ณผ ๊ด๋ จ ์๋ ๋ฌธ์ doc_id, ์ ๋ชฉ (key : ๋ฌธ์ ๋ฒํธ, Value : ๋ฌธ์ ์ ๋ชฉ) |
|
2. "source" : ์ง๋ฌธ๊ณผ ๊ด๋ จ์๋ ๋ฌธ์ doc_id์ ๋ต๋ณ์ ์์ฑํ ์ธ์ฉ๊ตฌ ๊ตฌ์ |
|
3. "answer"์ ๊ฐ : ์ถ์ฒ๋ฅผ ํ๊ธฐํ์ง ์์ 3~6๋ฌธ์ฅ ์ค๋ช
ํ ๋ต๋ณ |
|
4. "grounded_answer"์ ๊ฐ : answer๊ณผ ๋์ผํ๋ <co: doc_id>์ </co: doc_id> ๊ธฐํธ๋ก ์ธ์ฉ ์ถ์ฒ๋ฅผ ๋ช
์ํ ๋ต๋ณ |
|
|
|
### ๋ต๋ณ ์ถ๋ ฅ ์์ |
|
``` |
|
{ |
|
"related_document": { |
|
"D0000042284685": "๊ฐ๋ฝ๋ชฐ ์ ๋ ์ผ๋ฅ์ฐจ ํ์ฌ์๋ฐฉ ์ถ์ง ๋์ฑ
", |
|
"4895": "์ฐจ์ธ๋ ๊ณ ์ ๋ขฐ์ฑ ๊ณ ์ถ๋ ฅ ์ํผ์ถ์ ๊ธฐ" |
|
}, |
|
"source": { |
|
"D0000042284685": "ใ๋ฌผ๋ฅ์ด๋ฐ์ฅ๋น ์ถฉ์ ์ฅ์น(๋ฆฌํฌ์ด์จ ๋ฐฐํฐ๋ฆฌ) ...", |
|
"4895": "์ํผ์ถ์ ๊ธฐ์ ๋ฆฌํฌ์ด์ฐจ์ ์ง์ ๋น๊ต ..." |
|
}, |
|
"answer": "๊ฐ๋ฝ๋ชฐ ์ ๋ ์ผ๋ฅ์ฐจ์ ๋ฆฌํฌ์ด์จ ๋ฐฐํฐ๋ฆฌ์ ์ํผ์ถ์ ๊ธฐ๋ ๋ฉ...", |
|
"grounded_answer": "๊ฐ๋ฝ๋ชฐ ์ ๋ ์ผ๋ฅ์ฐจ์ ๋ฆฌํฌ์ด์จ ๋ฐฐํฐ๋ฆฌ์ ์ํผ์ถ์ ๊ธฐ๋ <co: 4895>๋ฉ์ปค๋์ฆ, ์์ฌ, ์๋ช
, ๋ณดํธํ๋ก, ๊ทน์ฑ, ๊ณผ์ ์, ์์กด์ฉ๋์ธก์ , ํน์ง</co: 4895> ๋ฑ์์ ์ฐจ์ด๊ฐ ์์ต๋๋ค. ๋ฆฌํฌ์ด์จ ๋ฐฐํฐ๋ฆฌ๋ <co: 4895>๋ฆฌํฌ์ด์จ ์ด๋ ๋ฉ์ปค๋์ฆ</co: 4895>์ ๊ฐ์ง๊ณ ์์ผ๋ฉฐ,... " |
|
} |
|
``` |
|
|
|
## RAG Prompt |
|
``` |
|
RAG_PROMPT = """<|im_start|>system\n\n ๋น์ ์ ๋ํํ AI๋ก์, ์ฌ์ฉ์์ ์ง๋ฌธ์ ์ ๋ขฐํ ์ ์๋ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ ๊ฒ์ด ์ฃผ์ ์ญํ ์
๋๋ค. ์ฌ์ฉ์์ ์๊ตฌ๋ฅผ ์ ํํ ์ดํดํ๊ณ , ๊ด๋ จ ๋ฌธ์๋ฅผ ๋ถ์ํ์ฌ ์ต์ ์ ๋ต๋ณ์ ์์ฑํด์ผ ํฉ๋๋ค. \n๋น์ ์ ๋ค์๊ณผ ๊ฐ์ ์์น์ ์ค์ํด์ผ ํฉ๋๋ค:\n1. ํญ์ ์ฌ์ฉ์์ ์์ฒญ์ ์ต์ฐ์ ์ผ๋ก ๊ณ ๋ คํ๋ฉฐ, ๋ช
ํํ๊ณ ์ดํดํ๊ธฐ ์ฌ์ด ๋ต๋ณ์ ์ ๊ณตํฉ๋๋ค.\n2. ์ ๊ณต๋ ๋ฌธ์๋ฅผ ์ต๋ํ ํ์ฉํ์ฌ ์๋ต์ ๊ตฌ์ฑํ๋, ์ถ๊ฐ์ ์ธ ๋ถ์๊ณผ ๋
ผ๋ฆฌ๋ฅผ ํตํด ์๋ต์ ์ง์ ๋์
๋๋ค.\n3. ์๋ต์ ์์ฑํ ๋๋ ๋ฐ๋์ ์ฃผ์ด์ง ์ง์นจ์ ๋ฐ๋ฅด๊ณ , ๋ช
ํํ ์ถ์ฒ๋ฅผ ์ ๊ณตํด์ผ ํฉ๋๋ค.\n4. ์ฌ์ฉ์์ ์ง๋ฌธ์ด ๋ชจํธํ ๊ฒฝ์ฐ, ๋ช
ํ์ฑ์ ํ๋ณดํ๊ธฐ ์ํด ์ง๋ฌธ์ ์ฌ๊ตฌ์ฑํ๋ ๋ฐฉ์์ ๊ณ ๋ คํ ์ ์์ต๋๋ค.\n\n# ์ฌ์ฉ์ ์๋ด๋ฌธ\n## ์์
๋ฐ ๋งฅ๋ฝ\n๋น์ ์ ์ฌ์ฉ์ ์ง๋ฌธ์ ๋ํด ๊ด๋ จ ๋ฌธ์๋ฅผ ๋ถ์ํ๊ณ , ์ ๋ขฐํ ์ ์๋ ์ ๋ณด๋ฅผ ๋ฐํ์ผ๋ก ์๋ต์ ์์ฑํด์ผ ํฉ๋๋ค. ๋จ์ํ ์ ๋ณด ์ ๋ฌ์ ๋์ด, ๋ฌธ๋งฅ์ ๊ณ ๋ คํ์ฌ ๊ฐ์ฅ ์ ์ ํ ํํ๋ก ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค.\n\n## ์คํ์ผ ๊ฐ์ด๋\njson ํ์์ผ๋ก ๋ต๋ณ์ ์ถ๋ ฅํ์ธ์.[ |
|
{{ |
|
"related_document" : {{"๋ฌธ์ ์ ๋ณด์์ ์ฐพ์ doc_id"}} |
|
"source" : {{"๋ฌธ์ ์ ๋ณด์์ ์ฐพ์ doc_id" : "ํด๋น ๋ฌธ์์์ ์ฐพ์ ์ ์๋ ์ธ์ฉ๊ตฌ ๊ตฌ์ , ์๋ฌธ ๊ทธ๋๋ก ํ๊ธฐ", |
|
"๋ฌธ์ ์ ๋ณด์์ ์ฐพ์ doc_id" : "ํด๋น ๋ฌธ์์์ ์ฐพ์ ์ ์๋ ์ธ์ฉ๊ตฌ ๊ตฌ์ , ์๋ฌธ ๊ทธ๋๋ก ํ๊ธฐ"}}, |
|
"answer" : "์ถ์ฒ๋ฅผ ํ๊ธฐํ์ง ์์ 3~6๋ฌธ์ฅ ์ค๋ช
ํ ๋ต๋ณ", |
|
"grounded_answer" : "answer๊ณผ ๋์ผํ๋ <co: doc_id>์ </co: doc_id> ๊ธฐํธ๋ก ์ธ์ฉ ์ถ์ฒ๋ฅผ ๋ช
์ํ ๋ต๋ณ" |
|
}} |
|
]\n |
|
<|im_end|>\n<|im_start|>user\n {instruction} <|im_end|>\n<|im_start|>assistant\n""" |
|
``` |
|
|
|
## Quickstart |
|
``` |
|
from transformers import AutoModelForCausalLM, AutoTokenizer |
|
|
|
model_name = "Surromind/RAG-Specialized-LLM" |
|
model = AutoModelForCausalLM.from_pretrained( |
|
model_name, torch_dtype="auto", device_map="auto" |
|
) |
|
tokenizer = AutoTokenizer.from_pretrained(model_name) |
|
|
|
prompt = """ ์ง๋ฌธ : NAOG ์ธ์ ๋ชฝ๊ณจ์ ์ด๋ค ์ฌ๋๋ค์ด ํ์ ์์น๋ถ ์ง๋ฐฉํ์ ์ฐ์์์ ๊ต์ก ํ๋ก๊ทธ๋จ์ ์ฐธ๊ฐํด์์ง?\n\n doc_id : 44365 / title : ํ๊ตญ ์ง๋ฐฉ์ธ์ฌ๊ฐ๋ฐ์ ๋ต ๋ฒ ํธ๋จ์ ์ ์๋๋ค. / content : ํ๊ตญ ์ง๋ฐฉ์ธ์ฌ๊ฐ๋ฐ์ ๋ต ๋ฒ ํธ๋จ์ ์ ์๋๋ค.\nโก ๋ฒ ํธ๋จ ๋์ ์ฑ ์ง๋ฐฉ์ ๋ถ ๊ณต๋ฌด์๋ค์ด ๊ณต๋ฌด์ ์ธ์ฌ์ฑ์ฉ ๋ฐ ๊ต์ก ํ๋ จ์ ๋ ์์คํ
๋ฑ ํ๊ตญ์ ์ธ์ ์์๊ฐ๋ฐ์ ๋ต์ ๋ฐฐ์ฐ๋ฌ ์ฐ๋ฆฌ๋๋ผ๋ฅผ ์ฐพ์๋ค. \nโ ํ์ ์์น๋ถ ์ง๋ฐฉํ์ ์ฐ์์(์์ฅ ***, ์ดํ ์ฐ์์)์ ํ๊ตญ๊ตญ์ ํ๋ ฅ๋จ(KOICA)๊ณผ ๊ณต๋์ผ๋ก 11์ 26์ผ๋ถํฐ 12์ 9์ผ๊น์ง 2์ฃผ๊ฐ ๋ฒ ํธ๋จ ๋์ ์ฑ ์ง๋ฐฉ์ ๋ถ ๊ณต๋ฌด์ 15๋ช
์ ๋์์ผ๋กใ๋ฒ ํธ๋จ ๋์ ์ฑ ์ง๋ฐฉ์ ๋ถ ๊ณต๋ฌด์ ์ญ๋๊ฐํ๊ณผ์ (Capacity Building for Vietnamese Local Government Officials from Lan Son Provinceใ์ ์ด์ํ๋ค.\nโก ์ด๋ฒ ๊ณผ์ ์ ์ฐ์์ ๋๋ถ๋ถ์ด ๋ฒ ํธ๋จ ๋์ ์ฑ ์์๊ณต๋ฌด์์ธ ๋งํผ ํด๋น ์ง๋ฐฉ์ ๋ถ๊ฐ ์์ฒญํ ์ง๋ฐฉํ์ , ๊ณต๋ฌด์ ์ฑ์ฉยท๊ต์ก, ์ง์ญ๊ฒฝ์ ํ์ฑํ ๊ฐ์ ๋ฐ ํ์ฅ๊ฒฌํ ๋ฑ์ ๋ง์ถคํ ์ฐ์๊ณผ์ ์ผ๋ก ์ค๊ณ๋์๋ค. \nโ ํนํ, ๋ฒ ํธ๋จ ์ง๋ฐฉ์ ๋ถ ๊ณต๋ฌด์๋ค์ ๋ฆฌ๋์ญ๊ณผ ์ญ๋์ ๊ฐํํ๊ธฐ ์ํด ๊ณต๋ฌด์ ์ธ์ฌ์ฑ์ฉ ๋ฐ ๊ต์กํ๋ จ์ ๋ ์์คํ
์ ๋ํ ํ ๋ก ์ ์ธ๋ฏธ๋ ๋ฐฉ์์ผ๋ก Action Plan์ ์๋ฆฝํ๋๋ก ํ์ฌ ์ฐ์์์ด ๋์ ์ฑ์ ์ธ์ ์์๊ฐ๋ฐ ์ ์ฑ
์๋ฆฝ์ ์ ์ฉํ ์ ์๋๋ก ์ง์ํ ์์ ์ด๋ค.\nโ ์์ธ๋ฌ, ์ฐ์๋จ์ ๋์
์๋์ฆ๋์ ์ง์ญ๊ฒฝ์ ํ์ฑํ ์ฑ๊ณต์ฌ๋ก๋ก ํ๊ฐ ๋ฐ๊ณ ์๋ ์์ฃผ๊ตฐ ๊ฑฐ์ ๋๋ฏผ๊ฐ๊ณต์ผํฐ, ์ง์ญ๊ฒฝ์ ์ํ์ผํฐ ๋ฑ์ ๋ฐฉ๋ฌธํ์ฌ ์ง์ญ๋๋ฏผ์ด ์์ฐํ ๋์ฐ๋ฌผ์ด 2์ฐจ, 3์ฐจ ์ํ ๊ฐ๊ณต ๊ณผ์ ์ ๊ฑฐ์ณ ์์ ์ ์ผ๋ก ํ๋งค๋ ์ ์๋๋ก ์ง์ํ๋ ๋์ฐ๋ฌผ ๊ฐ๊ณต ์์คํ
ํ์ฅ์ ์ดํด ๋ณผ ์์ ์ด๋ค. \nโ ์ด์ธ์๋ ๋ฒ ํธ๋จ ๋์ ์ฑ์์ ๊ด์ฌ์ด ๋ง์ ์ธ์ฒ๊ฒฝ์ ์์ ๊ตฌ์ญ์ฒญ์ ๊ฒฌํํ์ฌ ํ๊ตญ์ ๊ฒฝ์ ๋ฐ์ ์ ๋ฑ ํ์ฅ์ ๋๋ฌ๋ณด๋ฉด์ ๋์ ์ฑ ์ง์ญ ๊ฒฝ์ ์ ์ ๋ชฉํ ์ ์๋ ์ฒดํ์ ๊ธฐํ๋ ๊ฐ์ง ์์ ์ด๋ค. \nโก ํํธ, ์ฐ์์์ 2006๋
๋ถํฐ ๋ฒ ํธ๋จ ์ง๋ฐฉ ๊ณต๋ฌด์๋ค์ ๋์์ผ๋ก ์ฐ์๊ณผ์ ์ ์ด์ํ ์ดํ 5๊ฐ ๋ฒ ํธ๋จ ๊ณผ์ ๊ณผ ๊ธฐํ ๋ค๊ตญ ๊ณผ์ ์ ํตํ์ฌ ์ด 130๋ช
์ ์ฐ์์์ ๋์ฐฝ์์ผ๋ก ๋ฐฐ์ถํ๋ค.doc_id : 45112 / title : โํ๊ตญ ๊ณต๊ธฐ์
ํ์ ์ฌ๋ก ๋ฐฐ์ฐ๋ฌ ์์ด์!โ / content : ๋ชฝ๊ณจ NAOG ๊ต์๋จ ๋ฐ ๊ณ ์๊ณต๋ฌด์ ๋ฐฉํ โํ๊ตญ ๊ณต๊ธฐ์
ํ์ ์ฌ๋ก ๋ฐฐ์ฐ๋ฌ ์์ด์!โ - ์ง๋ฐฉํ์ ์ฐ์์, 13๋
์งธ ๋ชฝ๊ณจ ๋ง์ถคํ ๊ต์ก์ค์-\nโก ํ์ ์์น๋ถ ์ง๋ฐฉํ์ ์ฐ์์(์์ฅ ์ต๋์, ์ดํ ์ฐ์์)์ 3์ 1์ผ๋ถํฐ 3์ 8์ผ๊น์ง ใ๋ชฝ๊ณจ NAOG* ์ญ๋๊ฐํ๊ณผ์ ใ์ ์ด์ํ๋ค. \nโ ์ด๋ฒ ๊ณผ์ ์๋ ๊ต์, ๊ณ ์๊ณต๋ฌด์, ์ฐ์๊ด๊ณ๊ด 14๋ช
์ด ์ฐธ๊ฐํ๋ค. \n* NAOG (๊ตญ๋ฆฝ๊ฑฐ๋ฒ๋์ค ์์นด๋ฐ๋ฏธ, National Academy of Governance) : ๊ณต๋ฌด์์ ๋ฌผ๋ก ์ ์น์ธยท๋ฏผ๊ฐ์ธ ๋ฑ ๋ชฝ๊ณจ์ ์คํผ๋์ธ ๋ฆฌ๋๋ค์ ๊ต์กํ๋ ๋ชฝ๊ณจ ์ต๋์ ๊ต์ก๊ธฐ๊ด์ผ๋ก ์โค๋ฐ์ฌํ์ ์์ฌ\nโก ์ฐ์์์ ๋ชฝ๊ณจ NAOG์ 2002๋
๊ต๋ฅํ๋ ฅ MOU๋ฅผ ์ฒด๊ฒฐํ ์ดํ, 13๊ฐ ๊ต์ก๊ณผ์ (ํ์ ๊ฐํ, ๊ฒฝ์ ๋ฐ์ ์ ๋ต, ํ์ ์ ํฌ๋ช
์ฑ ์ ๊ณ ๋ฐฉ์ ๋ฑ)์ ์ด์ํด 158๋ช
์ NAOG ๊ต์์ ๊ณ ์ ๊ณต๋ฌด์์ ๋์ฐฝ์์ผ๋ก ๋ฐฐ์ถํ๊ณ , \nโ ๊ทธ ์ด์ธ์๋ ๋ชฝ๊ณจ์ ๋์ง์ฌ, ๊ตฐ์ ๋ฑ ์ง๋ฐฉ๊ณต๋ฌด์ 1,310๋ช
์ ๋์์ผ๋ก ํ๊ตญ ์ง๋ฐฉํ์ ์ ์ฐ์์ฌ๋ก๋ฅผ ๋ฒค์น๋งํนํ ์ ์๋ ๋ชฝ๊ณจ๊ตฐ์ ๊ณผ์ ๋ฑ ๋ค์ํ ๊ต์กํ๋ก๊ทธ๋จ์ ์ด์ํด ์ค๊ณ ์๋ค. |
|
""" |
|
messages = [ |
|
{ |
|
"role": "system", |
|
"content": """๋น์ ์ ๋ํํ AI๋ก์, ์ฌ์ฉ์์ ์ง๋ฌธ์ ์ ๋ขฐํ ์ ์๋ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ ๊ฒ์ด ์ฃผ์ ์ญํ ์
๋๋ค. ์ฌ์ฉ์์ ์๊ตฌ๋ฅผ ์ ํํ ์ดํดํ๊ณ , ๊ด๋ จ ๋ฌธ์๋ฅผ ๋ถ์ํ์ฌ ์ต์ ์ ๋ต๋ณ์ ์์ฑํด์ผ ํฉ๋๋ค. \n๋น์ ์ ๋ค์๊ณผ ๊ฐ์ ์์น์ ์ค์ํด์ผ ํฉ๋๋ค:\n1. ํญ์ ์ฌ์ฉ์์ ์์ฒญ์ ์ต์ฐ์ ์ผ๋ก ๊ณ ๋ คํ๋ฉฐ, ๋ช
ํํ๊ณ ์ดํดํ๊ธฐ ์ฌ์ด ๋ต๋ณ์ ์ ๊ณตํฉ๋๋ค.\n2. ์ ๊ณต๋ ๋ฌธ์๋ฅผ ์ต๋ํ ํ์ฉํ์ฌ ์๋ต์ ๊ตฌ์ฑํ๋, ์ถ๊ฐ์ ์ธ ๋ถ์๊ณผ ๋
ผ๋ฆฌ๋ฅผ ํตํด ์๋ต์ ์ง์ ๋์
๋๋ค.\n3. ์๋ต์ ์์ฑํ ๋๋ ๋ฐ๋์ ์ฃผ์ด์ง ์ง์นจ์ ๋ฐ๋ฅด๊ณ , ๋ช
ํํ ์ถ์ฒ๋ฅผ ์ ๊ณตํด์ผ ํฉ๋๋ค.\n4. ์ฌ์ฉ์์ ์ง๋ฌธ์ด ๋ชจํธํ ๊ฒฝ์ฐ, ๋ช
ํ์ฑ์ ํ๋ณดํ๊ธฐ ์ํด ์ง๋ฌธ์ ์ฌ๊ตฌ์ฑํ๋ ๋ฐฉ์์ ๊ณ ๋ คํ ์ ์์ต๋๋ค.\n\n# ์ฌ์ฉ์ ์๋ด๋ฌธ\n## ์์
๋ฐ ๋งฅ๋ฝ\n๋น์ ์ ์ฌ์ฉ์ ์ง๋ฌธ์ ๋ํด ๊ด๋ จ ๋ฌธ์๋ฅผ ๋ถ์ํ๊ณ , ์ ๋ขฐํ ์ ์๋ ์ ๋ณด๋ฅผ ๋ฐํ์ผ๋ก ์๋ต์ ์์ฑํด์ผ ํฉ๋๋ค. ๋จ์ํ ์ ๋ณด ์ ๋ฌ์ ๋์ด, ๋ฌธ๋งฅ์ ๊ณ ๋ คํ์ฌ ๊ฐ์ฅ ์ ์ ํ ํํ๋ก ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค.\n\n## ์คํ์ผ ๊ฐ์ด๋\njson ํ์์ผ๋ก ๋ต๋ณ์ ์ถ๋ ฅํ์ธ์.[{"related_document" : {"๋ฌธ์ ์ ๋ณด์์ ์ฐพ์ doc_id"}, "source" : {"๋ฌธ์ ์ ๋ณด์์ ์ฐพ์ doc_id" : "ํด๋น ๋ฌธ์์์ ์ฐพ์ ์ ์๋ ์ธ์ฉ๊ตฌ ๊ตฌ์ , ์๋ฌธ ๊ทธ๋๋ก ํ๊ธฐ", "๋ฌธ์ ์ ๋ณด์์ ์ฐพ์ doc_id" : "ํด๋น ๋ฌธ์์์ ์ฐพ์ ์ ์๋ ์ธ์ฉ๊ตฌ ๊ตฌ์ , ์๋ฌธ ๊ทธ๋๋ก ํ๊ธฐ"},"answer" : "์ถ์ฒ๋ฅผ ํ๊ธฐํ์ง ์์ 3~6๋ฌธ์ฅ ์ค๋ช
ํ ๋ต๋ณ","grounded_answer" : "answer๊ณผ ๋์ผํ๋ <co: doc_id>์ </co: doc_id> ๊ธฐํธ๋ก ์ธ์ฉ ์ถ์ฒ๋ฅผ ๋ช
์ํ ๋ต๋ณ"}]\n""", |
|
}, |
|
{"role": "user", "content": prompt}, |
|
] |
|
text = tokenizer.apply_chat_template( |
|
messages, tokenize=False, add_generation_prompt=True |
|
) |
|
model_inputs = tokenizer([text], return_tensors="pt").to(model.device) |
|
|
|
generated_ids = model.generate(**model_inputs, max_new_tokens=512) |
|
generated_ids = [ |
|
output_ids[len(input_ids) :] |
|
for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids) |
|
] |
|
|
|
response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0] |
|
print(response) |
|
``` |
|
|
|
## ํ์ต ํ๊ฒฝ ๋ฐ ํ๋ผ๋ฏธํฐ |
|
- ํ๋ ํ๊ฒฝ |
|
- H100(80GB) * 8 |
|
- ํ๋ผ๋ฏธํฐ |
|
- tokenizer_model_mex_length 4500 |
|
- use_flash_attn True |
|
- num_train_epochs 3.0 |
|
- weight_decay 0.001 |
|
- lr_scheduler_type "linear" |
|
- per_device_train_batch_size 1 |
|
- gradient_accumulation_steps 64 |
|
- learning_rate 5e-06 |
|
- bf16 True |
|
- deepspeed ds_stage2.json |
|
|
|
## ์ฌ์ฉ ๋ฐ์ดํฐ์
|
|
- AIhub 16 ํ์ ๋ฌธ์ ๋์ ๊ธฐ๊ณ๋
ํด ๋ฐ์ดํฐ |
|
- AIhub 17 ๋ด์ค ๊ธฐ์ฌ ๊ธฐ๊ณ๋
ํด ๋ฐ์ดํฐ |
|
- AIhub 21 ๋์์๋ฃ ๊ธฐ๊ณ๋
ํด |
|
- AIhub 149 ํ ์ ๋ณด ์ง์์๋ต ๋ฐ์ดํฐ |
|
- AIhub 150 ์ซ์์ฐ์ฐ ๊ธฐ๊ณ๋
ํด ๋ฐ์ดํฐ |
|
- AIhub 151 ๊ธ์ต, ๋ฒ๋ฅ ๋ฌธ์ ๊ธฐ๊ณ๋
ํด ๋ฐ์ดํฐ |
|
- kyujinpy/KoCoT_2000 |
|
- MarkrAI/KoCommercial-Dataset |
|
- CarrotAI/ko-instruction-dataset |
|
- heegyu/CoT-collection-ko |
|
|
|
## Contact us |
|
- ์จ๋ก๋ง์ธ๋ |
|
- ์์ธ์ ๊ด์
๊ตฌ ๋จ๋ถ์ํ๋ก 1802, 2์ธต |
|
- 02-872-5127 |
|
- contact@surromind.ai |