Eval Llama v3.1 8B ,70B Model with Thai Language

Eval Llama v3.1 8B ,70B  ด้วย ข้อสอบภาษาไทย  

เทียบกับ llama3-typhoon

ทดสอบ การใช้งาน llama v3.1 ที่ว่า support ภาษาไทย จะทำข้อสอบ ภาษาไทยได้ดีแค่ไหน มาดูกัน

ข้อสอบ

• 04_investment_consult
• 05_facebook_beleble_th_200
• 06_xcopa_th_200
• 07_xnli2.0_th_200
• 08_onet_m3_thai
• 09_onet_m3_social
• 10_onet_m3_math
• 11_onet_m3_science
• 12_onet_m3_english

• 13_onet_m6_thai
• 14_onet_m6_math
• 15_onet_m6_social
• 16_onet_m6_science
• 17_onet_m6_english


Code ทดสอบ มาจาก 

OpenThaiGPT - Thai Exams Eval

https://github.com/OpenThaiGPT/openthaigpt_eval

การทดสอบด้วยการทำข้อสอบแบบ Multiple Choice ภาษาไทย ทดสอบบนชุดข้อสอบที่ไม่เคยเห็นมาก่อน ทดสอบแบบ Zero-shot Learning, โค้ดการทดสอบและเนื้อหาข้อสอบสามารถทำตามได้ที่นี่


ข้อมูลของ ข้อสอบ

https://docs.google.com/spreadsheets/d/1ZtP5Jkx0IvCWNPQhMKitZszGnLKqvEDEf0OKdmQiXjA/edit#gid=1181424412


ผลการทดสอบ







































ผลการทดสอบ Average


Code การทดสอบ




code การ plot Graph




Adun Nantakaew อดุลย์ นันทะแก้ว

LINE : adunnan



ความคิดเห็น

โพสต์ยอดนิยมจากบล็อกนี้

Llama3 Typhoon v1.5 (scb10x) LLM

LLAMA-CPP-PYTHON on RTX4060 GPU