Eval Llama v3.1 8B ,70B Model with Thai Language

Eval Llama v3.1 8B ,70B ด้วย ข้อสอบภาษาไทย

เทียบกับ llama3-typhoon

ทดสอบ การใช้งาน llama v3.1 ที่ว่า support ภาษาไทย จะทำข้อสอบ ภาษาไทยได้ดีแค่ไหน มาดูกัน

ข้อสอบ

• 04_investment_consult
• 05_facebook_beleble_th_200
• 06_xcopa_th_200
• 07_xnli2.0_th_200
• 08_onet_m3_thai
• 09_onet_m3_social
• 10_onet_m3_math
• 11_onet_m3_science
• 12_onet_m3_english
• 13_onet_m6_thai
• 14_onet_m6_math
• 15_onet_m6_social
• 16_onet_m6_science
• 17_onet_m6_english

Code ทดสอบ มาจาก

OpenThaiGPT - Thai Exams Eval

https://github.com/OpenThaiGPT/openthaigpt_eval

การทดสอบด้วยการทำข้อสอบแบบ Multiple Choice ภาษาไทย ทดสอบบนชุดข้อสอบที่ไม่เคยเห็นมาก่อน ทดสอบแบบ Zero-shot Learning, โค้ดการทดสอบและเนื้อหาข้อสอบสามารถทำตามได้ที่นี่