Demo OpenThaiGPT 1.0.0-beta on Colab
Demo OpenThaiGPT 1.0.0-beta on Colab
Colab code on official Website
https://colab.research.google.com/drive/1NkmAJHItpqu34Tur9wCFc97A6JzKR8xo
ถ้าใช้ model ตาม original colab code ที่ OpenThaiGPT Website
Model นี้จะใช้ RAM ถึง 22.6 GB เพราะเป็น model FP32 และ ต้อง Run เป็น NVIDIA A100 GPU ไม่สามารถ run บน NVIDIA T4 GPU ที่มี ram แค่ 16GB ได้
ดังนั้น จึงต้อง convert model เป็น FP16
Convert Model to FP16
ผมได้ convert model OpenThaiGPT เป็น แบบ FP16 เพื่อสามารถ run บน NVIDIA T4 GPU ได้( และ เอา Base Model + LoRa adaptor แล้ว ที่ code เลยไม่ต้องมี lora_weights อีก)
แล้ว upload ที่ Hugging face ตามนี้
และ แก้ไข code ตามนี้ ก็สามารถ run บน NVIDIA T4 ได้
ถ้าใช้ mode 8 bit ก็จะใช้ RAM ประมาณ 8 GB
Run Demo
Run Demo with Gradio
สรุป การใช้ RAM แต่ละ Quantization Model
Reference
OpenThaiGPT https://openthaigpt.aieat.or.th/
Facebook LLaMA 7B
Meta has a new machine learning language model to remind you it does AI too
https://www.theverge.com/2023/2/24/23613512/meta-llama-ai-research-large-language-model
https://www.theverge.com/2023/2/24/23613512/meta-llama-ai-research-large-language-model
Adun Nantakaew อดุลย์ นันทะแก้ว 081-6452400
LINE : adunnan
FaceBook : https://www.facebook.com/adun.nantakaew/
Web Blog : http://raspberrypi4u.blogspot.com/
Website : https://softpower.tech
ความคิดเห็น
แสดงความคิดเห็น