Demo OpenThaiGPT 1.0.0-beta on Colab









Demo OpenThaiGPT 1.0.0-beta on Colab

Colab code on official Website

https://colab.research.google.com/drive/1NkmAJHItpqu34Tur9wCFc97A6JzKR8xo






ถ้าใช้  model ตาม original colab code ที่ OpenThaiGPT Website 
Model นี้จะใช้ RAM ถึง 22.6 GB เพราะเป็น model FP32 และ ต้อง Run เป็น  NVIDIA A100 GPU ไม่สามารถ run บน NVIDIA T4 GPU ที่มี ram แค่ 16GB ได้
ดังนั้น จึงต้อง convert model เป็น FP16 
 

Convert Model to FP16

ผมได้ convert model OpenThaiGPT เป็น แบบ FP16 เพื่อสามารถ run บน NVIDIA T4 GPU ได้
( และ เอา Base Model + LoRa adaptor แล้ว ที่ code เลยไม่ต้องมี lora_weights อีก)

แล้ว upload ที่ Hugging face ตามนี้


และ แก้ไข code ตามนี้ ก็สามารถ run บน NVIDIA T4 ได้































ถ้าใช้ mode 8 bit ก็จะใช้ RAM ประมาณ 8 GB
































Run Demo 























Run Demo with Gradio





สรุป การใช้ RAM แต่ละ  Quantization Model 






ความคิดเห็น

โพสต์ยอดนิยมจากบล็อกนี้

Demo OpenThaiGPT 0.1.0-beta on Colab

OpenThaiGPT 1.0.0 7B beta GPTQ 4 bit