OpenThaiGPT 1.0.0 7B beta GPTQ 4 bit

ทดสอบ การใช้งาน Model แบบ GPTQ แบบ 4 bit

GPTQ-for-LLaMA

4 bits quantization of LLaMA using GPTQ

GPTQ is SOTA one-shot weight quantization method

This code is based on GPTQ

There is a pytorch branch that allows you to use groupsize and act-order together.

Original Model ( FP16 )

GPTQ 4 bit Model

A Gradio web UI for Large Language Models.

Test on

Hardware

Software OS : Ubuntu 20.04.6 LTS

ChatBot

Q&A

Run Demo code

GPTQ-for-LLaMa https://github.com/amphancm/GPTQ-for-LLaMa

OpenThaiGPT https://openthaigpt.aieat.or.th/