PhoGPT: AI Open-Source untuk Bahasa dan Budaya Vietnam
- Mutiara Aisyah
- •
- 04 Mar 2025 22.49 WIB

Ilustrasi Budaya vietnam
VinAI adalah anak perusahaan dari konglomerasi Vingroup yang berfokus pada pengembangan produk dan layanan berbasis kecerdasan buatan (AI). Mereka tidak hanya mengembangkan perangkat lunak komersial, tetapi juga aktif dalam penelitian akademik serta merilis perangkat lunak open-source berdasarkan penelitian mereka. Salah satu kontribusi besar VinAI dalam ekosistem AI Vietnam adalah peluncuran PhoGPT pada tahun 2023, model bahasa besar (LLM) pertama yang dikembangkan khusus untuk bahasa dan budaya Vietnam.
PhoGPT dikembangkan sebagai respons terhadap kesuksesan model LLM lain di luar negeri, seperti seri GPT dari OpenAI. Model-model ini umumnya dilatih dengan dataset berbahasa Inggris yang mencerminkan perspektif budaya Barat. Akibatnya, aplikasi teknologi LLM dalam bahasa Vietnam memiliki keterbatasan dalam hal performa dan relevansi, yang pada akhirnya menghambat adopsi AI generatif serta pertumbuhan ekosistem AI di Vietnam. Dengan menghadirkan PhoGPT sebagai model open-source, VinAI berharap dapat membangun ekosistem AI yang lebih kuat di Vietnam dengan teknologi yang lebih relevan secara budaya dan linguistik.
Karakteristik dan Keunggulan PhoGPT
1. Arsitektur dan Dataset
PhoGPT-4B adalah model dasar yang memiliki 3,7 miliar parameter dan dilatih dengan dataset yang berisi 102 miliar kata dalam bahasa Vietnam. Sumber data yang digunakan meliputi Wikipedia, teks medis, buku, dokumen hukum, artikel berita, dan berbagai konten web lainnya. Proses pelatihan dilakukan selama tiga bulan dengan jumlah prosesor yang relatif kecil, menjadikannya lebih hemat biaya dibandingkan model komersial terdepan di industri.
Dengan fokus yang kuat pada data berbahasa Vietnam, PhoGPT memiliki kemampuan tinggi dalam berbagai topik, baik untuk riset, layanan publik, maupun penggunaan komersial. VinAI juga berencana untuk memperluas cakupan model ini ke bahasa-bahasa lain di ASEAN yang masih kurang terwakili dalam model AI global.
2. Performa dan Perbandingan dengan Model Lain
PhoGPT telah menunjukkan hasil yang kompetitif dalam berbagai pengujian spesifik untuk bahasa Vietnam. Model ini bahkan melampaui banyak LLM global dalam hal akurasi pada tugas-tugas yang relevan dengan budaya dan bahasa Vietnam. Yang menarik, pencapaian ini diraih dengan investasi daya komputasi yang relatif kecil, menunjukkan bahwa pengembangan model LLM di negara berkembang tetap memiliki potensi besar tanpa harus bergantung pada sumber daya yang sangat mahal.
3. Varian PhoGPT-4B-Chat
Selain model dasar, VinAI juga mengembangkan varian PhoGPT-4B-Chat yang difokuskan pada percakapan. Model ini telah disempurnakan dengan 70.000 contoh instruksi serta 290.000 percakapan tambahan, menjadikannya pilihan ideal untuk aplikasi chatbot berbahasa Vietnam. Dengan model ini, pengembang dapat membangun asisten virtual dan chatbot yang lebih natural dalam memahami serta merespons percakapan dalam bahasa Vietnam.
Keunggulan Open-Source dan Dampaknya
Sebagai model open-source, PhoGPT tersedia secara bebas bagi para pengembang dan peneliti yang ingin mengakses, memodifikasi, atau mengintegrasikan model ini ke dalam proyek mereka. Mereka dapat melakukan pelatihan ulang atau penyempurnaan sesuai kebutuhan spesifik mereka. Ini membuka peluang besar untuk inovasi dan kolaborasi, sekaligus meningkatkan transparansi serta validasi model oleh komunitas pengguna.
Pendekatan open-source ini juga memungkinkan PhoGPT menjangkau lebih banyak pengguna, termasuk lembaga penelitian dan perusahaan kecil yang mungkin tidak memiliki sumber daya untuk melisensikan model AI berbayar. Dengan cara ini, VinAI tidak hanya mendorong adopsi teknologi AI generatif dalam aplikasi berbahasa Vietnam, tetapi juga membangun ekosistem AI yang lebih inklusif.
Manfaat dan Dampak bagi Ekosistem AI Vietnam
1. Meningkatkan Kemampuan Peneliti AI Lokal
PhoGPT memberikan landasan bagi peneliti AI Vietnam untuk mengembangkan model AI yang lebih maju dan relevan dengan konteks budaya mereka. Beberapa universitas di Vietnam telah memanfaatkan penelitian dari VinAI untuk memperdalam studi mereka mengenai teknologi AI generatif.
2. Mendukung Program AI Residency
Program AI Residency dari VinAI telah melatih lebih dari 100 ilmuwan AI muda Vietnam. Keberadaan PhoGPT membantu program ini dalam menyediakan lingkungan pembelajaran yang lebih praktis dan relevan dengan kebutuhan lokal.
3. Kolaborasi dengan Perusahaan Teknologi Internasional
Salah satu perusahaan teknologi global telah bekerja sama dengan VinAI untuk mengintegrasikan PhoGPT ke dalam platform AI mereka. Hal ini memungkinkan model tersebut digunakan oleh berbagai perusahaan di Vietnam dan negara lainnya.
4. Mendorong Kemandirian Teknologi di ASEAN
Keberadaan model AI yang relevan secara budaya dan linguistik memungkinkan negara-negara ASEAN memiliki ekosistem data yang lebih mandiri. PhoGPT menjadi contoh bagaimana teknologi AI dapat dikembangkan dengan mempertimbangkan kebutuhan lokal, sehingga akses terhadap teknologi ini lebih merata di seluruh kawasan.
PhoGPT adalah langkah besar dalam pengembangan teknologi AI di Vietnam dan kawasan ASEAN secara umum. Dengan pendekatan open-source, model ini tidak hanya membantu komunitas peneliti dan pengembang di Vietnam tetapi juga mempercepat adopsi AI yang relevan secara budaya. Pencapaiannya dalam mengoptimalkan penggunaan sumber daya komputasi menunjukkan bahwa pengembangan model AI canggih tidak selalu membutuhkan investasi besar.
Dalam jangka panjang, kehadiran PhoGPT diharapkan dapat memperkuat ekosistem AI lokal, meningkatkan kapasitas sumber daya manusia di bidang AI, serta mendorong inovasi dalam berbagai sektor yang memanfaatkan teknologi AI. Dengan demikian, PhoGPT tidak hanya menjadi model bahasa besar untuk Vietnam, tetapi juga menjadi inspirasi bagi negara-negara lain dalam mengembangkan solusi AI yang lebih inklusif dan relevan dengan kebutuhan lokal mereka.