Meta Luncurkan Llama 3.2: Pesaing Baru untuk GPT-4o Mini

Pabila Syaftahan
•
29 Sep 2024 08.36 WIB

Meta, perusahaan induk di balik platform sosial Facebook, Instagram, dan WhatsApp, baru saja meluncurkan model bahasa terbarunya, Llama 3.2, dalam acara Meta Connect yang berlangsung pada hari Rabu, 25 September 2024. Peluncuran ini menandai upaya Meta untuk bersaing dengan GPT-4o Mini yang dikembangkan oleh OpenAI, yang baru saja dirilis pada bulan Juli lalu.

CEO Meta, Mark Zuckerberg, mengungkapkan bahwa Llama 3.2 telah menunjukkan pertumbuhan yang signifikan, mencapai peningkatan hingga sepuluh kali lipat sejak tahun 2023. Model ini bahkan diklaim setara dengan GPT-4o Mini dalam hal pengenalan gambar dan kemampuan pemahaman visual lainnya. Zuckerberg menambahkan bahwa Llama 3.2 juga unggul dibandingkan dengan model AI open-source lainnya, seperti Gemma milik Google dan Phi 3.5-mini dari Microsoft, terutama dalam berbagai tugas, termasuk mengikuti instruksi, meringkas informasi, penggunaan alat, dan penulisan ulang perintah.

“Llama terus mengalami peningkatan yang pesat, yang memungkinkan semakin banyak kemampuan untuk diterapkan,” ungkap Zuckerberg. Llama 3.2 hadir sebagai versi upgrade dari Llama 3.1 yang diperkenalkan sekitar dua bulan sebelumnya. Salah satu peningkatan terbesar yang ditawarkan oleh Llama 3.2 adalah dukungan multimodal, yang memungkinkannya untuk memahami input gambar. “Llama 3.2 adalah model multimodal open-source pertama kami. Ini akan membuka peluang untuk banyak aplikasi yang memerlukan pemahaman visual,” tambah Zuckerberg dalam pidatonya di acara tersebut.

Dalam konteks perlombaan AI global yang semakin ketat, peluncuran Llama 3.2 menunjukkan bahwa Meta berusaha mengejar ketertinggalan. Perusahaan-perusahaan lain, seperti OpenAI dan Google, telah meluncurkan model-model AI multimodal sejak tahun lalu. Dengan pendekatan open-source, Llama 3.2 memberikan keleluasaan bagi pengembang untuk menggunakan model ini secara bebas dan tanpa biaya.

Llama 3.2 tersedia dalam dua varian ukuran, yakni model kecil dengan 11 miliar parameter dan model sedang yang memiliki 90 miliar parameter. Model dengan lebih banyak parameter biasanya menawarkan tingkat akurasi yang lebih tinggi dan kemampuan untuk menangani tugas-tugas yang lebih kompleks. Sama seperti pendahulunya, Llama 3.2 memiliki kapasitas konteks yang sangat besar, yaitu 128.000 token, yang memungkinkan pengguna untuk memasukkan teks dalam jumlah besar, setara dengan ratusan halaman buku.

Dengan fitur-fitur canggih yang ditawarkan, Llama 3.2 membuka jalan bagi pengembangan aplikasi AI yang lebih inovatif. Contohnya, aplikasi realitas tertambah yang dapat memberikan pemahaman video secara real-time, mesin pencari visual yang dapat mengurutkan gambar berdasarkan konten, atau alat analisis dokumen yang mampu merangkum teks panjang menjadi informasi yang lebih ringkas dan mudah dicerna.

Kemampuan Llama 3.2 untuk memahami gambar adalah salah satu fitur unggulannya. Model dengan parameter 11B dan 90B dapat menganalisis grafik dan bagan, memberi keterangan pada gambar, serta mengenali objek berdasarkan deskripsi dalam bahasa alami. Misalnya, pengguna dapat menanyakan bulan tertentu di mana perusahaan mereka mengalami penjualan terbaik, dan model akan merespons berdasarkan data yang ada dalam grafik.

Selain itu, Llama 3.2 juga dilengkapi dengan versi teks-saja yang lebih ringan, dengan parameter 1B dan 3B. Versi ini dirancang untuk membantu pengembang dalam membangun aplikasi yang lebih personal, seperti meringkas pesan terbaru atau mengatur undangan kalender untuk rapat. Model yang lebih kecil ini dioptimalkan untuk berjalan pada perangkat keras seperti Qualcomm, MediaTek, dan Arm, dengan harapan dapat digunakan secara luas di perangkat seluler.

Model Llama 3.2 kini sudah tersedia untuk diunduh melalui situs resmi llama.com dan Hugging Face, serta di berbagai platform mitra Meta. Langkah ini menunjukkan komitmen Meta untuk menghadirkan teknologi AI mutakhir yang dapat diakses oleh pengembang dan pengguna di seluruh dunia.