Google Rilis Gemini 1.5 Flash 8B: AI Lebih Cepat dan Hemat


Logo Gemini

Logo Gemini

Google kembali menggebrak dunia artificial intelligence (AI) dengan meluncurkan Gemini 1.5 Flash-8B, model AI terbaru yang diklaim lebih ringan, cepat, dan ekonomis. Pembaruan ini diumumkan pada Oktober 2024, melanjutkan keberhasilan Gemini 1.5 Flash yang pertama kali diperkenalkan pada Mei lalu. Dibandingkan dengan pendahulunya, Gemini 1.5 Flash-8B menghadirkan peningkatan yang signifikan, baik dari segi kecepatan maupun efisiensi.

Salah satu fitur utama dari Gemini 1.5 Flash-8B adalah kemampuan merespons dua kali lebih cepat, dengan peningkatan rate limit dalam satu permintaan (prompt) dari 2.000 menjadi 4.000 request per menit (RPM). Peningkatan ini menjadikan Gemini 1.5 Flash-8B sangat efisien dalam menangani tugas-tugas yang tidak terlalu memakan banyak sumber daya, seperti menjawab pertanyaan, mentranskrip audio, dan menerjemahkan bahasa asing secara langsung.

Kecepatan dan Efisiensi

Dengan latensi yang lebih rendah, Gemini 1.5 Flash-8B mampu merespons dengan lebih cepat, terutama pada tugas-tugas ringan. Ini memberikan keuntungan besar bagi pengembang aplikasi yang membutuhkan model AI yang efisien dan hemat sumber daya. Berkat kemampuannya ini, Gemini 1.5 Flash-8B semakin relevan dalam berbagai sektor, mulai dari pendidikan hingga bisnis, di mana kecepatan dan akurasi sangat diperlukan.

Tak hanya itu, Gemini 1.5 Flash-8B juga hadir dengan biaya yang jauh lebih murah dibandingkan versi sebelumnya. Misalnya, untuk input dengan token kurang dari 128.000, biaya penggunaan Gemini 1.5 Flash-8B hanya sebesar 0,0375 dolar AS per 1 juta token, lebih murah setengah dari harga Gemini 1.5 Flash yang sebesar 0,075 dolar AS per 1 juta token. Demikian juga untuk output dan caching, yang semuanya mengalami pengurangan harga hingga 50 persen.

Detail Harga dan Ketersediaan

Berikut perbandingan harga antara Gemini 1.5 Flash dan Gemini 1.5 Flash-8B:

Kategori

Gemini 1.5 Flash

Gemini 1.5 Flash-8B

Input (token < 128.000)

0,075 dolar AS/1 juta token

0,0375 dolar AS/1 juta token

Output (token < 128.000)

0,30 dolar AS/1 juta token

0,15 dolar AS/1 juta token

Caching (token < 128.000)

0,01875 dolar AS/1 juta token

0,01 dolar AS/1 juta token

Storage (token < 128.000)

1 dolar AS/1 juta token

0,25 dolar AS/1 juta token

Input (token > 128.000)

0,15 dolar AS/1 juta token

0,075 dolar AS/1 juta token

Output (token > 128.000)

0,60 dolar AS/1 juta token

0,30 dolar AS/1 juta token

Caching (token > 128.000)

0,0375 dolar AS/1 juta token

0,02 dolar AS/1 juta token

Storage (token > 128.000)

1 dolar AS/1 juta token/jam

0,25 dolar AS/1 juta token/jam

Google juga memberikan akses gratis bagi para pengembang yang ingin mencoba Gemini 1.5 Flash-8B melalui Google AI Studio dan Gemini API. Pengguna dapat menjajal model AI ini dengan jumlah token terbatas. Namun, jika melebihi batas token tertentu, biaya akan dikenakan sesuai dengan harga yang telah ditetapkan.

Harga khusus untuk pengembang berbayar akan mulai berlaku pada 14 Oktober 2024. Google berharap, dengan adanya penawaran harga yang lebih terjangkau ini, penggunaan AI dalam pengembangan aplikasi akan semakin meluas dan berdampak positif pada berbagai sektor industri.

Mendorong Penggunaan AI yang Lebih Luas

Dalam pernyataan resmi yang dirangkum dari Blog Google, Google menekankan bahwa pembaruan ini dirancang untuk mendukung pengembang dalam menciptakan aplikasi yang lebih efisien. "Model AI dan harga terbaru kami untuk Gemini 1.5 Flash-8B memungkinkan para pengembang membuat aplikasi sesuai dengan kategori produk dan beban kerjanya, sehingga bisa meningkatkan penggunaan AI secara luas," ujar Google.

Dengan fitur yang lebih cepat, efisien, dan murah, Google tampaknya terus berupaya memperkuat posisinya dalam pasar kecerdasan buatan. Gemini 1.5 Flash-8B menjadi bukti bahwa AI tidak hanya soal inovasi, tetapi juga tentang bagaimana membuat teknologi ini semakin terjangkau dan relevan bagi semua kalangan.


Bagikan artikel ini

Video Terkait