Amazon Luncurkan Nova, Model AI Multimodal Generasi Baru

Pabila Syaftahan
•
05 Des 2024 10.30 WIB

Pada acara re:Invent 2024, Amazon Web Services (AWS), divisi komputasi awan milik Amazon, memperkenalkan Nova, lini baru model AI generatif multimodal. Keluarga Nova ini mencakup beberapa model canggih yang dirancang untuk memenuhi berbagai kebutuhan, mulai dari pembuatan teks hingga pembuatan gambar dan video.

Dalam presentasinya, CEO Amazon Andy Jassy menyebutkan bahwa Nova adalah hasil dari pengembangan intensif selama beberapa bulan terakhir. “Model frontier kami telah berkembang pesat dalam empat hingga lima bulan terakhir. Kami yakin jika kami menemukan manfaat besar dari model ini, Anda juga akan merasakan hal yang sama,” ujar Jassy.

Empat Model Pembuatan Teks: Micro, Lite, Pro, dan Premier

Nova menawarkan empat model pembuatan teks yang dapat digunakan untuk berbagai tingkat kebutuhan, yakni Micro, Lite, Pro, dan Premier.

Micro adalah model dasar yang hanya memproses teks dan memberikan hasil dengan latensi terendah, membuatnya cocok untuk tugas-tugas yang membutuhkan kecepatan tinggi.
Lite memiliki kemampuan memproses teks, gambar, dan video dengan kecepatan yang cukup baik, menjadikannya pilihan ideal untuk kebutuhan multimedia.
Pro menawarkan kombinasi yang seimbang antara akurasi, kecepatan, dan efisiensi biaya. Model ini dirancang untuk menangani berbagai tugas, seperti menganalisis dokumen, merangkum rapat, atau memahami grafik.
Premier, model paling canggih, dirancang untuk pekerjaan yang lebih kompleks. AWS memposisikan Premier sebagai "model guru" untuk membantu pelanggan menciptakan model kustom yang lebih spesifik daripada digunakan secara langsung.

Keempat model ini mendukung hingga 15 bahasa, dengan fokus utama pada bahasa Inggris. Nova juga menawarkan kemampuan pemrosesan jendela konteks yang luas, memungkinkan analisis teks dan data dalam jumlah besar. Misalnya, Micro mampu menangani hingga 128.000 token, setara dengan sekitar 100.000 kata, sementara Lite dan Pro dapat memproses hingga 300.000 token. Pada awal 2025, AWS berencana meningkatkan kapasitas hingga lebih dari dua juta token untuk model tertentu.

AWS juga mengklaim bahwa model Nova adalah salah satu yang tercepat di kelasnya, sekaligus hemat biaya. Pelanggan dapat mengaksesnya melalui AWS Bedrock, platform pengembangan AI Amazon, yang memungkinkan model disesuaikan untuk teks, gambar, maupun video.

Nova Canvas dan Reel: Generative Media yang Inovatif

Selain model pembuatan teks, AWS juga meluncurkan dua model multimodal lainnya: Nova Canvas dan Nova Reel.

Nova Canvas memungkinkan pengguna membuat dan mengedit gambar menggunakan perintah sederhana. Pengguna dapat menyesuaikan warna, tata letak, dan elemen lainnya dalam gambar yang dihasilkan, termasuk menghapus latar belakang.
Nova Reel adalah alat pembuatan video yang mampu menghasilkan video pendek hingga enam detik. Pengguna dapat memberikan perintah atau menggunakan gambar referensi untuk membuat video dengan berbagai efek seperti gerakan kamera, rotasi 360 derajat, dan zoom.

Meskipun saat ini durasi video yang dapat dihasilkan terbatas, AWS mengumumkan bahwa versi baru yang mendukung video berdurasi dua menit akan segera dirilis.

AWS juga memastikan bahwa kedua model ini dilengkapi dengan kontrol bawaan untuk penggunaan yang bertanggung jawab. Fitur seperti watermarking dan moderasi konten diterapkan untuk mencegah penyalahgunaan model ini, termasuk pembatasan dalam pembuatan konten berbahaya.

Langkah ke Depan: Model Any-to-Any dan Speech-to-Speech

Ke depan, AWS sedang mengembangkan model inovatif lainnya, termasuk model speech-to-speech dan any-to-any.

Model speech-to-speech direncanakan rilis pada kuartal pertama 2025. Model ini akan memungkinkan transformasi suara, termasuk interpretasi nada dan irama, untuk menghasilkan suara yang lebih alami dan menyerupai manusia.
Model any-to-any, yang direncanakan meluncur pertengahan 2025, dirancang untuk memproses dan menghasilkan berbagai jenis data, mulai dari teks, suara, gambar, hingga video. Model ini diharapkan dapat mendukung aplikasi seperti penerjemah, editor konten, hingga asisten AI.

“Model any-to-any akan menjadi fondasi masa depan model AI frontier, memungkinkan pengguna memproses berbagai jenis input dan output secara fleksibel,” tambah Jassy.

Dengan inovasi ini, AWS semakin memperkuat posisinya dalam teknologi AI generatif, memberikan alat canggih bagi pelanggan untuk menciptakan solusi yang lebih efisien dan adaptif.