Anthropic Luncurkan Model AI Baru untuk Dekstop
- Pabila Syaftahan
- •
- 24 Okt 2024 16.37 WIB
Anthropic, sebuah perusahaan AI yang sedang berkembang, baru saja meluncurkan model AI terbarunya, Claude 3.5 Sonnet, yang dapat mengendalikan aplikasi desktop. Dalam presentasi kepada investor musim lalu, perusahaan ini menyampaikan ambisinya untuk mengembangkan asisten virtual yang mampu melakukan riset, menjawab email, dan menangani berbagai tugas back-office secara mandiri. Mereka menyebut inovasi ini sebagai “algoritma generasi berikutnya untuk pembelajaran mandiri AI,” yang diharapkan dapat mengotomatisasi banyak fungsi dalam ekonomi di masa depan.
Setelah beberapa waktu pengembangan, teknologi ini mulai terwujud. Versi terbaru Claude 3.5 Sonnet diluncurkan dengan kemampuan untuk memahami dan berinteraksi dengan berbagai aplikasi desktop. Melalui API baru bernama “Penggunaan Komputer,” yang saat ini tersedia dalam versi beta terbuka, model ini dapat meniru penekanan tombol, klik, dan gerakan mouse, seolah-olah ada pengguna yang bekerja di depan komputer.
Dalam sebuah postingan blog yang dibagikan kepada TechCrunch, Anthropic menjelaskan, “Kami melatih Claude untuk melihat apa yang terjadi di layar dan kemudian menggunakan alat perangkat lunak yang tersedia untuk menyelesaikan tugas.” Claude dapat menangkap gambar layar dari apa yang terlihat pengguna dan menghitung gerakan kursor yang diperlukan untuk melakukan tindakan, seperti mengklik di lokasi yang tepat.
Pengembang kini dapat mencoba kemampuan Penggunaan Komputer melalui API Anthropic, Amazon Bedrock, dan platform Vertex AI dari Google Cloud. Selain itu, Sonnet 3.5 dilengkapi dengan berbagai peningkatan performa dibandingkan model sebelumnya.
Meskipun alat untuk mengotomatisasi tugas di komputer bukanlah ide baru, Anthropic berusaha untuk menonjol di antara banyak perusahaan lain. Banyak perusahaan, mulai dari vendor RPA yang sudah ada sejak lama hingga pendatang baru seperti Relay, Induced AI, dan Automat, telah menawarkan solusi serupa. Dalam upaya mengembangkan “agen AI,” kompetisi di bidang ini semakin ketat. Meskipun istilah “agen AI” belum terdefinisi secara jelas, istilah ini umumnya merujuk pada AI yang dapat mengotomatisasi fungsi perangkat lunak.
Beberapa analis berpendapat bahwa agen AI dapat memberikan perusahaan cara yang lebih mudah untuk memonetisasi investasi besar dalam teknologi AI. Hasil survei terbaru dari Capgemini menunjukkan bahwa sekitar 10% organisasi sudah memanfaatkan agen AI, dan 82% berencana untuk mengintegrasikannya dalam tiga tahun ke depan.
Anthropic menyebut pendekatannya terhadap agen AI sebagai “lapisan eksekusi tindakan,” yang memungkinkan Sonnet 3.5 untuk menjalankan perintah tingkat desktop. Dengan kemampuan menjelajahi web, Sonnet 3.5 dapat memanfaatkan informasi dari berbagai situs dan aplikasi.
Namun, meskipun teknologi ini menjanjikan, ada beberapa tantangan yang dihadapi. Dalam evaluasi untuk menguji kemampuan agen AI dalam membantu pemesanan tiket pesawat, Sonnet 3.5 hanya berhasil menyelesaikan kurang dari setengah tugas yang diberikan. Di tes lain, seperti mengatur pengembalian produk, model ini gagal sekitar sepertiga dari waktu yang diharapkan.
Anthropic mengakui bahwa Claude 3.5 masih kesulitan dengan tindakan dasar seperti menggulir dan memperbesar. Model ini juga dapat melewatkan tindakan dan notifikasi "sekejap" karena cara pengambilan tangkapan layarnya. “Penggunaan Komputer Claude saat ini masih lambat dan rentan terhadap kesalahan,” kata Anthropic, mendorong pengembang untuk mulai bereksperimen dengan tugas-tugas yang berisiko rendah.
Dengan peluncuran model Claude 3.5 Sonnet, Anthropic menunjukkan komitmennya dalam mengembangkan teknologi AI yang mampu mengotomatiskan tugas-tugas di komputer. Kemampuan model ini untuk memahami dan berinteraksi dengan aplikasi desktop, serta meniru tindakan pengguna, menandakan kemajuan signifikan dalam inovasi AI. Meskipun banyak perusahaan lain juga mengembangkan agen AI, Claude 3.5 menawarkan pendekatan yang berbeda dengan fitur seperti kemampuan menjelajahi web dan menjalankan perintah tingkat desktop, yang bisa meningkatkan efisiensi dalam berbagai pekerjaan.