Microsoft Hadirkan MAI AI, Saingi Model AI Global


Ilustrasi Artificial Intelligence 13

Ilustrasi Artificial Intelligence

Microsoft kembali memperkuat posisinya di industri kecerdasan buatan dengan meluncurkan tiga model MAI (Microsoft AI) terbaru yang diklaim sebagai kelas dunia. Ketiga model tersebut adalah MAI-Transcribe-1, MAI-Voice-1, dan MAI-Image-2. Seluruh model ini kini telah tersedia melalui Microsoft Foundry serta dapat diuji di MAI Playground.

Peluncuran ini menjadi langkah strategis Microsoft dalam menghadirkan teknologi AI yang tidak hanya canggih, tetapi juga praktis, cepat, dan ekonomis bagi pengembang maupun perusahaan. Dengan fokus pada performa tinggi dan efisiensi biaya, Microsoft menargetkan adopsi AI yang lebih luas di berbagai sektor industri.

 

MAI-Transcribe-1: Transkripsi Cepat dan Akurat di Dunia Nyata

Salah satu model unggulan yang diperkenalkan adalah MAI-Transcribe-1, sebuah sistem transkripsi suara ke teks berbasis AI dengan kemampuan mutakhir. Model ini mendukung hingga 25 bahasa yang paling banyak digunakan di dunia, berdasarkan standar industri FLEURS benchmark.

Keunggulan utama MAI-Transcribe-1 terletak pada kemampuannya bekerja secara optimal dalam kondisi nyata yang kompleks, seperti kebisingan latar, aksen yang beragam, hingga kualitas audio yang tidak sempurna. Hal ini menjadikannya sangat relevan untuk penggunaan di dunia profesional, seperti layanan pelanggan, media, pendidikan, hingga analisis data suara.

Dari sisi performa, model ini mencatat kecepatan transkripsi batch hingga 2,5 kali lebih cepat dibandingkan layanan sebelumnya di Microsoft Azure. Tidak hanya cepat, MAI-Transcribe-1 juga dirancang sangat efisien, sehingga mampu menghadirkan kombinasi ideal antara kecepatan, akurasi, dan biaya.

Dengan harga mulai dari 0,36 dolar AS per jam, model ini disebut sebagai salah satu solusi transkripsi paling kompetitif di pasar cloud saat ini.

 

MAI-Image-2: Generasi Gambar Lebih Cepat dan Realistis

Selain transkripsi, Microsoft juga menghadirkan peningkatan signifikan dalam teknologi generasi gambar melalui MAI-Image-2. Model ini sebelumnya telah masuk dalam tiga besar model terbaik di papan peringkat Arena.ai, menunjukkan kualitasnya yang diakui secara luas.

MAI-Image-2 menawarkan kecepatan pembuatan gambar hingga dua kali lebih cepat dibandingkan generasi sebelumnya, baik di Microsoft Foundry maupun di Microsoft Copilot. Peningkatan ini didasarkan pada data penggunaan nyata, sehingga mencerminkan performa di lingkungan produksi, bukan sekadar uji coba.

Model ini dirancang khusus untuk memenuhi kebutuhan kreator profesional, seperti fotografer, desainer grafis, dan pembuat konten visual. Beberapa keunggulan utamanya meliputi pencahayaan alami, warna kulit yang akurat, tekstur realistis, serta kemampuan menghasilkan teks dalam gambar yang jelas dan presisi—fitur yang sangat penting untuk desain grafis, diagram, dan materi presentasi.

Menariknya, peningkatan kualitas dan kecepatan ini tidak diikuti oleh lonjakan biaya. MAI-Image-2 tetap ditawarkan dengan skema harga yang kompetitif, yakni mulai dari 5 dolar AS per 1 juta token untuk input teks dan 33 dolar AS per 1 juta token untuk output gambar.

Microsoft juga mulai mengintegrasikan MAI-Image-2 secara bertahap ke berbagai produknya, termasuk Bing dan Microsoft PowerPoint, yang menunjukkan komitmen perusahaan dalam menghadirkan AI langsung ke alat produktivitas sehari-hari.

Adopsi MAI-Image-2 tidak hanya terbatas pada pengujian internal. Sejumlah perusahaan besar telah mulai menggunakannya dalam skala nyata. Salah satunya adalah WPP, salah satu grup pemasaran dan komunikasi terbesar di dunia.

Menurut Rob Reilly, MAI-Image-2 merupakan terobosan besar dalam dunia kreatif digital. Ia menyebut bahwa teknologi ini mampu memahami detail arahan kreatif dengan sangat baik, sekaligus menghargai kompleksitas proses pembuatan konten visual yang berkualitas tinggi.

Pernyataan tersebut memperkuat posisi MAI-Image-2 sebagai alat yang tidak hanya cepat, tetapi juga mampu mendukung kreativitas manusia secara mendalam.

 

MAI-Voice-1 dan Strategi Harga Kompetitif

Selain dua model utama tersebut, Microsoft juga menghadirkan MAI-Voice-1 yang berfokus pada pemrosesan suara. Model ini ditawarkan dengan harga mulai dari 22 dolar AS per 1 juta karakter, menjadikannya opsi menarik bagi pengembang aplikasi berbasis suara.

Secara keseluruhan, Microsoft menekankan bahwa ketiga model MAI ini dirancang untuk menjadi lebih baik, lebih cepat, dan lebih terjangkau dibandingkan solusi pesaing. Strategi ini menunjukkan upaya perusahaan untuk memperluas akses terhadap teknologi AI, tidak hanya bagi perusahaan besar tetapi juga pengembang individu.

 

Akses Luas untuk Pengembang

Mulai saat ini, pengembang di seluruh dunia dapat langsung menggunakan model-model MAI melalui Microsoft Foundry. Platform ini dirancang sebagai pusat pengembangan AI yang menyediakan berbagai alat dan infrastruktur untuk membangun, menguji, dan mengimplementasikan solusi berbasis AI.

Selain itu, Microsoft juga menyediakan MAI Playground sebagai sarana eksplorasi awal, meskipun saat ini masih terbatas untuk wilayah Amerika Serikat. Bagi pihak yang belum memiliki akses ke Foundry, Microsoft membuka kesempatan melalui pendaftaran formulir untuk mendapatkan akses lebih lanjut.

 

Humanist AI dan Komitmen Keamanan

Di balik pengembangan model-model ini, Microsoft mengusung konsep “Humanist AI”, yaitu pendekatan yang menempatkan manusia sebagai pusat dari teknologi. Artinya, model AI tidak hanya dirancang untuk canggih secara teknis, tetapi juga relevan dengan cara manusia berkomunikasi dan bekerja dalam kehidupan nyata.

Microsoft juga menegaskan komitmennya terhadap pengembangan AI yang aman dan bertanggung jawab. Seluruh model MAI telah melalui proses pengujian ketat, termasuk metode red-teaming untuk mengidentifikasi potensi risiko.

Melalui Microsoft Foundry, pengembang juga mendapatkan berbagai fitur keamanan bawaan, seperti guardrails, sistem tata kelola, serta kontrol tingkat perusahaan. Fitur-fitur ini dirancang untuk memastikan bahwa implementasi AI dapat dilakukan secara aman, sesuai regulasi, dan dapat diskalakan sesuai kebutuhan bisnis.

 

Masa Depan AI yang Lebih Terbuka

Peluncuran MAI-Transcribe-1, MAI-Voice-1, dan MAI-Image-2 menjadi sinyal kuat bahwa persaingan di industri AI semakin intens. Dengan kombinasi performa tinggi, harga kompetitif, dan fokus pada kebutuhan manusia, Microsoft tampaknya ingin mendorong adopsi AI ke tingkat yang lebih luas.

Ke depan, perusahaan ini juga menjanjikan akan menghadirkan lebih banyak model AI baru, baik melalui Foundry maupun integrasi langsung ke dalam berbagai produk digital mereka. Dengan langkah ini, Microsoft tidak hanya membangun teknologi, tetapi juga membentuk masa depan interaksi antara manusia dan kecerdasan buatan.

Bagikan artikel ini

Komentar ()

Video Terkait