NVIDIA Perkenalkan Rubin, Platform AI Baru yang Lebih Hemat Biaya
- Rita Puspita Sari
- •
- 23 jam yang lalu
Ilustrasi Chip AI
NVIDIA kembali menegaskan posisinya sebagai penggerak utama inovasi Artificial Intelligence (AI) global. Pada ajang Consumer Electronics Show (CES), perusahaan teknologi asal Amerika Serikat ini resmi meluncurkan platform NVIDIA Rubin, sebuah fondasi komputasi AI generasi terbaru yang digadang-gadang mampu mengubah cara dunia melatih, menjalankan dan menskalakan kecerdasan buatan.
Berbeda dari peluncuran GPU tunggal seperti generasi sebelumnya, NVIDIA Rubin hadir sebagai platform superkomputer AI terpadu yang dibangun dari enam chip baru. Keenam chip tersebut dirancang secara terintegrasi melalui pendekatan codesign ekstrem antara perangkat keras dan perangkat lunak. Hasilnya bukan hanya peningkatan performa, tetapi juga efisiensi biaya dan energi yang jauh lebih tinggi dibanding generasi sebelumnya, NVIDIA Blackwell.
Dengan Rubin, NVIDIA tidak sekadar memperkenalkan produk baru, melainkan menawarkan arsitektur lengkap untuk membangun “pabrik AI” (AI factory) berskala raksasa, mulai dari pusat data hyperscale hingga layanan cloud dan laboratorium riset AI.
Codesign Ekstrem: Kunci Lompatan Besar NVIDIA Rubin
Salah satu konsep utama yang diusung NVIDIA Rubin adalah codesign ekstrem, yaitu perancangan menyeluruh yang mengintegrasikan CPU, GPU, jaringan, penyimpanan, dan perangkat lunak sejak tahap awal pengembangan. Pendekatan ini memungkinkan seluruh komponen bekerja sebagai satu kesatuan, bukan sekadar bagian terpisah.
Enam chip utama yang menjadi fondasi platform Rubin meliputi:
- CPU NVIDIA Vera
- GPU NVIDIA Rubin
- NVIDIA NVLink 6 Switch
- NVIDIA ConnectX-9 SuperNIC
- NVIDIA BlueField-4 DPU
- NVIDIA Spectrum-6 Ethernet Switch
Melalui integrasi ini, NVIDIA mengklaim Rubin mampu memangkas biaya token inferensi hingga 10 kali lipat dan mengurangi kebutuhan GPU untuk melatih model mixture-of-experts (MoE) hingga 4 kali lebih sedikit dibanding platform Blackwell. Artinya, perusahaan dan pengembang AI bisa membangun model yang lebih besar dan cerdas dengan biaya yang jauh lebih efisien.
Jawaban atas Ledakan Kebutuhan Komputasi AI
Peluncuran Rubin datang di tengah lonjakan permintaan komputasi AI yang belum pernah terjadi sebelumnya. Model AI modern, terutama agentic AI, model penalaran tingkat lanjut, dan AI multimodal, membutuhkan pemrosesan token dalam jumlah masif serta kemampuan berpikir multi-langkah.
Jensen Huang, pendiri dan CEO NVIDIA, menegaskan bahwa Rubin hadir pada momen yang sangat krusial.
“Rubin hadir tepat ketika kebutuhan komputasi AI untuk pelatihan dan inferensi melonjak tajam. Dengan ritme tahunan NVIDIA dalam menghadirkan generasi baru superkomputer AI dan codesign ekstrem enam chip baru, Rubin menjadi lompatan besar menuju batas berikutnya dari AI,” ujar Huang.
Menurut NVIDIA, permintaan AI ke depan tidak lagi hanya soal kecepatan GPU, tetapi juga efisiensi energi, keamanan data, keandalan sistem, dan kemampuan menskalakan hingga ratusan ribu chip dalam satu ekosistem.
Terinspirasi Ilmuwan Legendaris: Makna di Balik Nama Rubin
Nama Rubin diambil dari Vera Florence Cooper Rubin, seorang astronom Amerika yang penelitiannya tentang rotasi galaksi menjadi bukti kuat keberadaan materi gelap. Penemuan Rubin mengubah cara manusia memahami struktur alam semesta.
Dengan menamai platform terbarunya Rubin, NVIDIA ingin menegaskan ambisinya untuk menghadirkan teknologi yang mengubah pemahaman dan batas kemampuan AI, sebagaimana Vera Rubin mengubah pemahaman manusia tentang kosmos.
Platform ini diwujudkan dalam dua sistem utama:
- NVIDIA Vera Rubin NVL72, solusi rack-scale berskala besar
- NVIDIA HGX Rubin NVL8, sistem server yang lebih fleksibel untuk berbagai beban kerja
Lima Inovasi Utama NVIDIA Rubin
NVIDIA Rubin membawa lima inovasi besar yang menjadi fondasi peningkatan performa dan efisiensi:
-
NVLink Generasi Keenam
NVLink 6 menghadirkan komunikasi GPU-ke-GPU supercepat yang sangat penting untuk model MoE berskala raksasa. Setiap GPU Rubin memiliki bandwidth hingga 3,6 TB per detik, sementara satu rak NVL72 mampu mencapai 260 TB per detik, bahkan disebut melampaui total bandwidth internet global saat ini. -
CPU NVIDIA Vera
CPU Vera dirancang khusus untuk kebutuhan agentic reasoning dan pabrik AI skala besar. Dengan 88 core kustom NVIDIA Olympus, kompatibilitas Armv9.2, serta konektivitas NVLink-C2C berkecepatan tinggi, CPU ini menawarkan efisiensi daya terdepan di industri. -
GPU NVIDIA Rubin
GPU Rubin dibekali Transformer Engine generasi ketiga dengan kompresi adaptif berbasis perangkat keras. GPU ini mampu mencapai 50 petaflops NVFP4, menjadikannya sangat optimal untuk inferensi AI berbiaya rendah dan berkecepatan tinggi. -
Confidential Computing Generasi Ketiga
Rubin menjadi platform rack-scale pertama yang menghadirkan Confidential Computing terpadu di seluruh domain CPU, GPU, dan NVLink. Teknologi ini melindungi model AI, data pelatihan, dan proses inferensi dari akses tidak sah. -
RAS Engine Generasi Kedua
RAS (Reliability, Availability, Serviceability) Engine memastikan sistem tetap andal melalui pemantauan kesehatan real-time, toleransi kesalahan, serta perawatan proaktif. Desain modular Rubin bahkan memungkinkan perakitan dan servis hingga 18 kali lebih cepat dibanding generasi sebelumnya.
Penyimpanan AI-Native untuk Era Agentic AI
Selain komputasi dan jaringan, NVIDIA Rubin juga memperkenalkan Inference Context Memory Storage Platform, sebuah kelas baru penyimpanan AI-native. Platform ini dirancang untuk menangani lonjakan kebutuhan konteks inferensi pada AI modern yang bersifat multi-turn dan agentic.
Didukung oleh NVIDIA BlueField-4 DPU, sistem ini memungkinkan:
- Berbagi dan penggunaan ulang key-value cache secara efisien
- Peningkatan responsivitas AI
- Skalabilitas yang lebih hemat daya
Teknologi ini menjadi sangat penting ketika AI digunakan oleh jutaan pengguna secara simultan dengan konteks percakapan yang panjang dan kompleks.
Jaringan Ethernet Generasi Baru untuk Pabrik AI
Dalam pabrik AI berskala besar, jaringan menjadi komponen krusial. NVIDIA menjawab tantangan ini melalui Spectrum-6 Ethernet dan Spectrum-X Ethernet Photonics.
Teknologi ini menawarkan:
- Keandalan hingga 10 kali lebih tinggi
- Efisiensi daya 5 kali lebih baik
- Kemampuan menghubungkan fasilitas AI yang terpisah ratusan kilometer seolah berada dalam satu sistem terpadu
Dengan dukungan komunikasi 200G SerDes dan co-packaged optics, Spectrum-6 menjadi fondasi jaringan AI generasi berikutnya.
Dukungan Ekosistem Global yang Masif
Peluncuran Rubin mendapat dukungan luas dari ekosistem global. Sejumlah raksasa teknologi dan laboratorium AI menyatakan siap mengadopsi platform ini, termasuk AWS, Google, Microsoft, Meta, OpenAI, Anthropic, Oracle, Dell, HPE, Lenovo, hingga xAI.
Sam Altman (OpenAI) menilai Rubin penting untuk menjaga laju peningkatan kecerdasan AI. Mark Zuckerberg (Meta) menyebutnya sebagai lompatan besar performa dan efisiensi, sementara Elon Musk menyebut Rubin sebagai “mesin roket bagi AI”.
Microsoft, CoreWeave, dan Masa Depan Superfaktori AI
Microsoft menjadi salah satu mitra strategis utama NVIDIA Rubin. Raksasa teknologi ini akan menggunakan NVIDIA Vera Rubin NVL72 dalam pusat data AI generasi berikutnya, termasuk proyek Fairwater AI Superfactory, yang dirancang untuk diskalakan hingga ratusan ribu Superchip.
Sementara itu, CoreWeave akan menjadi salah satu penyedia cloud pertama yang menghadirkan Rubin melalui platform CoreWeave Mission Control, memungkinkan pelanggan mengintegrasikan Rubin secara fleksibel ke dalam lingkungan AI mereka.
Kesiapan Produksi dan Jadwal Ketersediaan
NVIDIA mengonfirmasi bahwa Rubin telah memasuki produksi penuh, dengan produk berbasis Rubin tersedia mulai paruh kedua 2026. Penyedia cloud seperti AWS, Google Cloud, Microsoft Azure, dan OCI akan menjadi yang pertama menghadirkan instans Rubin.
Lebih dari 80 mitra ekosistem NVIDIA MGX juga siap menghadirkan server, sistem, dan solusi berbasis Rubin.
Fondasi AI Masa Depan
Sebagai penutup, NVIDIA bersama Red Hat menghadirkan tumpukan AI lengkap yang dioptimalkan untuk Rubin, mencakup Red Hat Enterprise Linux, Red Hat OpenShift, dan Red Hat AI. Kolaborasi ini menargetkan perusahaan-perusahaan besar global, termasuk mayoritas Fortune Global 500.
Dengan NVIDIA Rubin, era AI memasuki fase baru—bukan sekadar lebih cepat, tetapi lebih cerdas, efisien, aman, dan siap diskalakan. Platform ini menjadi bukti bahwa masa depan AI akan dibangun di atas superkomputer terintegrasi yang dirancang sejak awal untuk kecerdasan buatan.
