Artikel Mutiara Aisyah

Terdapat 138 artikel karya Mutiara Aisyah

Ilustrasi Reward System

Belajar Nilai Manusia: Reward Modeling ala DeepMind

Pengetahuan Dasar

|

  • 15 Jun 2025 11.23 WIB

Bayangkan sebuah kecerdasan buatan yang mampu menyelamatkan nyawa, membantu menyelesaikan krisis iklim, atau memandu sistem pendidikan yang adil. Namun, bayangkan pula skenario di mana kecerdasan yang sama, karena salah memahami tujuan kita, justru memperkuat bias, menciptakan kerusakan lingkungan, atau menyalurkan kekuasaan ke tangan yang salah. Perbedaan antara dua skenario ini bukan semata soal kekuatan komputasi, tetapi juga bagaimana kita memastikan AI tersebut selaras dengan nilai dan tujuan manusia. Inilah inti dari topik yang diangkat oleh Leike et al. dalam makalah berjudul Scalable Agent Alignment via Reward Modeling.