Agentic RAG vs Classic RAG: Teknologi AI yang Makin Adaptif


Ilustrasi Artificial Intelligence

Ilustrasi Artificial Intelligence

Perkembangan teknologi kecerdasan buatan dalam beberapa tahun terakhir telah membawa perubahan besar dalam cara sistem memahami dan menjawab pertanyaan manusia. Salah satu pendekatan yang paling populer adalah Retrieval-Augmented Generation (RAG), sebuah metode yang menggabungkan kemampuan model bahasa besar dengan informasi dari sumber eksternal seperti dokumen, basis data, atau indeks pencarian.

Pada awal kemunculannya, RAG umumnya digunakan dalam bentuk pipeline sederhana. Sistem melakukan pencarian informasi sekali, lalu menggunakan data tersebut untuk menghasilkan jawaban. Pendekatan ini dikenal sebagai Classic RAG.

Namun, perkembangan terbaru menunjukkan pergeseran menuju pendekatan yang lebih dinamis, yaitu Agentic RAG. Dalam metode ini, proses pencarian informasi tidak lagi terjadi sekali saja, tetapi berlangsung dalam sebuah loop kontrol adaptif. Sistem dapat menilai kualitas informasi yang diperoleh, memperbaiki strategi pencarian, bahkan menggunakan berbagai alat tambahan sebelum memberikan jawaban.

Perubahan ini menandai transformasi penting dalam arsitektur sistem AI modern: dari pipeline statis menjadi loop pengambilan keputusan yang adaptif.

 

Mengapa Perbandingan Ini Penting

Tujuan utama penggunaan RAG adalah meningkatkan akurasi jawaban model AI. Tanpa mekanisme ini, model hanya mengandalkan pengetahuan yang tersimpan dalam parameter pelatihannya, yang sering kali sudah usang atau tidak lengkap.

Dengan RAG, model dapat:

  • mengambil informasi terbaru dari sumber eksternal
  • menyertakan bukti atau referensi
  • mengurangi risiko halusinasi AI

Namun, cara sistem mengambil informasi tersebut sangat menentukan kualitas hasilnya. Pendekatan pipeline tradisional memang sederhana dan efisien. Tetapi ketika pertanyaan menjadi kompleks atau memerlukan analisis multi-sumber, metode ini sering kali tidak cukup kuat.

Karena itulah banyak organisasi mulai beralih ke pendekatan agentic yang lebih fleksibel.

Lembaga riset teknologi global Gartner bahkan memprediksi bahwa sekitar 33% aplikasi perangkat lunak perusahaan akan menggunakan AI agentic pada tahun 2028. Prediksi ini menunjukkan bahwa pendekatan berbasis agen tidak lagi dianggap sebagai eksperimen, melainkan mulai menjadi standar baru dalam pengembangan sistem AI perusahaan.

 

Classic RAG: Pendekatan Pipeline yang Sederhana

Pendekatan Classic RAG mengikuti alur proses yang linear dan mudah dipahami. Sistem menerima pertanyaan, mencari dokumen yang relevan, lalu menghasilkan jawaban berdasarkan dokumen tersebut.

Secara umum, pipeline Classic RAG terdiri dari empat tahap utama.

  1. Query
    Tahap pertama dimulai ketika pengguna mengajukan pertanyaan kepada sistem. Pertanyaan ini biasanya diproses bersama instruksi tambahan dari sistem, seperti format jawaban yang diinginkan atau aturan penggunaan sumber informasi.

    Contohnya: “Apa fungsi konfigurasi MAX_UPLOAD_SIZE ?”

  2. Retrieve
    Pada tahap ini, sistem melakukan pencarian dokumen yang paling relevan dengan pertanyaan pengguna. Metode yang umum digunakan antara lain:

    • pencarian vektor (vector search)
    • pencarian berbasis kata kunci
    • hybrid search yang menggabungkan keduanya

    Sistem biasanya mengambil beberapa potongan dokumen yang dianggap paling relevan.

  3. Assemble Context
    Setelah dokumen ditemukan, sistem memilih bagian yang paling penting untuk dimasukkan ke dalam prompt konteks. Tahap ini sering menggunakan teknik seperti:

    • reranking dokumen
    • pemotongan dokumen (chunking)
    • penyaringan konten yang tidak relevan

    Tujuannya adalah memberikan informasi terbaik kepada model sebelum menghasilkan jawaban.

  4. Generate
    Pada tahap terakhir, model AI menghasilkan jawaban berdasarkan konteks yang diberikan. Idealnya, jawaban tersebut juga menyertakan kutipan atau referensi dari dokumen sumber agar pengguna dapat memverifikasi kebenarannya.

 

Keunggulan Classic RAG

Classic RAG memiliki beberapa kelebihan utama yang membuatnya sangat populer dalam implementasi awal sistem AI berbasis pengetahuan.

  1. Respons Cepat
    Karena hanya membutuhkan satu siklus pencarian dan generasi jawaban, waktu respons relatif cepat.

  2. Biaya Komputasi Stabil
    Tidak ada proses iteratif atau loop tambahan, sehingga biaya penggunaan model dapat diprediksi dengan baik.

  3. Debugging Lebih Mudah
    Jika terjadi kesalahan, pengembang biasanya hanya perlu memeriksa dua komponen utama:

    • apakah dokumen yang diambil relevan
    • apakah konteks dalam prompt sudah benar

Hal ini membuat proses pengembangan dan pemeliharaan sistem menjadi lebih sederhana.

 

Contoh Penggunaan Classic RAG

Bayangkan seorang pengembang perangkat lunak bertanya kepada sistem dokumentasi internal:

“Apa fungsi flag konfigurasi MAX_UPLOAD_SIZE?”

Proses yang terjadi dalam Classic RAG adalah sebagai berikut:

  • Sistem mencari dokumentasi konfigurasi.
  • Sistem menemukan halaman yang menjelaskan parameter tersebut.
  • Model membaca bagian yang relevan.
  • Model menghasilkan jawaban.

Contoh jawaban:

MAX_UPLOAD_SIZE adalah parameter konfigurasi yang menentukan ukuran maksimum file yang dapat diunggah dalam satu permintaan.”

Jawaban ini dapat disertai kutipan dari dokumentasi sebagai referensi. Seluruh proses tersebut terjadi dalam satu langkah pencarian.

 

Keterbatasan Classic RAG

Meskipun sederhana dan efisien, Classic RAG memiliki keterbatasan mendasar. Pendekatan ini pada dasarnya merupakan sistem “sekali coba” atau one-shot retrieval.

Jika pencarian awal gagal menemukan dokumen yang tepat, sistem tetap mencoba menghasilkan jawaban dari informasi yang tersedia, meskipun bukti yang dimiliki sebenarnya lemah.

Beberapa masalah umum yang sering muncul antara lain:

  1. Pertanyaan Multi-Hop
    Beberapa pertanyaan membutuhkan informasi dari beberapa sumber berbeda.

    Contoh: “Mengapa integrasi SSO gagal setelah pembaruan sistem keamanan?”

    Jawaban mungkin memerlukan:

    • dokumentasi konfigurasi
    • log sistem
    • catatan perubahan perangkat lunak

    Classic RAG sering kesulitan menggabungkan semua sumber ini dalam satu pencarian.

  2. Pertanyaan Tidak Spesifik
    Pengguna sering menggunakan istilah yang tidak sama dengan yang ada dalam dokumentasi. Akibatnya, sistem pencarian mungkin tidak menemukan dokumen yang tepat.

  3. Pemotongan Dokumen yang Rapuh
    Dalam banyak sistem RAG, dokumen besar dipotong menjadi bagian kecil. Masalahnya:

    • informasi penting bisa tersebar di beberapa potongan
    • konteks penting bisa hilang

    Hal ini membuat model kesulitan memahami hubungan antar informasi.

  4. Ambiguitas Pertanyaan
    Kadang sistem perlu:

    • meminta klarifikasi dari pengguna
    • mencari informasi tambahan

    Namun Classic RAG tidak memiliki mekanisme untuk melakukan hal ini secara otomatis.

 

Risiko Jawaban yang Terlihat Meyakinkan

Salah satu masalah terbesar Classic RAG adalah kegagalan yang tidak terlihat jelas. Sistem tetap memberikan jawaban yang terdengar masuk akal, padahal:

  • dokumen yang digunakan kurang relevan
  • bukti yang tersedia tidak cukup kuat

Inilah alasan mengapa banyak organisasi mulai mencari pendekatan yang lebih adaptif.

 

Agentic RAG: Pendekatan Loop yang Adaptif

Agentic RAG masih menggunakan komponen dasar yang sama seperti Classic RAG, yaitu:

  • retriever untuk mencari informasi
  • generator untuk menghasilkan jawaban

Namun perbedaan utamanya terletak pada struktur kontrol sistem. Alih-alih hanya melakukan satu pencarian, Agentic RAG menggunakan loop pengambilan keputusan. Dalam loop ini, sistem dapat:

  • mengambil informasi awal
  • menganalisis kualitas informasi tersebut
  • menentukan apakah perlu pencarian tambahan
  • mengulang proses sampai bukti dianggap cukup

Pendekatan ini mirip dengan metode ReAct prompting, yaitu pola reason-and-act di mana sistem bergantian antara berpikir dan bertindak untuk mengumpulkan bukti yang lebih baik.

 

Cara Kerja Loop dalam Agentic RAG
Secara sederhana, prosesnya terdiri dari tiga tahap utama yang berulang.

  1. Retrieve
    Sistem mengambil bukti awal dari berbagai sumber:

    • dokumen
    • hasil pencarian
    • API eksternal
    • basis data
  2. Reason
    Model menganalisis informasi yang tersedia. Pada tahap ini sistem menilai:

    • apakah bukti sudah cukup
    • informasi apa yang masih kurang
    • apakah perlu mencari sumber lain
  3. Decide
    Sistem kemudian mengambil keputusan berikutnya, misalnya:

    • berhenti dan menghasilkan jawaban
    • memperbaiki query pencarian
    • menggunakan alat tambahan
    • meminta klarifikasi pengguna

    Loop ini terus berjalan hingga kondisi berhenti terpenuhi. 

 

Kemampuan Tambahan dalam Agentic RAG
Pendekatan agentic memberikan beberapa kemampuan baru yang tidak dimiliki Classic RAG.

  1. Perencanaan (Decomposition)
    Agen dapat memecah pertanyaan kompleks menjadi beberapa sub-pertanyaan.

    Contoh pertanyaan: “Mengapa konfigurasi SSO gagal untuk sebagian pengguna?”

    Agen dapat membaginya menjadi langkah-langkah seperti:

    • memeriksa kode error
    • melihat konfigurasi IdP
    • memeriksa log autentikasi
    • mencari dokumentasi terkait

    Pendekatan ini membuat pencarian informasi jauh lebih terarah.

  2. Penggunaan Berbagai Alat
    Dalam Agentic RAG, pencarian dokumen hanyalah salah satu alat. Agen juga dapat menggunakan:

    • query database
    • API pencarian web
    • sistem monitoring
    • pemeriksa konfigurasi
    • alat verifikasi fakta

    Hal ini memungkinkan sistem mendapatkan informasi dari berbagai sumber yang sebelumnya tidak terhubung.

  3. Penyempurnaan Bertahap
    Salah satu inovasi penting dalam pendekatan ini adalah penyempurnaan iteratif. Jika pencarian pertama tidak memuaskan, agen dapat:

    • memperbaiki query
    • mengambil dokumen tambahan
    • memverifikasi sumber informasi

    Salah satu pendekatan penelitian yang terkenal dalam konsep ini adalah Self-RAG. Metode tersebut memungkinkan sistem:

    • mengevaluasi kualitas dokumen yang ditemukan
    • memutuskan apakah perlu mengambil dokumen tambahan
    • menghasilkan jawaban berdasarkan bukti yang lebih kuat
       

Kapan Loop Berhenti?

Agar sistem tidak berjalan tanpa batas, Agentic RAG biasanya memiliki beberapa aturan berhenti (stop conditions).

Contohnya:

  • sistem memiliki tingkat keyakinan tinggi dan menemukan kutipan sumber
  • jumlah langkah maksimum tercapai
  • batas biaya komputasi terpenuhi
  • sistem memutuskan untuk melakukan eskalasi

Aturan ini sangat penting karena dalam sistem iteratif, biaya dan waktu respons tidak lagi tetap. Beberapa pertanyaan mungkin selesai dalam satu atau dua iterasi, sementara pertanyaan lain bisa memerlukan banyak percobaan tambahan.

 

Perubahan Cara Mengukur Kinerja Sistem
Dalam Classic RAG, pengembang biasanya fokus pada rata-rata waktu respons. Namun ketika menggunakan Agentic RAG, metrik tersebut tidak lagi cukup. Sebaliknya, tim pengembang harus memperhatikan metrik yang lebih kritis, seperti:

  • latensi p95, yaitu waktu respons pada 95% kasus terburuk
  • lonjakan biaya akibat iterasi tambahan
  • jumlah pemanggilan alat dalam satu sesi

Dengan kata lain, optimasi sistem tidak lagi hanya berfokus pada rata-rata performa, tetapi juga pada kasus ekstrem yang dapat mempengaruhi pengalaman pengguna.

 

Situasi di Mana Loop Sangat Membantu
Meskipun lebih kompleks, Agentic RAG memberikan keuntungan besar dalam beberapa kondisi tertentu.

  1. Pertanyaan Tidak Spesifik
    Pengguna sering mengajukan pertanyaan dengan istilah yang kurang tepat.

    Contohnya:“Kenapa fitur login perusahaan tidak bekerja?”Istilah yang digunakan pengguna mungkin tidak sama dengan istilah dalam dokumentasi sistem.

    Dengan loop, agen dapat:

    • mencoba beberapa variasi query
    • memperbaiki kata kunci pencarian
    • menemukan dokumen yang lebih relevan
  2. Informasi Tersebar di Banyak Sumber
    Beberapa jawaban memerlukan kombinasi informasi dari berbagai dokumen atau sistem. Contohnya:

    • dokumentasi produk
    • log sistem
    • konfigurasi server
    • basis data internal

    Classic RAG sering kesulitan menggabungkan semua sumber tersebut dalam satu langkah. Agentic RAG dapat melakukan pencarian bertahap hingga menemukan semua potongan informasi yang dibutuhkan.

  3. Bukti Awal Tidak Lengkap atau Bertentangan
    Kadang sistem menemukan dua dokumen yang memberikan informasi berbeda. Dalam situasi seperti ini, agen dapat:

    • mencari sumber tambahan
    • memverifikasi data
    • memilih sumber yang lebih terpercaya

Pendekatan ini membantu meningkatkan keandalan jawaban AI.

 

Tantangan Sistem Loop dalam Produksi
Meskipun menawarkan banyak manfaat, penggunaan loop juga menambah kompleksitas sistem. Ketika organisasi mengimplementasikan Agentic RAG dalam skala besar, beberapa tantangan baru biasanya muncul.

  1. Kompleksitas Arsitektur
    Sistem Agentic RAG biasanya memiliki lebih banyak komponen, seperti:

    • perencana (planner)
    • retriever
    • berbagai alat tambahan
    • mekanisme kontrol loop
    • aturan berhenti

    Semakin banyak komponen berarti semakin banyak potensi kegagalan.

  2. Variasi Hasil yang Lebih Besar
    Karena sistem dapat mengambil berbagai jalur pencarian, hasilnya bisa lebih bervariasi. Akibatnya:

    • proses debugging menjadi lebih sulit
    • hasil sulit direproduksi
    • pengujian sistem menjadi lebih kompleks
  3. Biaya Komputasi yang Tidak Stabil
    Loop tambahan berarti lebih banyak:

    • token pemrosesan
    • pemanggilan model
    • akses sumber data/li>

    Jika tidak dikontrol dengan baik, biaya operasional bisa meningkat drastis.<

 

Pola Kegagalan yang Sering Terjadi
Ketika sistem berubah dari pipeline sederhana menjadi control loop, beberapa jenis kegagalan baru dapat muncul.

  1. Retrieval Thrash
    Agen terus melakukan pencarian ulang tanpa menemukan bukti yang lebih baik. Hal ini menyebabkan pemborosan waktu dan biaya komputasi.

  2. Tool-call Cascade
    Satu pemanggilan alat dapat memicu pemanggilan alat lain secara berantai. Akibatnya:

    • latensi meningkat
    • biaya sistem melonjak
  3. Context Bloat
    Setiap iterasi menambah informasi ke dalam prompt. Jika tidak dikelola dengan baik, prompt bisa menjadi terlalu panjang sehingga model kehilangan fokus pada informasi penting.

  4. Stop-condition Bug
    Loop dapat berhenti terlalu cepat atau justru tidak berhenti sama sekali. Masalah ini sering terjadi ketika aturan berhenti tidak dirancang dengan baik.

  5. Jawaban Salah tetapi Percaya Diri
    Ini adalah salah satu risiko terbesar dalam sistem AI. Sistem mungkin menemukan bukti yang buruk tetapi tetap menghasilkan jawaban dengan tingkat keyakinan tinggi.

 

Kerangka Pengambilan Keputusan

Cara praktis memilih antara Classic dan Agentic RAG adalah dengan mempertimbangkan dua faktor utama:

  • kompleksitas pertanyaan
  • toleransi terhadap kesalahan

Jika pertanyaan sederhana dan kesalahan tidak terlalu kritis, Classic RAG biasanya sudah cukup. Namun jika tugas memerlukan analisis yang lebih kompleks, Agentic RAG bisa menjadi solusi yang lebih tepat.

 

Strategi Implementasi Bertahap

Dalam praktiknya, organisasi tidak perlu langsung membangun sistem agen penuh. Pendekatan yang lebih realistis adalah menggunakan strategi bertahap. Langkah pertama adalah menggunakan Classic RAG sebagai default. Kemudian sistem dapat menjalankan loop tambahan hanya ketika terjadi kegagalan.

Tanda-tanda kegagalan biasanya meliputi:

  • tidak ada kutipan sumber
  • tingkat relevansi dokumen rendah
  • bukti saling bertentangan
  • pengguna mengulang pertanyaan karena jawaban tidak memadai

Strategi ini menjaga sebagian besar proses tetap cepat dan murah, tetapi tetap menyediakan jalur pemulihan untuk kasus kompleks.

 

Kesimpulan

Agentic RAG bukan sekadar peningkatan kecil dari RAG tradisional. Pendekatan ini menambahkan control loop yang memungkinkan sistem AI memperbaiki strategi pencarian informasi secara adaptif. Keuntungan utamanya adalah peningkatan akurasi dalam menjawab pertanyaan yang:

  • kompleks
  • ambigu
  • membutuhkan informasi dari berbagai sumber

Namun manfaat tersebut datang dengan konsekuensi berupa:

  • kompleksitas sistem yang lebih tinggi
  • latensi yang lebih besar
  • biaya komputasi yang lebih sulit diprediksi

Karena itu, organisasi perlu merancang sistem Agentic RAG dengan hati-hati, termasuk menetapkan:

  • batas biaya yang jelas
  • aturan berhenti yang ketat
  • mekanisme observasi sistem yang kuat

Untuk sebagian besar aplikasi seperti pencarian dokumentasi atau bantuan cepat, Classic RAG masih menjadi pilihan yang paling praktis. Sementara itu, Agentic RAG sebaiknya digunakan ketika ada bukti nyata bahwa pencarian satu langkah tidak cukup.

Pendekatan kompromi yang paling efektif adalah memulai dengan Classic RAG dan mengaktifkan loop hanya ketika diperlukan. Strategi ini memberikan keseimbangan antara efisiensi, akurasi, dan skalabilitas dalam membangun sistem AI modern.

Bagikan artikel ini

Komentar ()

Video Terkait