Agentic RAG vs Classic RAG: Teknologi AI yang Makin Adaptif
- Rita Puspita Sari
- •
- 10 jam yang lalu
Ilustrasi Artificial Intelligence
Perkembangan teknologi kecerdasan buatan dalam beberapa tahun terakhir telah membawa perubahan besar dalam cara sistem memahami dan menjawab pertanyaan manusia. Salah satu pendekatan yang paling populer adalah Retrieval-Augmented Generation (RAG), sebuah metode yang menggabungkan kemampuan model bahasa besar dengan informasi dari sumber eksternal seperti dokumen, basis data, atau indeks pencarian.
Pada awal kemunculannya, RAG umumnya digunakan dalam bentuk pipeline sederhana. Sistem melakukan pencarian informasi sekali, lalu menggunakan data tersebut untuk menghasilkan jawaban. Pendekatan ini dikenal sebagai Classic RAG.
Namun, perkembangan terbaru menunjukkan pergeseran menuju pendekatan yang lebih dinamis, yaitu Agentic RAG. Dalam metode ini, proses pencarian informasi tidak lagi terjadi sekali saja, tetapi berlangsung dalam sebuah loop kontrol adaptif. Sistem dapat menilai kualitas informasi yang diperoleh, memperbaiki strategi pencarian, bahkan menggunakan berbagai alat tambahan sebelum memberikan jawaban.
Perubahan ini menandai transformasi penting dalam arsitektur sistem AI modern: dari pipeline statis menjadi loop pengambilan keputusan yang adaptif.
Mengapa Perbandingan Ini Penting
Tujuan utama penggunaan RAG adalah meningkatkan akurasi jawaban model AI. Tanpa mekanisme ini, model hanya mengandalkan pengetahuan yang tersimpan dalam parameter pelatihannya, yang sering kali sudah usang atau tidak lengkap.
Dengan RAG, model dapat:
- mengambil informasi terbaru dari sumber eksternal
- menyertakan bukti atau referensi
- mengurangi risiko halusinasi AI
Namun, cara sistem mengambil informasi tersebut sangat menentukan kualitas hasilnya. Pendekatan pipeline tradisional memang sederhana dan efisien. Tetapi ketika pertanyaan menjadi kompleks atau memerlukan analisis multi-sumber, metode ini sering kali tidak cukup kuat.
Karena itulah banyak organisasi mulai beralih ke pendekatan agentic yang lebih fleksibel.
Lembaga riset teknologi global Gartner bahkan memprediksi bahwa sekitar 33% aplikasi perangkat lunak perusahaan akan menggunakan AI agentic pada tahun 2028. Prediksi ini menunjukkan bahwa pendekatan berbasis agen tidak lagi dianggap sebagai eksperimen, melainkan mulai menjadi standar baru dalam pengembangan sistem AI perusahaan.
Classic RAG: Pendekatan Pipeline yang Sederhana
Pendekatan Classic RAG mengikuti alur proses yang linear dan mudah dipahami. Sistem menerima pertanyaan, mencari dokumen yang relevan, lalu menghasilkan jawaban berdasarkan dokumen tersebut.
Secara umum, pipeline Classic RAG terdiri dari empat tahap utama.
- Query
Tahap pertama dimulai ketika pengguna mengajukan pertanyaan kepada sistem. Pertanyaan ini biasanya diproses bersama instruksi tambahan dari sistem, seperti format jawaban yang diinginkan atau aturan penggunaan sumber informasi.Contohnya: “Apa fungsi konfigurasi
MAX_UPLOAD_SIZE?” -
Retrieve
Pada tahap ini, sistem melakukan pencarian dokumen yang paling relevan dengan pertanyaan pengguna. Metode yang umum digunakan antara lain:- pencarian vektor (vector search)
- pencarian berbasis kata kunci
- hybrid search yang menggabungkan keduanya
Sistem biasanya mengambil beberapa potongan dokumen yang dianggap paling relevan.
-
Assemble Context
Setelah dokumen ditemukan, sistem memilih bagian yang paling penting untuk dimasukkan ke dalam prompt konteks. Tahap ini sering menggunakan teknik seperti:- reranking dokumen
- pemotongan dokumen (chunking)
- penyaringan konten yang tidak relevan
Tujuannya adalah memberikan informasi terbaik kepada model sebelum menghasilkan jawaban.
-
Generate
Pada tahap terakhir, model AI menghasilkan jawaban berdasarkan konteks yang diberikan. Idealnya, jawaban tersebut juga menyertakan kutipan atau referensi dari dokumen sumber agar pengguna dapat memverifikasi kebenarannya.
Keunggulan Classic RAG
Classic RAG memiliki beberapa kelebihan utama yang membuatnya sangat populer dalam implementasi awal sistem AI berbasis pengetahuan.
-
Respons Cepat
Karena hanya membutuhkan satu siklus pencarian dan generasi jawaban, waktu respons relatif cepat. -
Biaya Komputasi Stabil
Tidak ada proses iteratif atau loop tambahan, sehingga biaya penggunaan model dapat diprediksi dengan baik. -
Debugging Lebih Mudah
Jika terjadi kesalahan, pengembang biasanya hanya perlu memeriksa dua komponen utama:- apakah dokumen yang diambil relevan
- apakah konteks dalam prompt sudah benar
Hal ini membuat proses pengembangan dan pemeliharaan sistem menjadi lebih sederhana.
Contoh Penggunaan Classic RAG
Bayangkan seorang pengembang perangkat lunak bertanya kepada sistem dokumentasi internal:
“Apa fungsi flag konfigurasi MAX_UPLOAD_SIZE?”
Proses yang terjadi dalam Classic RAG adalah sebagai berikut:
- Sistem mencari dokumentasi konfigurasi.
- Sistem menemukan halaman yang menjelaskan parameter tersebut.
- Model membaca bagian yang relevan.
- Model menghasilkan jawaban.
Contoh jawaban:
“MAX_UPLOAD_SIZE adalah parameter konfigurasi yang menentukan ukuran maksimum file yang dapat diunggah dalam satu permintaan.”
Jawaban ini dapat disertai kutipan dari dokumentasi sebagai referensi. Seluruh proses tersebut terjadi dalam satu langkah pencarian.
Keterbatasan Classic RAG
Meskipun sederhana dan efisien, Classic RAG memiliki keterbatasan mendasar. Pendekatan ini pada dasarnya merupakan sistem “sekali coba” atau one-shot retrieval.
Jika pencarian awal gagal menemukan dokumen yang tepat, sistem tetap mencoba menghasilkan jawaban dari informasi yang tersedia, meskipun bukti yang dimiliki sebenarnya lemah.
Beberapa masalah umum yang sering muncul antara lain:
-
Pertanyaan Multi-Hop
Beberapa pertanyaan membutuhkan informasi dari beberapa sumber berbeda.Contoh: “Mengapa integrasi SSO gagal setelah pembaruan sistem keamanan?”
Jawaban mungkin memerlukan:
- dokumentasi konfigurasi
- log sistem
- catatan perubahan perangkat lunak
Classic RAG sering kesulitan menggabungkan semua sumber ini dalam satu pencarian.
-
Pertanyaan Tidak Spesifik
Pengguna sering menggunakan istilah yang tidak sama dengan yang ada dalam dokumentasi. Akibatnya, sistem pencarian mungkin tidak menemukan dokumen yang tepat. -
Pemotongan Dokumen yang Rapuh
Dalam banyak sistem RAG, dokumen besar dipotong menjadi bagian kecil. Masalahnya:- informasi penting bisa tersebar di beberapa potongan
- konteks penting bisa hilang
Hal ini membuat model kesulitan memahami hubungan antar informasi.
-
Ambiguitas Pertanyaan
Kadang sistem perlu:- meminta klarifikasi dari pengguna
- mencari informasi tambahan
Namun Classic RAG tidak memiliki mekanisme untuk melakukan hal ini secara otomatis.
Risiko Jawaban yang Terlihat Meyakinkan
Salah satu masalah terbesar Classic RAG adalah kegagalan yang tidak terlihat jelas. Sistem tetap memberikan jawaban yang terdengar masuk akal, padahal:
- dokumen yang digunakan kurang relevan
- bukti yang tersedia tidak cukup kuat
Inilah alasan mengapa banyak organisasi mulai mencari pendekatan yang lebih adaptif.
Agentic RAG: Pendekatan Loop yang Adaptif
Agentic RAG masih menggunakan komponen dasar yang sama seperti Classic RAG, yaitu:
- retriever untuk mencari informasi
- generator untuk menghasilkan jawaban
Namun perbedaan utamanya terletak pada struktur kontrol sistem. Alih-alih hanya melakukan satu pencarian, Agentic RAG menggunakan loop pengambilan keputusan. Dalam loop ini, sistem dapat:
- mengambil informasi awal
- menganalisis kualitas informasi tersebut
- menentukan apakah perlu pencarian tambahan
- mengulang proses sampai bukti dianggap cukup
Pendekatan ini mirip dengan metode ReAct prompting, yaitu pola reason-and-act di mana sistem bergantian antara berpikir dan bertindak untuk mengumpulkan bukti yang lebih baik.
Cara Kerja Loop dalam Agentic RAG
Secara sederhana, prosesnya terdiri dari tiga tahap utama yang berulang.
-
Retrieve
Sistem mengambil bukti awal dari berbagai sumber:- dokumen
- hasil pencarian
- API eksternal
- basis data
-
Reason
Model menganalisis informasi yang tersedia. Pada tahap ini sistem menilai:- apakah bukti sudah cukup
- informasi apa yang masih kurang
- apakah perlu mencari sumber lain
-
Decide
Sistem kemudian mengambil keputusan berikutnya, misalnya:- berhenti dan menghasilkan jawaban
- memperbaiki query pencarian
- menggunakan alat tambahan
- meminta klarifikasi pengguna
Loop ini terus berjalan hingga kondisi berhenti terpenuhi.
Kemampuan Tambahan dalam Agentic RAG
Pendekatan agentic memberikan beberapa kemampuan baru yang tidak dimiliki Classic RAG.
-
Perencanaan (Decomposition)
Agen dapat memecah pertanyaan kompleks menjadi beberapa sub-pertanyaan.Contoh pertanyaan: “Mengapa konfigurasi SSO gagal untuk sebagian pengguna?”
Agen dapat membaginya menjadi langkah-langkah seperti:
- memeriksa kode error
- melihat konfigurasi IdP
- memeriksa log autentikasi
- mencari dokumentasi terkait
Pendekatan ini membuat pencarian informasi jauh lebih terarah.
-
Penggunaan Berbagai Alat
Dalam Agentic RAG, pencarian dokumen hanyalah salah satu alat. Agen juga dapat menggunakan:- query database
- API pencarian web
- sistem monitoring
- pemeriksa konfigurasi
- alat verifikasi fakta
Hal ini memungkinkan sistem mendapatkan informasi dari berbagai sumber yang sebelumnya tidak terhubung.
-
Penyempurnaan Bertahap
Salah satu inovasi penting dalam pendekatan ini adalah penyempurnaan iteratif. Jika pencarian pertama tidak memuaskan, agen dapat:- memperbaiki query
- mengambil dokumen tambahan
- memverifikasi sumber informasi
Salah satu pendekatan penelitian yang terkenal dalam konsep ini adalah Self-RAG. Metode tersebut memungkinkan sistem:
- mengevaluasi kualitas dokumen yang ditemukan
- memutuskan apakah perlu mengambil dokumen tambahan
- menghasilkan jawaban berdasarkan bukti yang lebih kuat
Kapan Loop Berhenti?
Agar sistem tidak berjalan tanpa batas, Agentic RAG biasanya memiliki beberapa aturan berhenti (stop conditions).
Contohnya:
- sistem memiliki tingkat keyakinan tinggi dan menemukan kutipan sumber
- jumlah langkah maksimum tercapai
- batas biaya komputasi terpenuhi
- sistem memutuskan untuk melakukan eskalasi
Aturan ini sangat penting karena dalam sistem iteratif, biaya dan waktu respons tidak lagi tetap. Beberapa pertanyaan mungkin selesai dalam satu atau dua iterasi, sementara pertanyaan lain bisa memerlukan banyak percobaan tambahan.
Perubahan Cara Mengukur Kinerja Sistem
Dalam Classic RAG, pengembang biasanya fokus pada rata-rata waktu respons. Namun ketika menggunakan Agentic RAG, metrik tersebut tidak lagi cukup. Sebaliknya, tim pengembang harus memperhatikan metrik yang lebih kritis, seperti:
- latensi p95, yaitu waktu respons pada 95% kasus terburuk
- lonjakan biaya akibat iterasi tambahan
- jumlah pemanggilan alat dalam satu sesi
Dengan kata lain, optimasi sistem tidak lagi hanya berfokus pada rata-rata performa, tetapi juga pada kasus ekstrem yang dapat mempengaruhi pengalaman pengguna.
Situasi di Mana Loop Sangat Membantu
Meskipun lebih kompleks, Agentic RAG memberikan keuntungan besar dalam beberapa kondisi tertentu.
-
Pertanyaan Tidak Spesifik
Pengguna sering mengajukan pertanyaan dengan istilah yang kurang tepat.Contohnya:“Kenapa fitur login perusahaan tidak bekerja?”Istilah yang digunakan pengguna mungkin tidak sama dengan istilah dalam dokumentasi sistem.
Dengan loop, agen dapat:
- mencoba beberapa variasi query
- memperbaiki kata kunci pencarian
- menemukan dokumen yang lebih relevan
-
Informasi Tersebar di Banyak Sumber
Beberapa jawaban memerlukan kombinasi informasi dari berbagai dokumen atau sistem. Contohnya:- dokumentasi produk
- log sistem
- konfigurasi server
- basis data internal
Classic RAG sering kesulitan menggabungkan semua sumber tersebut dalam satu langkah. Agentic RAG dapat melakukan pencarian bertahap hingga menemukan semua potongan informasi yang dibutuhkan.
-
Bukti Awal Tidak Lengkap atau Bertentangan
Kadang sistem menemukan dua dokumen yang memberikan informasi berbeda. Dalam situasi seperti ini, agen dapat:- mencari sumber tambahan
- memverifikasi data
- memilih sumber yang lebih terpercaya
Pendekatan ini membantu meningkatkan keandalan jawaban AI.
Tantangan Sistem Loop dalam Produksi
Meskipun menawarkan banyak manfaat, penggunaan loop juga menambah kompleksitas sistem. Ketika organisasi mengimplementasikan Agentic RAG dalam skala besar, beberapa tantangan baru biasanya muncul.
-
Kompleksitas Arsitektur
Sistem Agentic RAG biasanya memiliki lebih banyak komponen, seperti:- perencana (planner)
- retriever
- berbagai alat tambahan
- mekanisme kontrol loop
- aturan berhenti
Semakin banyak komponen berarti semakin banyak potensi kegagalan.
-
Variasi Hasil yang Lebih Besar
Karena sistem dapat mengambil berbagai jalur pencarian, hasilnya bisa lebih bervariasi. Akibatnya:- proses debugging menjadi lebih sulit
- hasil sulit direproduksi
- pengujian sistem menjadi lebih kompleks
-
Biaya Komputasi yang Tidak Stabil
Loop tambahan berarti lebih banyak:- token pemrosesan
- pemanggilan model
- akses sumber data/li>
Jika tidak dikontrol dengan baik, biaya operasional bisa meningkat drastis.<
Pola Kegagalan yang Sering Terjadi
Ketika sistem berubah dari pipeline sederhana menjadi control loop, beberapa jenis kegagalan baru dapat muncul.
-
Retrieval Thrash
Agen terus melakukan pencarian ulang tanpa menemukan bukti yang lebih baik. Hal ini menyebabkan pemborosan waktu dan biaya komputasi. -
Tool-call Cascade
Satu pemanggilan alat dapat memicu pemanggilan alat lain secara berantai. Akibatnya:- latensi meningkat
- biaya sistem melonjak
-
Context Bloat
Setiap iterasi menambah informasi ke dalam prompt. Jika tidak dikelola dengan baik, prompt bisa menjadi terlalu panjang sehingga model kehilangan fokus pada informasi penting. -
Stop-condition Bug
Loop dapat berhenti terlalu cepat atau justru tidak berhenti sama sekali. Masalah ini sering terjadi ketika aturan berhenti tidak dirancang dengan baik. -
Jawaban Salah tetapi Percaya Diri
Ini adalah salah satu risiko terbesar dalam sistem AI. Sistem mungkin menemukan bukti yang buruk tetapi tetap menghasilkan jawaban dengan tingkat keyakinan tinggi.
Kerangka Pengambilan Keputusan
Cara praktis memilih antara Classic dan Agentic RAG adalah dengan mempertimbangkan dua faktor utama:
- kompleksitas pertanyaan
- toleransi terhadap kesalahan
Jika pertanyaan sederhana dan kesalahan tidak terlalu kritis, Classic RAG biasanya sudah cukup. Namun jika tugas memerlukan analisis yang lebih kompleks, Agentic RAG bisa menjadi solusi yang lebih tepat.
Strategi Implementasi Bertahap
Dalam praktiknya, organisasi tidak perlu langsung membangun sistem agen penuh. Pendekatan yang lebih realistis adalah menggunakan strategi bertahap. Langkah pertama adalah menggunakan Classic RAG sebagai default. Kemudian sistem dapat menjalankan loop tambahan hanya ketika terjadi kegagalan.
Tanda-tanda kegagalan biasanya meliputi:
- tidak ada kutipan sumber
- tingkat relevansi dokumen rendah
- bukti saling bertentangan
- pengguna mengulang pertanyaan karena jawaban tidak memadai
Strategi ini menjaga sebagian besar proses tetap cepat dan murah, tetapi tetap menyediakan jalur pemulihan untuk kasus kompleks.
Kesimpulan
Agentic RAG bukan sekadar peningkatan kecil dari RAG tradisional. Pendekatan ini menambahkan control loop yang memungkinkan sistem AI memperbaiki strategi pencarian informasi secara adaptif. Keuntungan utamanya adalah peningkatan akurasi dalam menjawab pertanyaan yang:
- kompleks
- ambigu
- membutuhkan informasi dari berbagai sumber
Namun manfaat tersebut datang dengan konsekuensi berupa:
- kompleksitas sistem yang lebih tinggi
- latensi yang lebih besar
- biaya komputasi yang lebih sulit diprediksi
Karena itu, organisasi perlu merancang sistem Agentic RAG dengan hati-hati, termasuk menetapkan:
- batas biaya yang jelas
- aturan berhenti yang ketat
- mekanisme observasi sistem yang kuat
Untuk sebagian besar aplikasi seperti pencarian dokumentasi atau bantuan cepat, Classic RAG masih menjadi pilihan yang paling praktis. Sementara itu, Agentic RAG sebaiknya digunakan ketika ada bukti nyata bahwa pencarian satu langkah tidak cukup.
Pendekatan kompromi yang paling efektif adalah memulai dengan Classic RAG dan mengaktifkan loop hanya ketika diperlukan. Strategi ini memberikan keseimbangan antara efisiensi, akurasi, dan skalabilitas dalam membangun sistem AI modern.
