← Tüm yazılar

6 dk okuma

Bilgi Destekli Üretim (RAG) Nedir?

RAG hakkinda net ve dogru bir aciklama: bir dil modelini harici bir bilgi kaynagina baglamak, modelin cevap vermeden once ilgili belgeleri aramasini nasil saglar, bu neden cevaplari gercek belgelere dayandirir, nerede ise yarar ve nerede hala yetersiz kalir.

Kisaca ozeti

Bilgi destekli uretim, genellikle RAG olarak kisaltilir, bir buyuk dil modeline dis bir belge kutuphanesine erisim verme yontemidir. Model sadece egitim sirasinda ezberlediklerinden cevap vermek yerine, once bir seyi arar, sonra buldugu bilgiyi kullanarak cevabini yazar.

Bunu acik kitapli ve kapali kitapli bir sinav gibi dusunun. Sade bir dil modeli kapali kitapli sinava girer: hafizasindan cevap verir, ki bu etkileyici olabilir ama ayni zamanda muglak veya guncelligini yitirmis olabilir. RAG ayni modele bir kitap ve arama araci verir. Tek kelime yazmadan once ilgili sayfalari ceker ve cevap verirken onlari onunde tutar.

Terim, 2020 yilinda Patrick Lewis onderliginde yayinlanan bir arastirma makalesinde ortaya atildi; ortak yazarlar Meta AI, University College London ve New York University kurumlarindandi. Fikir o gunden bu yana, ekiplerin dil modellerini pratikte kullanmasinin en yaygin yollarindan biri haline geldi.

Parametrik ve parametrik olmayan bellek

Orijinal makale RAG yi iki tur bellegi birlestirme olarak tanimladi. Birincisi parametrik bellek: egitim sirasinda modelin milyarlarca dahili sayisina islenen oruntuler. Bu hizli ve akicidir, ama egitimin bittigi anda donmustur ve bir bilginin nereden geldigini gosterme yolu yoktur.

Ikincisi parametrik olmayan bellektir: modelin disinda tutulan harici bir belge deposu, ornegin Wikipedia makaleleri veya bir sirket bilgi tabani. RAG, siz soru sordugunuz anda modelin bu depoya uzanmasini saglar. Depo modelin disinda durdugu icin, hicbir seyi yeniden egitmeden onu istediginiz zaman guncelleyebilirsiniz.

Isin puf noktasi tam da bu ayrim. Model genel dil yetenegini korur, belge deposu ise ozgul, guncel veya ozel bilgileri tutar. Ikisi yalnizca siz bir sey sordugunuzda bulusur.

Getirme adimi gercekte nasil calisir

Yaygin bir RAG kurulumunda her belge, anlamini yakalayan ve gomme adi verilen bir sayi dizisine donusturulur. Tum bu gommeler bir vektor veritabanina konur. Siz soru sordugunuzda sorunuz da bir gommeye cevrilir ve sistem, yalnizca anahtar kelimeleri eslesen degil, anlam acisindan en yakin olan saklanan parcalari bulur.

Getirilen bu parcalar daha sonra sorunuzla birlikte istem icine yerlestirilir ve dil modeli onlari kaynak malzeme olarak kullanarak bir cevap yazar. NVIDIA bu sonucu, modele bir arastirma makalesindeki dipnotlar gibi kaynak gosterilebilir referanslar vermek olarak tanimliyor; boylece okuyucu iddialari kendisi kontrol edebilir.

Bu surec boyunca modelin agirliklarinda hicbir sey degismez. Getirme her sorguda yeniden gerceklesir; iste bu yuzden sabah depoya yeni bir politika belgesi ekleyip ogleden sonra cevaplarin bunu yansitmasini saglayabilirsiniz.

Halusinasyonu neden azaltir, neden bir cozum degildir

Dil modelleri bazen kendinden emin, akici ama basitce yanlis cevaplar uretir; bu davranis cogu zaman halusinasyon olarak adlandirilir. RAG burada yardimci olur cunku model artik yalnizca hafizasindan tahmin yurutmuyor; gercekten getirilmis bir metni okuyor ve cevabini ona dayandiriyor. Cevap gercek bir belgeye baglandiginda, uydurma icin daha az alan kalir.

Burada durust olmakta fayda var. RAG uydurma riskini azaltir; onu ortadan kaldirmaz. Teknik hakkinda yapilan degerlendirmelerde belirtildigi gibi, bir model yine de kaynak malzemenin etrafinda halusinasyon gorebilir, onu yanlis okuyabilir veya belgelerde hic gecmeyen ayrintilar ekleyebilir. Getirme yanlis pasaji cekerse ya da dogru cevap deposunda hic yoksa, model yine de yoldan cikabilir.

Dolayisiyla bir RAG sisteminin kalitesi, gosterissiz iki seye buyuk olcude baglidir: belge deposu ne kadar iyi ve getirme adimi dogru pasajlari ne kadar iyi buluyor. Cope girerse, kendinden emin cop cikar.

RAG nereye oturur, e-ticaret dahil

RAG, cevaplarin temel modelin hic gormedigi bilgileri yansitmasi gerektigi her durumda parlar: ic dokumanlariniz, gecen haftaki fiyatlandirma, bir musterinin siparis gecmisi veya nis bir urun katalogu. Yardim merkezinizi kaynak gosteren destek asistanlarinin ve ozel dosyalar uzerinde soru cevaplayan araclarin arkasindaki standart desen budur.

Ayni dayandirma fikri, cevrimici saticilar icin gorsel yapay zekada da giderek daha cok karsimiza cikiyor. Pratik bir akis, urun verileriniz uzerinde getirmeyi, ornegin basliklar, ozellikler ve kategori kurallarini, gorsel uretimi veya temizligiyle birlestirebilir; boylece cikti hem pazaryeri gereksinimlerine hem de gercek urune uyar.

Renderivo bu tablonun gorsel tarafinda yer alir: arka planlari temizler, beyaz arka planli ve kare cekimler hazirlar ve urun listeleri icin yapay zeka sahne fotograflari olusturur. RAG den burada her fotograf aracinin ona ihtiyaci oldugu icin degil, e-ticaret yapay zekasindaki daha genis egilim ayni oldugu icin bahsediyoruz: modeli tahmine birakmak yerine gercek verinize ve gercek urunlerinize baglayin. Gorsel tarafi denemek isterseniz yeni hesaplar ucretsiz kredi alir.

Sık sorulan sorular

RAG, bir modeli ince ayar yapmakla ayni sey mi?

Hayir. Ince ayar, modeli orneklerle daha fazla egiterek dahili agirliklarini degistirir; bu daha yavastir ve bilgiyi kalici olarak iceri isler. RAG ise modele dokunmaz ve bunun yerine soru aninda ilgili belgeleri getirir. Bir RAG bilgi deposunu yeniden egitmeden aninda guncelleyebilirsiniz; bu yuzden ikisi cogu zaman farkli isler icin, bazen de birlikte kullanilir.

RAG halusinasyonlari tamamen durdurur mu?

Hayir, onlari ortadan kaldirmaz, azaltir. Cevaplari getirilen belgelere dayandirarak modelin uydurmak icin daha az nedeni olur. Ama yine de kaynak malzemeyi yanlis okuyabilir veya getirme isabetsiz oldugunda boslulari doldurabilir; bu yuzden iyi cevaplar temiz bir bilgi deposuna ve dogru getirmeye baglidir.

Vektor veritabani nedir ve RAG neden onu kullanir?

Vektor veritabani belgeleri, anlami yakalayan sayi dizileri olan gommeler olarak saklar. Siz soru sordugunuzda RAG onu bir gommeye cevirir ve yalnizca ortak anahtar kelimeleri degil, anlam acisindan en yakin saklanan parcalari bulur. Bu, ifade farkli olsa bile ilgili pasajlari getirmesini saglar.

RAG bugunun bilgisi hakkinda cevap verebilir mi?

Evet, guncel bilgi aradigi harici depoda bulundugu surece. Getirme her sorguda yeniden gerceklestigi ve depo yeniden egitim gerekmeden istendigi zaman guncellenebildigi icin RAG, temeldeki modelin egitim sirasinda hic ogrenmedigi yeni veya degisen bilgileri yansitabilir.

Urun fotograflarinizi gercek urunlerinize dayandirin

Renderivo arka planlari temizler ve listeleriniz icin beyaz arka planli, kare ve yapay zeka sahne cekimleri hazirlar. Yeni hesaplar ucretsiz kredi alir.