← Tüm yazılar

7 dk okuma

Yapay Zeka Öneri Sistemleri Nasıl Çalışır

Öneri sistemlerine dair açık ve dürüst bir rehber: işbirlikçi ve içerik tabanlı filtreleme, gömme vektörleri, akışların neden kişisel hissettirdiği ve soğuk başlangıç ile filtre balonu gibi gerçek sınırlar.

Önerilerin çözdüğü sorun

Her büyük katalogda aynı sorun vardir: çok fazla ürün, çok az dikkat. Bir alışverişçi on milyon ürüne tek tek göz atamaz, bir izleyici de sonsuz bir kütüphaneyi elle kaydırmaz. Öneri sistemleri tam da bu boşluğu daraltmak için vardır. Sınırlı sinyallerden yola çıkarak, şu an isteme olasılığınızın en yüksek olduğu birkaç ürünü tahmin eder ve onları karşınıza çıkarır.

Bunu işleten şirketler için riskler somuttur. Amazon mühendisleri Greg Linden, Brent Smith ve Jeremy York, şirketin ürün-ürün yaklaşımını 2003 yılında IEEE Internet Computing dergisinde anlattı; dergi yıllar sonra bu çalışmayı arşivinde zamana en iyi direnen eser olarak öne çıkardı. McKinsey analistleri Amazon satın alımlarının yaklaşık yüzde 35 inin önerilere dayandığını tahmin etmiştir ve Netflix, izlenen içeriğin yüzde 80 inden fazlasının bir aramadan değil bir öneriden başladığını belirtmiştir.

Bu rakamlar harcanan çabayı açıklar. Ama mekanik kısım kulağa geldiğinden daha anlaşılırdır. Neredeyse her modern öneri motoru, çoğu zaman birbirine harmanlanan iki temel fikirden kurulur.

İşbirlikçi filtreleme: sana benzeyen insanlar

İşbirlikçi filtreleme, bir ürünün gerçekte ne olduğunu önemsemez. Yalnızca davranışa bakar: kim neye tıkladı, ne satın aldı, ne izledi, neye puan verdi. Temel sezgi basittir. Geçmiş seçimleriniz başka bir alışverişçinin seçimleriyle yakından örtüşüyorsa, onun beğendiği ama sizin henüz görmediğiniz şeyler size gösterilecek iyi adaylardır.

İki yaygın türü vardır. Kullanıcı tabanlı filtreleme size benzeyen kişileri bulur ve onların favorilerini önerir. Amazon un yaygınlaştırdığı ürün tabanlı filtreleme ise bunu tersine çevirir: hangi ürünlerin aynı kişilerce seçilme eğiliminde olduğunu önceden hesaplar, böylece bir fotoğraf makinesi sık alıcıların birlikte aldığı hafıza kartlarını ve kılıfları işaret edebilir. Ürün ilişkileri kullanıcı zevklerinden daha yavaş değişir; bu da söz konusu sürümü büyük ölçekte daha hızlı ve daha kararlı kılar.

İşbirlikçi filtrelemenin gücü, ürünü hiç anlamaya ihtiyaç duymamasıdır. Kalabalık ikisini de seçmeye devam ettiği için, bir teknik föyden asla tahmin edilemeyecek bir eşleşmeyi yüzeye çıkarabilir. Zayıf yanı ise bunun tam tersidir: öğrenecek davranış yoksa söyleyecek sözü de yoktur.

İçerik tabanlı filtreleme: ona benzeyen ürünler

İçerik tabanlı filtreleme ters yolu izler. Her ürünü kendi özellikleriyle tanımlar: kategori, marka, fiyat, renk, malzeme ve başlık ile açıklamadaki metin gibi. Ardından sizin nelerle ilgilenme eğiliminde olduğunuza dair bir profil oluşturur ve özellikleri bu profile uyan ürünleri önerir. Sürekli sade, mat siyah mutfak eşyalarına bakıyorsanız, sistem daha fazlasına yönelir.

Bu yaklaşım, tam da işbirlikçi filtrelemenin zorlandığı yerde parlar. Hiç satışı olmayan yepyeni bir ürün bile ilk gününden itibaren önerilebilir, çünkü sistem bir satın alma geçmişini beklemek yerine ürünün niteliklerini okur. Eşleşme görünür özelliklere dayandığı için açıklaması da daha kolaydır.

Bedeli ise darlıktır. Tamamen içerik tabanlı bir sistem, zaten seçtiğinizin daha fazlasını önerme eğilimindedir; bu da tekdüze hissettirebilir ve sizi gerçekten yeni bir şeyle nadiren şaşırtır. Bu nedenle çoğu gerçek ürün, keşif için işbirlikçi sinyallere ve boşlukları doldurmak için içerik sinyallerine dayanan bir melez yapı kullanır.

Gömme vektörleri: zevki koordinata çevirmek

Modern sistemler ürünleri nadiren tek tek ham tıklamalarla karşılaştırır. Bunun yerine gömme vektörleri öğrenir; bunlar her kullanıcıyı ve her ürünü aynı matematiksel uzayda bir nokta olarak konumlandıran sayı dizileridir. Bunun ardındaki popüler teknik olan matris ayrıştırma, 2006 ile 2009 arasında düzenlenen Netflix Ödülü yarışması sırasında yaygınlaştı.

Fikir şudur: her koordinat, modelin kendi başına keşfettiği ve hiçbir insan tarafından etiketlenmeyen gizli bir özelliği temsil eder. Bir yön gevşek biçimde resmi ile gündelik arasını, bir başkası uygun fiyatlı ile premium arasını yakalayabilir. Bir kullanıcı, keyif alacağı ürünlerin yakınında durur ve öneri yapmak, en yakın noktaları bulmaya dönüşür. Açıklamalarında ortak hiçbir kelime bulunmayan iki ürünün yine de benzer sayılabilmesinin nedeni budur: sayıları birbirine yakın düştü, çünkü aynı tür insanlar her ikisine de yanıt veriyor.

Aynı gömme fikri artık görsellere ve videoya da uzanıyor. Görsel modeller bir ürün fotoğrafını benzer bir uzayda nokta olarak konumlandırabilir; bir akışın, metin alanları seyrek ya da tutarsız olsa bile, sadece birbirine benzeyen ürünleri yan yana getirebilmesinin yolu budur. Satıcılar için bu, temiz, tutarlı ve iyi çerçevelenmiş görsellerin yalnızca sayfada nasıl göründüğünüzle değil, ürünlerin nasıl eşleştirilip gösterildiğiyle de ilgili olduğunu sessizce hatırlatır. Renderivo nun üstlendiği türden derli toplu beyaz arka planlar ve kare çerçeveleme, listelemelerinizin hem alışverişçilere hem de onları sıralayan sistemlere net görünmesine yardımcı olur.

Dürüst sınırlar

Öneri motorları yararlıdır, sihirli değil ve en çok iki sınır önemlidir. Birincisi soğuk başlangıç sorunudur. Yepyeni bir kullanıcının geçmişi, yepyeni bir ürünün ise kitlesi yoktur; dolayısıyla işbirlikçi filtrelemenin her ikisi için de elinde çalışacak veri kalmaz. Sistemler bunu içerik özellikleri, popülerlik varsayılanları ve karşılama soruları ile yamar, ama yeni bir hesabın gördüğü ilk öneriler her zaman en ham olanlardır.

İkincisi filtre balonudur. Bu sistemler etkileşime girme olasılığınızın yüksek olduğu şeyi optimize ettiği için, dünyanızı sessizce daraltabilir; zaten beğendiğinizin daha fazlasını, geri kalan her şeyin ise daha azını gösterir. Denetlenmezse bu, tekdüze akışlar yaratır ve hiç görünme şansı bulamayan iyi seçenekleri gizleyebilir. Birçok ekip artık sonuçların bir döngüye çökmemesi için bilinçli olarak yenilik ve çeşitlilik ekliyor.

Daha ince sorunlar da vardır. Öneri motorları zaten popüler olanı büyütebilir, sahte etkileşimle aldatılabilir ve geçmiş davranışta gizli önyargıları yansıtabilir. Bunların hiçbiri onları kötü yapmaz, ama çıktının kaliteye dair nesnel bir hüküm değil, teşviklerce şekillenmiş yararlı bir tahmin olduğu anlamına gelir.

Sık sorulan sorular

İşbirlikçi ve içerik tabanlı filtreleme arasındaki fark nedir?

İşbirlikçi filtreleme, ürünlerin ne olduğunu önemsemeden birçok kullanıcının davranış örüntülerine göre öneri yapar. İçerik tabanlı filtreleme ise ürünlerin kendi özelliklerine göre, sizin geçmişinizle eşleştirerek öneri yapar. Çoğu gerçek sistem ikisini harmanlar.

Soğuk başlangıç sorunu nedir?

Henüz veri yokken öneri yapmanın zorluğudur. Yeni bir kullanıcının öğrenilecek geçmişi, yeni bir ürünün ise kitlesi yoktur. Sistemler bunu, gerçek davranış birikene kadar ürün özellikleri, popülerlik varsayılanları ve karşılama sorularıyla aşar.

Filtre balonu nedir?

Bir öneri motorunun, zaten etkileşime girdiğiniz şeyin daha fazlasını göstermeye devam ederek çeşitliliği yavaşça daraltma eğilimidir. Sistem olası tıklamaları optimize ettiği için, beğenebileceğiniz ama görme fırsatı bulamadığınız iyi seçenekleri gizleyebilir.

Öneri sistemleri ürün görsellerimi kullanır mı?

Giderek artan biçimde evet. Görsel modeller bir ürün fotoğrafını gömme vektörüne çevirip metin alanları zayıf olsa bile benzer görünen ürünleri eşleştirebilir. Temiz, tutarlı ve iyi çerçevelenmiş görseller, ürünlerinizin hem alışverişçilere hem de bu sistemlere net görünmesine yardımcı olur.

Ürün görsellerinizi eşleştirmeye uygun hale getirin

Temiz arka planlar ve tutarlı çerçeveleme, alışverişçilerin ve öneri akışlarının listelemelerinizi net okumasına yardımcı olur. Yeni hesaplar denemek için ücretsiz kredi alır.