7 dk okuma
Yapay Zeka Gorsel Arama ve Tersine Gorsel Arama Gercekte Nasil Calisir
Gorsel aramanin bir fotografi nasil sayilara cevirdigini, en yakin komsu eslestirmesiyle benzerleri nasil buldugunu ve temiz urun gorsellerinin e-ticarette neden onemli oldugunu anlatan net ve dogru bir rehber.
Piksellerden anlama
Bir sandalyenin fotografini cekip benzerlerini bulmasini istediginizde, sistem dev bir fotograf albumunu acip pikselleri tek tek karsilastirmaz. Pikseller, gorselleri eslestirmek icin kotu bir yontemdir; cunku kucuk bir kirpma, bir filtre ya da farkli bir isik ayari, nesne ayni kalsa bile neredeyse her pikseli degistirir. Modern gorsel arama bu sorunu, gorseli bir renk noktalari izgarasina degil, bir anlama cevirerek cozer.
Bu anlam, bir gomme vektor (embedding) bicimini alir: cogu zaman birkac yuzden birkac bine kadar degerden olusan, gorselde ne oldugunu yakalayan bir sayi listesi. Bir sinir agi kenarlara, renklere, dokulara, sekillere ve nesneler arasindaki iliskilere bakar, sonra tum bunlari tek bir derli toplu vektore sikistirir. Onemli ozellik basit ama gucludur: benzer seyler iceren iki gorsel, yuzeyde farkli gorunse bile bu sayi uzayinda birbirine yakin gomme vektorler uretir.
Bir gorsel nasil gomme vektore donusur
Cogu gorsel arama sisteminin arkasindaki is gucu, tarihsel olarak evrisimli sinir agi (CNN) olan derin bir sinir agidir. ResNet, VGG ve GoogLeNet gibi isimlere sahip mimariler bu is icin standart araclar haline geldi. Ag, buyuk etiketli veri kumeleri uzerinde egitilir ve katman katman giderek daha soyut ozellikleri taniyacak sekilde ogrenir: once basit kenarlar, sonra desenler ve parcalar, en sonunda butun nesneler.
Bir arama dizini olusturmak icin sistem, katalogundaki her gorseli agdan gecirir ve ortaya cikan vektoru saklar. Muhendisler yer kazanmak ve eslestirmeyi hizlandirmak icin bu vektorleri sik sik kuculturler. Ornegin Pinterest, uretim sisteminde ikililestirilmis ozellikler kullandigini anlatti ve ikili surumun ham ozelliklerden yaklasik on alti kat daha kucuk oldugunu, buna ragmen iyi performans gosterdigini belirtti. Kucuk vektorler, bir sirketin depolama ve islem maliyetleri kontrolden cikmadan cok buyuk bir katalogu dizine alabilmesi anlamina gelir.
Buyuk olcekte en yakin komsu eslestirmesi
Sorgu fotografiniz bir vektore donustugunde, arama sorunu bir geometri sorununa donusur: hangi sakli vektorler bu vektore en yakindir? Yakinlik bir uzaklik olcusuyle hesaplanir. Kosinus benzerligi iki vektorun yonunu karsilastirir; Oklid (L2) uzakligi ise aralarindaki duz cizgi mesafesini olcer. Sikistirilmis ikili vektorler icin sistemler genellikle kac bitin farkli oldugunu sayan Hamming uzakligini kullanir.
Sorgunuzu milyonlarca ya da milyarlarca ogeden olusan bir katalogdaki her ogeyle karsilastirmak cok yavas olurdu. Bu yuzden gercek sistemler, kucuk bir dogruluk kaybi karsiliginda buyuk bir hiz kazanci saglayan yaklasik en yakin komsu (ANN) aramasini kullanir. ANN yontemleri her seyi taramak yerine, sayi uzayinda kestirme yollar gibi calisan akilli dizin yapilari kurar. Yaygin kullanilan iki acik kaynak kutuphane, Meta tarafindan gelistirilen FAISS ve Google tarafindan gelistirilen ScaNN olup, ikisi de cok buyuk vektor koleksiyonlarinda yakin eslesmeleri hizlica bulmak icin tasarlanmistir.
Buradaki olcek gercek. Pinterest, yayinladigi arastirmada erken donem gorsel arama sisteminin gunde yaklasik dort milyon gorsel arama istegini karsiladigini ve bir milyardan fazla nesneyi dizine aldigini bildirdi. Bu yalnizca agir islerin her gorsel icin bir kez cevrimdisi yapilmasi ve canli sorgunun sadece hizli bir aramaya ihtiyac duymasi sayesinde mumkundur.
Tersine gorsel arama ile benzer bulma arasindaki fark
Birbiriyle baglantili iki gorevi ayirmak faydali olur. Tersine gorsel arama, ayni gorseli ya da onun neredeyse ayni kopyalarini web genelinde bulmaya calisir. Bir fotograf kirpilsa, yeniden boyutlandirilsa ya da baska bir yerde paylasilsa bile nereden geldigini boylece izleyebilirsiniz; cunku duzenlenmis kopyanin gomme vektoru, orijinalin gomme vektoruna yakin kalir. Google Lens gibi araclar bunun uzerine ek teknikler ekler: cercevedeki ogeleri bulmak icin nesne tespiti, onlari etiketlemek icin siniflandirma ve metni okumak icin optik karakter tanima (OCR).
Benzer bulma ise farkli bir hedeftir: ayni resim degil, ona benzeyen baska ogeler. Alisveriste fotografla arama bu motorla calisir. Bir urunu yukler ya da kameranizi ona dogrultursunuz, uygulama onu bir gomme vektore cevirir ve gomme vektoru yakin olan katalog ogelerini getirir. Ayni matematik her ikisini de calistirir; fark, birebir kopyalar mi yoksa gorsel akrabalar mi istediginizde yatar.
Temiz urun gorselleri e-ticarette neden yardimci olur
Gorsel arama perakendede giderek yayginlasiyor; cunku insanlarin gercekte nasil dusundugune uyuyor. Bir alisverisci gercek hayatta ya da bir fotografta begendigi bir seyi gorur ve dogru anahtar kelimeleri tahmin etmeye calismak yerine dogrudan o seyin kendisini ister. Saticilar icin bu, urun gorsellerinizin artik sadece bir suslemeden ibaret olmadigi anlamina gelir. Onlar bir eslestirme sisteminin girdisidir ve bu girdinin kalitesi, urununuzun gorunup gorunmeyecegini etkiler.
Karmasik arka planlar, dikkat dagitici aksesuarlar ve tutarsiz cerceveleme, gomme vektore gurultu ekler. Ag, lambanizin yerine arkasindaki kalabalik oturma odasini one cikarabilir. Urunun cerceveyi doldurdugu temiz ve iyi aydinlatilmis bir fotograf, modele net bir sinyal verir ve bu da daha temsil edici bir vektor uretme egilimindedir. Bir katalog boyunca tutarli cerceveleme, bir magazanin kendi ogelerini guvenilir bicimde gruplayip karsilastirmasina da yardimci olur.
Cogu temel gorsel duzeninin arkasindaki durust ve pratik neden budur. Renderivo tam da bu tur bir temizlige odaklanir: karmasik arka planlari kaldirmak, urunleri temiz ya da beyaz arka planlara yerlestirmek ve her cekimin tutarli olmasi icin cerceveyi kareye getirmek. Bu, herhangi bir gorsel arama motorunda ust sirayi garanti etmez ve hicbir arac bunu vaat edemez. Ancak alttaki modellere daha net bir resim sunmak mantikli, az caba gerektiren bir adimdir ve yeni hesaplar denemek icin ucretsiz kredi alir.
Sık sorulan sorular
Gorsel arama sadece pikselleri mi karsilastirir?
Hayir. Piksel karsilastirmasi, bir gorsel kirpildiginda, filtre uygulandiginda ya da isigi degistiginde bozulur. Gorsel arama bunun yerine her gorseli, icerigini yakalayan bir sayi vektoru olan gomme vektore cevirir ve bu vektorleri karsilastirir. Neredeyse her pikseli degistiren duzenlemelerden sonra bile eslesme bu yuzden calisir.
Gomme vektor sade bir dille nedir?
Gomme vektor, bir gorselin ne icerdigini ozetleyen derli toplu bir sayi listesidir. Bir sinir agi, sekiller, renkler ve dokular gibi ozelliklerden onu uretir. Benzer seylerin gorselleri bu sayi uzayinda birbirine yakin duser; benzerlik aramasini mumkun kilan da budur.
Neden birebir arama yerine yaklasik en yakin komsu aramasi kullanilir?
Bir sorguyu milyonlarca ya da milyarlarca gorselden olusan bir katalogdaki her ogeyle karsilastirmak cok yavas olurdu. FAISS ve ScaNN gibi yaklasik en yakin komsu yontemleri, cok yakin eslesmeleri hizlica bulan dizin yapilari kurar ve buyuk bir hiz kazanci icin cok kucuk bir dogrulugu feda eder.
Temiz urun fotograflari daha iyi gorsel arama sonuclarini garanti eder mi?
Hicbir arac siralama garanti edemez. Ancak karmasik arka planlar ve tuhaf cerceveleme gomme vektore gurultu ekler, bu nedenle model urun yerine sahneye odaklanabilir. Temiz ve iyi cercevelenmis bir cekim daha net bir sinyal verir; bu da mantikli ve dusuk maliyetli bir iyilestirmedir.
İlgili ücretsiz araçlar
Urunlerinize daha net bir resim kazandirin
Temiz arka planlar, beyaz arka planlar ve tutarli kare cerceveleme, hem alisvericilere hem de gorsel aramanin arkasindaki modellere urunlerinizi net okumalarinda yardimci olur. Yeni hesaplar denemek icin ucretsiz kredi alir.