6 dk okuma

Denetimli ve Denetimsiz Öğrenme, Sade Bir Anlatımla

Makine öğrenmesinin iki temel yaklaşımı yan yana: etiketli cevaplardan öğrenmek ile kalıpları kendi başına bulmak. Anlaşılır örnekler ve öz denetimli öğrenmeye kısa bir bakış.

Bir makinenin öğrenmesinin iki yolu

Duyduğunuz neredeyse her makine öğrenmesi sistemi iki büyük aileden birine girer: denetimli öğrenme ya da denetimsiz öğrenme. Ayrım tek bir soruya dayanır. Model eğitim verisini incelerken doğru cevapları da görüyor mu, yoksa veriyi kendi başına mı anlamlandırmak zorunda?

Denetimli öğrenme cevapları görür. Denetimsiz öğrenme görmez. Bu tek fark, her yaklaşımın neyde iyi olduğunu, hangi veriye ihtiyaç duyduğunu ve işe yarayıp yaramadığını nasıl kontrol ettiğinizi belirler. Bunu içselleştirdiğinizde, kafa karıştıran birçok yapay zeka terimi yerli yerine oturmaya başlar.

Öğrencinin başında bekleyen bir öğretmen benzetmesini bir kenara bırakmak faydalı olur. Daha net bir bakış şudur: denetimli öğrenme, tüm cevapları çözülmüş bir anahtar kağıdıyla çalışmaktır; denetimsiz öğrenme ise size dağınık bir veri yığını verilip içinde gizlenen yapıyı bulmanızın istenmesidir.

Denetimli öğrenme: etiketli örneklerden öğrenmek

Denetimli öğrenmede her eğitim örneği bir etiketle, yani doğru çıktıyla birlikte gelir. Modele her biri spam ya da spam değil olarak işaretlenmiş binlerce e-posta verebilirsiniz; ya da her biri nihai satış fiyatıyla etiketlenmiş binlerce ev ilanı. Model bu girdi ve çıktı çiftlerini inceler ve yeni girdileri olası çıktılara eşleyen bir fonksiyon öğrenir.

Denetimli problemler iki ana türe ayrılır. Sınıflandırma bir kategori tahmin eder: bu e-posta spam mı değil mi, bu işlem dolandırıcılık mı, bu fotoğrafta kedi var mı. Regresyon ise sürekli bir ölçekte bir sayı tahmin eder: bu ev kaça satılır, gelecek ay kaç adet sevkiyat yaparız. Basit bir test ikisini ayırır. Cevap sabit bir kümeden bir etiketse sınıflandırmadır. Cevap bir miktarsa regresyondur.

Yaygın denetimli algoritmalar arasında lojistik regresyon, karar ağaçları, rastgele ormanlar, destek vektör makineleri ve yapay sinir ağları bulunur. Bunlar tanıdık araçları çalıştırır: spam filtreleri, kredi puanlama, tıbbi görüntü ön değerlendirmesi ve geçmiş alışverişlere dayalı ürün önerileri.

İşin püf noktası etiketlerdir. Onları birinin oluşturması gerekir ve büyük veri kümeleri için bu, yavaş ve maliyetli insan etiketlemesi demektir. Ayrıca bir model ancak etiketleri kadar iyidir: yanlı ya da özensiz etiketleme modele yanlış dersi öğretir ve model bu hatayı büyük ölçekte ve kendinden emin biçimde tekrarlar.

Denetimsiz öğrenme: cevap anahtarı olmadan kalıp bulmak

Denetimsiz öğrenme hiç etiketi olmayan veriyle çalışır. Tahmin edilecek doğru bir cevap yoktur. Bunun yerine algoritma, veride zaten var olan ama kendisine açıkça söylenmemiş yapıyı, gruplamayı veya ilişkileri arar.

En bilinen görev kümelemedir; benzer öğeleri gruplara ayırır. K-means klasik örnektir: kaç grup arayacağını ona söylersiniz, o da her noktanın bir grup merkezine ne kadar yakın olduğuna göre veriyi sıralar. Perakendeciler, önceden tanımlamadıkları müşteri segmentlerini keşfetmek için kümelemeyi kullanır; örneğin sık alışveriş yapan küçük sepetli bir küme ile nadiren çok harcayan bir küme gibi.

İki yaygın denetimsiz görev daha vardır: birlikte görülme eğiliminde olan öğeleri ortaya çıkaran birliktelik analizi ve çok sayıda değişkene sahip veriyi, anlamlı değişimin çoğunu koruyarak daha küçük bir kümeye sıkıştıran boyut indirgeme. Temel bileşen analizi burada yaygın kullanılan bir yöntemdir; çoğunlukla veriyi çizmeden ya da başka bir modele vermeden önce uygulanır.

Cevap anahtarı olmadığı için denetimsiz sonuçları değerlendirmek daha zor ve daha özneldir. Bir modelin bulduğu kümeler gerçekten faydalı olabilir ya da yalnızca benzerliği nasıl ölçtüğünüzün bir yan ürünü olabilir. Bulunan grupların gerçekten bir anlam taşıyıp taşımadığını genellikle bir insanın yorumlaması gerekir.

Üçüncü bir yol: öz denetimli öğrenme

Sohbet botlarının arkasındaki büyük dil modelleri de dahil olmak üzere modern yapay zeka, sınırı bulanıklaştıran üçüncü bir yaklaşıma büyük ölçüde dayanır: öz denetimli öğrenme. İşin hilesi, modelin etiketlerini doğrudan ham, etiketsiz veriden kendisinin üretmesidir; böylece insan etiketlemesine gerek kalmaz.

Yaygın bir biçimi, girdinin bir kısmını gizleyip eksik parçayı modele tahmin ettirmektir. Bir cümledeki bir kelimeyi maskeleyip modelin onu bulmasını isteyin ya da bir görüntüden bir parçayı çıkarıp boşluğu doldurmasını sağlayın. Gizlenen parça etikettir ve veri bunu zaten içerdiğinden, etiketsiz verinin ölçeğinde denetimli tarzda bir eğitim elde edersiniz. Bu yüzden öz denetimli öğrenme, denetimsiz bir problemi denetimli bir probleme dönüştürmenin bir yolu olarak da tarif edilir.

Öz denetimli öğrenme genellikle bir ön eğitim adımıdır. Model önce devasa miktarda ham metin ya da görüntüden geniş temsiller öğrenir, ardından belirli bir iş için daha küçük etiketli bir veri kümesiyle ince ayar edilir. Bu iki aşamalı yöntem, bugünün genel amaçlı modellerinin neden bu kadar çok dar göreve uyarlanabildiğinin önemli bir nedenidir.

Bunlar e-ticarette nerede karşımıza çıkar

Bu yaklaşımlar yalnızca akademik değildir. İnternette satış yapıyorsanız denetimli modeller mağazanıza muhtemelen şimdiden değiyordur: dolandırıcılık kontrolleri, talep tahminleri ve öneri motorları çoğunlukla etiketli geçmiş üzerine eğitilmiş denetimli sistemlerdir. Denetimsiz kümeleme ise analizlerinizde müşteri segmentasyonunu ve anormallik tespitini sessizce çalıştırır.

Görsel yapay zeka araçları da burada yer alır. Bir ürün arka planını temizleyen, öğeyi ayıran ya da stilize bir sahne üreten modeller büyük görüntü koleksiyonları üzerinde eğitildi; düzenleme görevleri için özelleştirilmeden önce çoğu zaman öz denetimli ön eğitim kullanıldı. Renderivo'da, ürün fotoğrafçılığının sıkıcı kısımlarını, örneğin karmaşık arka planları kaldırıp temiz ve pazaryerine hazır kareler üretmeyi, halletmek için bu tür görsel yapay zekayı kullanıyoruz; böylece siz rötuşla değil satışla ilgilenebilirsiniz.

Bundan yararlanmak için bunların hiçbirini kendiniz inşa etmeniz gerekmez. Ancak bir aracın arkasında hangi tür öğrenmenin yattığını bilmek, o aracın makul olarak neler yapabileceğini, hangi veriye ihtiyaç duyduğunu ve nerede yetersiz kalabileceğini değerlendirmenize yardımcı olur.

Sık sorulan sorular

Denetimli ve denetimsiz öğrenme arasındaki temel fark nedir?

Denetimli öğrenme, doğru cevapları yani etiketleri içeren veriyle eğitilir; böylece yeni girdiler için bir çıktı tahmin etmeyi öğrenir. Denetimsiz öğrenme ise etiketsiz veriyle eğitilir ve bunun yerine veride zaten var olan kalıpları, grupları veya yapıyı bulur.

Sınıflandırma denetimli mi denetimsiz mi?

Sınıflandırma denetimlidir. Kategorileri öğrenmek için etiketli örneklere ihtiyaç duyar, ardından yeni bir girdinin hangi kategoriye ait olduğunu tahmin eder, örneğin spam mı değil mi. Kümeleme ise denetimsiz karşılığıdır, çünkü veriyi önceden tanımlı etiketler olmadan gruplar.

Öz denetimli öğrenme denetimsiz öğrenmeden nasıl farklıdır?

İkisi de etiketsiz veriden başlar, ama öz denetimli öğrenme etiketleri verinin kendisinden üretir; örneğin girdinin bir kısmını gizleyip onu tahmin eder ve sonuçları bu gizli doğru cevaba göre ölçer. Geleneksel denetimsiz öğrenme bilinen bir cevaba göre tahmin yapmaz, yalnızca yapı arar.

Hangi yaklaşım daha iyi?

Hiçbiri her durumda daha iyi değildir. Etiketli veriniz ve tahmin edilecek net bir hedefiniz varsa denetimli öğrenmeyi kullanın. Etiketsiz veriniz varsa ve yapısını keşfetmek istiyorsanız denetimsiz öğrenmeyi kullanın. Birçok gerçek sistem bunları birleştirir, çoğunlukla önce öz denetimli ön eğitimle.

Görsel yapay zekayı ürün fotoğraflarınızda kullanın

Renderivo arka planları temizler, beyaz arka planlı ve kare görseller hazırlar ve e-ticaret için yapay zeka sahne kareleri üretir. Yeni hesaplar denemek için ücretsiz kredi alır.

Ücretsiz başla Ücretsiz araçları dene