6 dk okuma
Yapay Zekada İnce Ayar (Fine-Tuning) Nedir?
İnce ayar, halihazırda çok şey bilen bir modeli küçük bir veri kümesiyle sizin özel işinize göre eğitmektir. Nasıl çalıştığını, neden veri ve işlem gücü tasarrufu sağladığını ve LoRA gibi hafif yöntemlerin yerini anlatıyoruz.
Kısaca özeti
İnce ayar, büyük ve genel bir veri kümesiyle zaten eğitilmiş bir modeli alıp, onu daha küçük ve özel bir veri kümesiyle ek olarak eğitmek ve böylece tek bir işte iyi hale getirmektir.
Bunu, bir dili zaten akıcı konuşan birini işe alıp ona bir hafta boyunca şirketinizin ürünlerini ve üslubunu öğretmeye benzetin. Ona sıfırdan dil öğretmiyorsunuz. Zaten sahip olduğu bilgiyi uzmanlaştırıyorsunuz. İşin özü budur ve ince ayarın bir modeli sıfırdan kurmaktan çok daha ucuz olmasının nedeni de budur.
Ön eğitim ile ince ayar
Modern yapay zeka modelleri genel olarak iki aşamada kurulur. İlki ön eğitimdir; modelin genel kalıpları öğrenmesi için çok büyük ve geniş bir veri kümesine maruz bırakıldığı aşamadır. Bir dil modeli için bu, çok büyük miktarda metinden dil bilgisini, bilgileri ve akıl yürütme kalıplarını öğrenmek demektir. Ön eğitim pahalıdır: çok yüksek işlem gücü ve devasa veri kümeleri gerektirebilir, bu yüzden genellikle yalnızca kaynakları güçlü ekipler bunu yapar.
İkinci aşama ince ayardır. Burada ön eğitimli modelden başlar ve onu sizin özel görevinizi ya da alanınızı yansıtan çok daha küçük, özenle seçilmiş bir veri kümesiyle eğitmeye devam edersiniz. Genel bilgi korunur, ama model davranışını sizin hedefinize doğru ayarlar; bu ister marka üslubunuzla destek sorularını yanıtlamak ister dar bir kategori kümesini sınıflandırmak olsun.
Temel teknik fark, modelin ağırlık adı verilen iç sayılarına ne olduğudur. Ön eğitimde bu ağırlıklar sıfırdan öğrenilir. İnce ayarda ise ön eğitimli değerlerden başlar ve yeniden kurulmak yerine hafifçe değiştirilir.
Neden veri ve işlem gücü tasarrufu sağlar
İnce ayar işe yarar çünkü zor ve pahalı öğrenme zaten ön eğitim sırasında gerçekleşmiştir. Model dili veya görselleri geniş ölçekte zaten anladığı için, onu dar bir göreve uyarlamak çok daha küçük bir problemdir.
Pratikte bu, çoğu zaman çok daha küçük bir veri kümesiyle güçlü sonuçlar alabileceğiniz anlamına gelir; ön eğitimde kullanılan milyarlarca örnek yerine bazen yalnızca birkaç yüz ya da birkaç bin dikkatle seçilmiş örnek yeterli olabilir. Ayrıca çok daha az zaman ve donanım gerektirir. Büyük kümelerde haftalar yerine, bir ince ayar çalışması saatler içinde tamamlanabilir.
Bu, transfer öğrenme adı verilen daha geniş bir fikirle yakından bağlantılıdır: bir modelin bir görevde edindiği bilgiyi, farklı ama ilişkili başka bir görevde kullanmak. İnce ayar, transfer öğrenmenin yaygın yollarından biridir. İlişkili bir yaklaşım da öznitelik çıkarımıdır; burada ön eğitimli modeli dondurur ve yalnızca üstüne küçük yeni bir katman eğitirsiniz, orijinal ağırlıklara dokunmazsınız. İnce ayar ise bir adım ileri giderek ön eğitimli ağırlıkların bir kısmını veya tamamını günceller.
Hafif ince ayar ve LoRA
Tam ince ayar modeldeki her ağırlığı günceller ve bu, çok büyük modeller için bellek ve depolama açısından hâlâ ağırdır. Bunu ucuzlatmak için araştırmacılar, parametre verimli ince ayar (kısaca PEFT) yöntemlerini geliştirdiler; burada yalnızca az sayıda ek parametre eğitir ve modelin çoğunu dondurursunuz.
En bilinen PEFT yöntemi, Düşük Ranklı Uyarlama anlamına gelen LoRA'dır; bir Microsoft araştırma ekibi tarafından 2021 tarihli bir makalede tanıtılmıştır. LoRA, ağırlık matrislerinin tamamını yeniden yazmak yerine, yeni görev için gereken değişimi yakalayan küçük eğitilebilir matrisler ekler. Orijinal model donmuş kalır ve yalnızca bu kompakt eklentiler eğitilir.
Tasarruf büyüktür. LoRA makalesi, 175 milyar parametreli GPT-3 üzerinde uygulandığında yöntemin eğitilebilir parametre sayısını yaklaşık 10.000 kat azalttığını ve GPU bellek ihtiyacını yaklaşık 3 kat düşürdüğünü, bunu yaparken tam ince ayarın kalitesine ulaştığını ve çıkarım sırasında ek gecikme getirmediğini bildirdi. Bu tür bir verimlilik, küçük ekiplerin artık yetenekli modelleri mütevazı donanımda özelleştirebilmesinin önemli bir nedenidir.
İnce ayarın çözmediği şeyler
İnce ayar güçlüdür ama sihir değildir. İyi belgelenmiş risklerden biri yıkıcı unutmadır; bir modeli yeni bir göreve çok sert biçimde yöneltmek, önceki bilgiyi tutan ağırlıkların üzerine yazıldığı için eskiden sahip olduğu becerileri bozabilir. Veri kümesinin dikkatli seçimi ve daha yumuşak güncelleme yöntemleri bunu azaltmaya yardımcı olur, ama dikkat edilmesi gereken gerçek bir denge vardır.
Verinin kalitesi de miktarından daha önemlidir. Temiz ve temsil edici küçük bir örnek kümesi, çoğu zaman dağınık büyük bir kümeden daha iyi sonuç verir. Ayrıca ince ayar her zaman doğru araç değildir: yalnızca güncel bilgilere ya da referans malzemesine ihtiyaç duyan görevler için, eğitime hiç girmeden bilgi getirme veya daha iyi bir komut çoğu zaman daha basit ve daha ucuzdur.
Bunun ürün görselleriyle bağlantısı
Çoğu e-ticaret satıcısı bir modeli kendisi asla ince ayara tabi tutmayacak ve buna ihtiyacı da yok. İşe yarar çıkarım, zaten kullandığınız yapay zeka araçlarının arkasındaki katmanları anlamaktır. Görsel bir yapay zeka bir arka planı temizlerken ya da bir sahne oluştururken, ağır işi genellikle büyük bir ön eğitimli görüntü modeli yapar; çoğu zaman üzerine göreve özel uyarlama katmanları eklenmiştir.
Renderivo bu yığının üzerinde durur, böylece sizin uğraşmanıza gerek kalmaz. Bir ürün fotoğrafı yüklersiniz ve pazaryerine hazır temiz bir görsel alırsınız: dağınıklık giderilmiş, gerçek beyaz arka plan, kare çerçeveleme ya da bir yapay zeka sahnesi. Derin model işleri sunucu tarafında yürütülür ve yeni hesaplar denemek için ücretsiz kredi alır. Siz ürünü getirin; eğitilmiş model uzmanlaşmayı yapsın.
Sık sorulan sorular
İnce ayar, bir modeli sıfırdan eğitmekle aynı şey mi?
Hayır. Sıfırdan eğitmek, devasa bir veri kümesi kullanarak modelin tüm bilgisini temelden kurar. İnce ayar ise genel kalıpları zaten öğrenmiş bir modelden başlar ve onu yalnızca belirli bir görev için ayarlar; bu da çok daha az veri ve işlem gücü gerektirir.
Bir modeli ince ayara tabi tutmak için ne kadar veri gerekir?
Göreve bağlıdır, ama ince ayar çoğu zaman ön eğitime göre çok daha küçük veri kümeleriyle işe yarar; bazen birkaç yüz ile birkaç bin iyi seçilmiş örnek yeterlidir. Genellikle temiz ve temsil edici veri, salt miktardan daha önemlidir.
İnce ayar ile transfer öğrenme arasındaki fark nedir?
Transfer öğrenme, bir görevden edinilen bilgiyi başka bir göreve aktarma fikrinin genel adıdır. İnce ayar ise bunu yapmanın belirli bir yoludur; ön eğitimli modeli eğitmeye devam ederek ağırlıklarının yeni göreve uyum sağlamasını sağlar.
İnce ayar için LoRA neden popüler?
LoRA, orijinal modeli dondurarak yalnızca eklenen küçük bir parametre kümesini eğitir ve bu da gereken bellek ile işlem gücünü ciddi ölçüde azaltır. 2021 tarihli özgün makale, GPT-3 üzerinde çok daha az eğitilebilir parametreyle tam ince ayar kalitesine ulaşabildiğini gösterdi.
Uzmanlaşmış görsel yapay zekayı iş başında görün
Hiçbir şey eğitmenize gerek yok. Bir ürün fotoğrafı yükleyin ve saniyeler içinde pazaryerine hazır temiz bir görsel alın. Yeni hesaplar ücretsiz kredi kazanır.