← Tüm yazılar

6 dk okuma

Üretken Yapay Zeka Nedir? Açık ve Dürüst Bir Anlatım

Üretken yapay zeka, verideki örüntüleri öğrenerek yeni metin, görsel, ses ve kod üretir. Bunun gerçekte ne anlama geldiğini ve eski yapay zekadan farkını anlatıyoruz.

Kısa cevap

Üretken yapay zeka, asıl işi mevcut içeriği etiketlemek veya puanlamak değil, yeni içerik üretmek olan her sistemdir. Bu içerik metin, görsel, ses, video ya da bilgisayar kodu olabilir. Georgetown Üniversitesi bünyesindeki Güvenlik ve Yeni Teknolojiler Merkezi bunu sade biçimde tanımlar: temel işlevi içerik üretmek olan, veriyi sınıflandıran ya da eylem seçen sistemlerden ayrılan her yapay zeka sistemi.

Anahtar kelime yeni. Üretken bir model, cevabı bir veri tabanından bulup geri kopyalamaz. Eğitim sırasında öğrendiği örüntülerle istatistiksel olarak tutarlı bir çıktıyı parça parça oluşturur. Bu çıktı bazen gerçekten faydalıdır, bazen de kendinden emin biçimde yanlıştır. İkisi de aynı temel süreçten doğar.

Üretken ve geleneksel (ayırt edici) yapay zeka

Son dalgadan önceki yapay zekanın çoğu ayırt edici (discriminative) türdendi. Ayırt edici bir model, bir girdi hakkında karar verebilmek için kategoriler arasındaki sınırları öğrenir: bu e-posta spam mı değil mi, bu fotoğraf kedi mi köpek mi, bu müşteri ayrılacak mı kalacak mı. Yeni bir şey yaratmaya çalışmaz; sıralar, puanlar ve etiket tahmin eder.

Üretken bir model daha yüksek bir hedef koyar. Yalnızca kedi ile köpek arasındaki çizginin nerede olduğunu öğrenmek yerine, verinin kendisinin nasıl göründüğünü öğrenmeye çalışır; böylece eğitim verisine benzeyen yeni örnekler üretebilir. Bu fazladan iddia, üretken sistemlerin bir paragraf yazabilmesinin ya da bir resim çizebilmesinin nedenidir; aynı zamanda doğru kalmalarının neden daha zor olduğunu da açıklar. Kararsız bir spam filtresi daha olası etiketi seçebilir. Kararsız bir üretken model ise yine de bir şey üretmek zorundadır, bu yüzden boşluğu en iyi tahminiyle doldurur.

Neler üretir: metin, görsel, ses, kod

En tanıdık örnek metindir. Yaygın sohbet asistanlarının arkasındaki büyük dil modelleri, metni token token üretir; token kabaca bir kelime ya da kelimenin bir parçasıdır. Stable Diffusion ve Midjourney gibi görsel üreticiler bir metin istemini resme dönüştürür. Ses modelleri konuşma ve müzik üretebilir. GitHub Copilot gibi kod asistanları, bir açıklamadan ya da çevredeki satırlardan program kodu üretir.

Bunlar çok farklı işler gibi görünür ama temelde ortak bir fikri paylaşırlar: bir veri türünün yapısını öğren, sonra bu yapıya uyan yeni veriyi örnekle. Bir sonraki kelimeyi tahmin eden yöntem ailesi, farklı bir eğitimle bir sonraki piksel örüntüsünü ya da sesi de tahmin edebilir.

Gerçekte nasıl öğrenir

Üretken bir modeli eğitmek, büyük ölçüde çok uzun bir tahmin et ve düzelt dizisidir. Sisteme çok büyük miktarda örnek veri gösterilir ve eksik ya da sonraki parçayı, örneğin bir cümledeki sonraki kelimeyi, tahmin etmesi defalarca istenir. Her seferinde tahminini gerçek cevapla karşılaştırır ve bir dahaki sefere daha iyi tahmin etmek için parametre adı verilen milyonlarca ya da milyarlarca iç sayıyı azar azar ayarlar. CSET in anlattığı gibi eğitim, girdiler güvenilir biçimde iyi çıktılar üretene kadar model parametrelerini matematiksel eniyileme ile ince ayar etme sürecidir.

Bunu trilyonlarca token metin üzerinde yapın ve model sonrakini tahmin etmekte çok iyi hale gelir. Eğitim setini ezberlemez; dilin ya da görsellerin genelde nasıl bir araya geldiğine dair istatistiksel örüntüler öğrenir. Hem akıcılığının hem de hatalarının kaynağı budur. Model tam sorunuz için güvenilir bir örüntü öğrenmediğinde, kulağa makul gelen ama gerçek olmayan bir cevap yine de üretebilir. Bu hatalara halüsinasyon denir; aracın bozuk olduğunun değil, bilinen bir sınırlamanın işaretidir.

Modern sistemlerin çoğu, Google daki araştırmacıların 2017 tarihli Attention Is All You Need makalesinde tanıttığı dönüştürücü (transformer) mimarisine dayanır. Dönüştürücüler bir dizideki tüm kelimeleri paralel işler ve sonraki tahmin için hangi önceki kelimelerin en çok önem taşıdığını tartmak üzere bir dikkat (attention) mekanizması kullanır. Bu tasarım iyi ölçeklenir; bugünkü modellerin bu kadar çok veriyle eğitilebilmesinin önemli bir nedeni de budur.

Kısaca temel modeller

Sık sık temel model (foundation model) terimini duyarsınız. Bu terimi 2021 dolaylarında Stanford araştırmacıları yaygınlaştırdı ve temel modeli şöyle tanımladı: geniş veriyle, genellikle büyük ölçekli öz denetimle eğitilen ve ardından çok çeşitli alt görevlere uyarlanabilen model. Sade ifadeyle, büyük ve genel bir modeli bir kez eğitir, sonra her seferinde sıfırdan yeni model kurmak yerine onu birçok özel iş için yeniden kullanır ve ince ayar yaparsınız.

Büyük dil modelleri en bilinen temel modellerdir, ama fikir dille sınırlı değildir. Aynı temel model yaklaşımı görseller ve başka veri türleri için de kullanılır; bu yeniden kullanım, üretken yapay zekanın bu kadar çok ürüne bu kadar hızlı yayılmasının büyük nedenlerinden biridir.

Bunun e-ticaretle ilişkisi

Çevrimiçi satıcılar için en faydalı üretken yapay zeka genellikle görsellerle ilgilenen türdür. Bir modelin metin üretmesini sağlayan aynı örüntü öğrenme, görsel modellerin dağınık bir arka planı temizlemesini, ürünü temiz beyaz bir zemine yerleştirmesini ya da çevresine basit bir sahne üretmesini de sağlar. Bu, çok sayıda manuel düzenleme süresinden tasarruf ettirebilir.

Renderivo buna odaklı bir örnektir: ürün fotoğraflarını düzenlemek, arka planları kaldırmak ya da değiştirmek ve tutarlı, pazaryerine hazır görseller üretmek için görsel yapay zeka kullanır. İyi ürün fotoğrafçılığının ya da dürüst ilanların yerini almaz, ama düzgün bir telefon fotoğrafını yayınlanacak kadar derli toplu hale getirebilir. Her üretken araçta olduğu gibi mantıklı akış, tekrarlı işi ona bırakmak ve sonuca bir insan gözüyle bakmaya devam etmektir.

Sık sorulan sorular

Üretken yapay zeka, makine öğrenmesiyle aynı şey mi?

Hayır. Makine öğrenmesi, veriden öğrenen sistemlerin geniş alanıdır. Üretken yapay zeka bunun bir parçasıdır ve yalnızca etiket sınıflandırmak ya da tahmin etmek yerine yeni içerik üretmeye odaklanır.

Üretken yapay zeka neden bazen yanlış cevaplar verir?

Çıktıyı doğrulanmış gerçekleri bulup getirerek değil, öğrenilen istatistiksel örüntülere göre üretir. Sorunuz için güvenilir bir örüntüsü olmadığında akıcı ama yanlış bir cevap üretebilir. Önemli çıktıları her zaman kontrol edin.

Büyük dil modeli ile temel model arasındaki fark nedir?

Temel model, geniş veriyle eğitilen ve birçok göreve uyarlanabilen her büyük modeldir. Büyük dil modeli ise metne özelleşmiş bir temel modeldir. Yani her büyük dil modeli bir temel modeldir ama her temel model dille ilgilenmez.

Kullanmak için teknolojiyi anlamam gerekir mi?

Hayır. Çoğu araç karmaşıklığı basit bir istem ya da düğmenin arkasına gizler. Temelleri bilmek yalnızca gerçekçi beklentiler kurmanıza ve çıktıları daha eleştirel incelemenize yardımcı olur.

Görsel yapay zekayı kendi ürün fotoğraflarında dene

Üretken ve görsel yapay zekanın ilanların için neler yapabileceğini gör. Temiz arka planlar ve pazaryerine hazır görseller; yeni hesaplara ücretsiz kredi.