OpenAI, DALL-E’nin Üçüncü Sürümünü Yayınladı: ChatGPT’yle Kullanılabilecek

Çağlar Enes Sezgün
A+A-
Reset

Yapay zeka artık hayatımızın her alanında bize destek oluyor, yazdığımız metini görsele çeviren DALL-E’nin üçüncü sürümü yayınlandı.

OpenAI, üretken yapay zeka görsel sanat platformu DALL-E’nin üçüncü sürümünü duyurdu; bu sürüm artık kullanıcıların istem oluşturmak için ChatGPT kullanmasına izin veriyor ve daha fazla güvenlik seçeneği içeriyor.

DALL-E metin istemlerini görsellere dönüştürüyor. Ancak DALL-E 2 bile bazı şeyleri yanlış anlayabiliyor, hatta belirli ifadeleri görmezden gelebiliyordu. OpenAI araştırmacıları, en son sürümün bağlamı çok daha iyi anladığını söyledi.

DALL-E 3’ün yeni bir özelliği de ChatGPT ile entegrasyon. ChatGPT’yi kullanarak, birinin DALL-E 3’ü yönlendirmek için kendi ayrıntılı istemini bulması gerekmez; sadece ChatGPT’den bir istem bulmasını isteyebilirler ve sohbet robotu DALL-E 3’ün takip etmesi için bir paragraf yazacak (DALL-E daha uzun cümlelerle daha iyi çalışır). Diğer kullanıcılar da DALL-E için özel fikirleri varsa kendi ipuçlarını kullanabilirler.

DALL-E ekibinin baş araştırmacısı ve başkanı Aditya Ramesh, The Verge’e yaptığı bir demoda ChatGPT’den dağlardaki bir ramen restoranı için bir logo bulmasına yardımcı olmasını istedi. ChatGPT daha sonra daha uzun bir istem yazdı ve DALL-E dört seçenekle geldi. Benim favorim, ramen kar tepeleri, şelale gibi akan et suyu ve bahçe taşları gibi yerde duran salamura yumurtaların olduğu bir dağ görüntüsüydü, ancak geleneksel bir restoran logosundan çok güzel bir ürün için yapılmış bir illüstrasyona benziyordu. OpenAI, sohbet robotuyla kurulan bu bağlantının, daha fazla insanın yapay zeka sanatı yaratmasına olanak tanıdığını, çünkü bir ipucu bulma konusunda çok iyi olmaları gerekmediğini söyledi.

İlk olarak Ocak 2021’de piyasaya sürülen DALL-E, Stability AI ve Midjourney’in diğer metinden görüntüye üreten yapay zeka sanat platformlarından önce geldi. DALL-E 2 2022’de piyasaya sürüldüğünde, OpenAI, DALL-E’nin fotogerçekçi müstehcen görüntüler üretebildiği ve fotoğraf üretirken önyargı gösterdiği yönündeki eleştirilerin ardından platformu kimin kullanacağını kontrol etmek için bir bekleme listesi açtı. Şirket geçen yıl Eylül ayında bekleme listesini kaldırdı ve DALL-E 2’yi piyasaya sürdü.

DALL-E’nin bu yeni sürümü ilk olarak Ekim ayında ChatGPT Plus ve ChatGPT Enterprise kullanıcılarına, ardından da sonbaharda araştırma laboratuvarlarına ve API hizmetine sunulacak. OpenAI, DALL-E 3’ün yayınlanmasını kademelendirmeyi planlıyor, ancak ücretsiz bir genel sürümün ne zaman yayınlanacağı konusunda bir taahhütte bulunmadı.

OpenAI, DALL-E 3’te müstehcen veya potansiyel olarak nefret dolu görüntülerin oluşturulmasını önlemek için sağlam güvenlik önlemleri oluşturma konusunda çok fazla çalışmaya odaklandığını iddia ediyor. OpenAI, harici kırmızı ekiplerle çalıştığını ve açık veya şiddet içeren istemlerden kaçınmak için dil modellerine belirli kelimeleri görmezden gelmeyi öğretmenin bir yolu olan girdi sınıflandırıcılarına güvendiğini söyledi. DALL-E 3 ayrıca istemde özellikle bir isim belirtilmesi koşuluyla kamuya mal olmuş kişilerin görüntülerini yeniden yaratamayacak.

Şirkette politika araştırmacısı olan Sandhini Agarwal, güvenlik önlemlerine “yüksek güven” duyduğunu söyledi ancak modelin sürekli olarak geliştiğini ve mükemmel olmadığını açıkladı. OpenAI temsilcileri bir e-postada DALL-E 3’ün yaşayan sanatçıların tarzında görüntüler üretmeyi reddetmek üzere eğitildiğini söyledi. DALL-E 2’nin aksine, istendiğinde belirli sanatçıların tarzındaki sanatı taklit edebiliyor.

OpenAI, muhtemelen davalardan kaçınmak için, sanatçıların sanatlarını metinden görüntüye yapay zeka modellerinin gelecekteki sürümlerinden çıkarmalarına da izin verecek. İçerik oluşturucular, haklarına sahip oldukları bir görüntüyü gönderebilir ve web sitesindeki bir formda kaldırılmasını talep edebilirler. DALL-E’nin gelecekteki bir sürümü daha sonra sanatçının görüntüsüne ve stiline benzeyen sonuçları engelleyebilir.