Grok-1.5 Vision, metinlerin yanı sıra belgeler, fotoğraflar, ekran görüntüleri, grafikler ve diyagramları da anlayabiliyor.
Elon Musk’ın yapay zeka girişimi xAI, yeni bir çok modlu model olan Grok-1.5 Vision’u tanıttı. Grok-1.5 Vision, önceki Grok-1 modelinin özelliklerini geliştirerek metinlerin yanı sıra belgeler, fotoğraflar, ekran görüntüleri, grafikler ve diyagramları da anlama yeteneğine sahip.
Kurumun verdiği bilgilere göre, bu model akıllı uzamsal-zamansal algılama yetenekleriyle donatılmış. Grok-1.5 Vision, karmaşık metinler üzerinde mantıksal çıkarımlar yapabilme, bilimsel resimleri yorumlayabilme ve görsel içerikle insan benzeri bir şekilde etkileşim kurabilme yeteneğiyle dikkat çekiyor. Ayrıca, multidisipliner muhakeme alanında uzmanlaşarak diğer modellerle rekabet ediyor.
Şirketin sunduğu bilgilere göre, Grok-1.5 Vision, şirketin gerçek dünya uygulamalarına dayalı ölçütü olan RealWorldQA’da rakiplerini geride bırakıyor. Karşılaştırma tablosunda, Grok-1.5 Vision’un rakipleri arasında GPT-4V, Claude, 3Sonnet, Claude 3 Opus ve Gemini Pro 1.5 gibi modeller bulunuyor.
Grok-1.5 Vision için çeşitli kullanım örnekleri paylaşılmış durumda. Bu örnekler arasında, çocuk çizimlerini öykülere dönüştürme, bir grup nesne arasında en büyük olanı belirleme, araç sürücülerine manevra konusunda destek sağlama, tabloları CSV formatına dönüştürme, çürümüş bir ahşap masayı tespit ederek değiştirilmesini talep etme gibi işlevler bulunuyor. Ayrıca, Grok-1.5 Vision, internet meme’lerinin bağlamını açıklama konusunda da kullanıcılara yardımcı olabiliyor.
Geçtiğimiz ay xAI, Grok-1 ve Grok-1.5’in matematik ve kodlama yeteneklerini artıran Grok 1.5 LLM’i duyurmuştu. Grok 1.5 LLM ayrıca daha uzun metinleri işleyebilme yeteneğine sahipti. Bu sayede, bu büyük dil modeli yanıtlarının doğruluğunu artırmak için daha geniş veri kaynaklarından faydalanabiliyordu. Ayrıca, geçen ay Elon Musk’ın yapay zekası Grok, açık kaynak olarak yayınlandı. Grok-1.5V’nin ise X’in Premium+ hizmetinden yararlanan erken aşama test kullanıcılarına yakında sunulması planlanıyor.