Google I/O 2024: DeepMind, Project Astra ile gerçek zamanlı bilgisayar görüşü tabanlı yapay zeka etkileşimi sunuyor

uzman · 16 May 2024

Google I/O 2024 açılış oturumunda şirket, bir süredir üzerinde çalıştığı etkileyici yapay zeka (AI) model ve araç yelpazesini sergileme fırsatı buldu. Tanıtılan özelliklerin çoğu önümüzdeki aylarda genel önizlemeye sunulacak. Ancak etkinlikte sunulan en ilginç teknoloji bir süre daha satışa sunulmayacak. Google DeepMind tarafından geliştirilen bu yeni AI asistanına Project Astra adı verildi ve bilgisayar görüşüne dayalı gerçek zamanlı AI etkileşimi gösterdi.

Project Astra, mevcut sohbet robotları için son derece gelişmiş görevleri gerçekleştirebilen bir yapay zeka modelidir. Google, üretime hazır modellerini eğitmek için en büyük ve en güçlü yapay zeka modellerini kullandığı bir sistemi takip ediyor. Şu anda eğitilmekte olan bir yapay zeka modelinin böyle bir örneği, Google DeepMind kurucu ortağı ve CEO'su Demis Hassabis tarafından vurgulandı ve Astra projesini tanıttı. Lansmanında şunları söyledi: “Bugün, Project Astra adını verdiğimiz, AI asistanlarının geleceği hakkında bazı heyecan verici yeni gelişmeleri paylaşabiliriz. “Uzun süredir günlük yaşamda gerçekten yardımcı olabilecek genel amaçlı bir AI aracısı oluşturmak istiyorduk. “

Hassabis ayrıca şirketin bu tür yapay zeka ajanlarına getirdiği bazı gereksinimleri de sıraladı. Karmaşık ve dinamik gerçek dünya ortamını anlamalı ve buna yanıt vermeli, bağlamı geliştirmek ve harekete geçmek için gördüklerini hatırlamaları gerekir. Ayrıca yeni beceriler öğrenebilmesi ve gecikmeden sohbete devam edebilmesi için eğitici ve kişisel olması gerekir.

Bu açıklamayla DeepMind CEO'su, bir kullanıcının kamera uygulaması açıkken akıllı telefonunu tuttuğunu gösteren bir demo Haber sundu. Kullanıcı bir yapay zeka ile konuşur ve yapay zeka, çeşitli vizyona dayalı soruları anında yanıtlar ve yanıtlar. Yapay zeka ayrıca görsel bilgileri bağlam için kullanabildi ve üretken beceriler gerektiren ilgili soruları yanıtlayabildi. Örneğin, kullanıcı yapay zekaya bazı boya kalemleri gösterdi ve yapay zekadan bunu aliterasyon kullanarak tanımlamasını istedi. Chatbot hiç vakit kaybetmeden şöyle diyor: “Yaratıcı boya kalemleri mutlu bir şekilde resim yapıyor.”

Ama hepsi bu değildi. Videonun ilerleyen kısımlarında kullanıcı, bazı binaları ve sokakları görebileceğiniz pencereyi işaret ediyor. Mahalle sorulduğunda yapay zeka hemen doğru cevabı veriyor. Bu, yapay zeka modelinin bilgisayarlı görme işlemesinin gücünü ve eğitim için gerekli olan devasa görsel veri setini gösteriyor. Ancak belki de en ilginç gösteri, yapay zekaya kullanıcının gözlüklerinin sorulmasıydı. Birkaç saniyeliğine ekranda kısa bir süre belirdiler ve ekrandan çoktan ayrılmışlardı. Yine de yapay zeka konumunu hatırlayabildi ve kullanıcıyı oraya yönlendirebildi.

Project Astra'nın genel veya özel önizlemesi mevcut değildir. Google hala model üzerinde çalışıyor ve AI özelliğinin kullanım örneklerini bulması ve bunu kullanıcılara nasıl sunacağına karar vermesi gerekiyor. Bu gösteri yapay zekanın şimdiye kadarki en gülünç başarısı olabilirdi, ancak OpenAI'nin bir gün önce düzenlediği bahar güncelleme etkinliği, bu başarının bir kısmını ortadan kaldırdı. OpenAI, etkinliği sırasında, yapay zekanın daha insani görünmesini sağlayan benzer yetenekler ve duygusal sesler sergileyen GPT-4o'yu tanıttı.

Google I/O 2024: DeepMind, Project Astra ile gerçek zamanlı bilgisayar görüşü tabanlı yapay zeka etkileşimi sunuyor

uzman

Active member