Google DeepMind, Gemini 2.0 ile Astra projesinde geliştirilmiş işlevler sunuyor

uzman

Active member
Katılım
25 Eyl 2020
Mesajlar
52,597
Puanları
36
Şirketin yapay zeka araştırma kolu Google DeepMind, bu yıl I/O'da Project Astra'yı tanıttı. Şimdi, altı aydan uzun bir süre sonra, teknoloji devi yapay zeka (AI) aracısında yeni yetenekler ve iyileştirmeler duyurdu. Gemini 2.0 AI modellerini temel alan cihaz artık birden fazla dilde iletişim kurabiliyor, birden fazla Google platformuna erişebiliyor ve gelişmiş depolama alanına sahip. Araç hâlâ test aşamasında ancak Mountain View tabanlı teknoloji devi, Project Astra'yı Gemini uygulamasına, Gemini AI asistanına ve hatta gözlük gibi form faktörlerine entegre etmek için çalıştığını söyledi.

Google, Project Astra'ya yeni özellikler ekliyor


Project Astra, OpenAI'nin Görüş Moduna veya Meta Ray-Ban akıllı gözlüklerine benzer işlevlere sahip genel amaçlı bir AI aracısıdır. Kullanıcının çevresini görmek ve görsel verileri işleyerek onlarla ilgili soruları yanıtlamak için kamera donanımına entegre edilebilir. Ek olarak, AI aracısının sınırlı belleği vardır ve bu, kamera aracılığıyla aktif olarak görüntülenmediğinde bile görsel bilgileri hatırlamasına olanak tanır.

Google DeepMind, bir blog yazısında ekibin Mayıs ayındaki sunumundan bu yana yapay zeka aracısını geliştirmek için çalıştığını vurguladı. Gemini 2.0 ile Project Astra artık birçok yükseltme aldı. Artık birden fazla dilde ve karışık dillerde iletişim kurabiliyor. Şirket artık aksanları ve alışılmadık kelimeleri daha iyi anladığını söyledi.

Şirket ayrıca Astra projesinde araçların kullanımını da tanıttı. Artık karmaşık soruları yanıtlamak için Google Arama, Lens, Haritalar ve Gemini'ye güvenebilir. Örneğin, kullanıcılar bir yer işaretini görüntüleyebilir ve AI temsilcisinden evlerine giden rotayı göstermesini isteyebilir. Bu, nesneyi tanıyabilir ve kullanıcıyı eve sözlü olarak yönlendirebilir.

AI aracısının hafıza işlevi de iyileştirildi. Mayıs ayında Project Astra yalnızca son 45 saniyeye ait görsel bilgileri depolayabiliyordu, ancak bu artık 10 dakikalık oturum içi depolamaya genişletildi. Ayrıca daha kişiselleştirilmiş yanıtlar sunmak için önceki konuşmaları da hatırlayabilir. Son olarak Google, aracının artık konuşmayı insan konuşmasının gecikmesinde anlayabildiğini ve araçla etkileşimi daha insani hale getirdiğini iddia ediyor.
 
Üst