Aslan, balina ve dinozor olmak üzere üç plastik figürün bulunduğu masanın önünde tek kollu bir robot duruyordu. Bir mühendis robota “Soyu tükenmiş hayvanı al” komutunu verdi. Robot bir anlığına vızlama sesi çıkardı sonra uzanıp pençesiyle dinozoru aldı.

SESSİZ DEVRİM GİDEREK YAKLAŞIYOR

Geçtiğimiz hafta Kaliforniya eyaletinin Mountain View bölgesinde Google’ın robotik bölümünde podcast’im için yaptığım bir röportaj sırasında katıldığım bu gösteri, yakın zamana kadar imkânsızdı. Robotlar daha önce hiç görmedikleri nesneleri doğru bir şekilde ayırt edemiyorlardı ve ‘soyu tükenmiş hayvan’dan ‘plastik dinozor’a mantıksal bir geçişi nasıl yapacakları konusunda hiçbir yeteneğe sahip değillerdi.

Robotikte, ChatGPT, Bard ve diğer sohbet robotlarına güç veren yapay zeka sisteminin aynısı olan, ‘büyük dil modelleri’ olarak adlandırılan son gelişmeler kullanılarak ilerletilen sessiz bir devrim giderek yaklaşıyor.

Google yakın zamanda robotlarına en son teknolojiye sahip dil ​​modellerini yüklemeye başladı ve onlara yapay zekaların eşdeğer sistemlerini kazandırdı. Bu gizli proje, robotları çok daha akıllı hale getirdi ve onlara yeni anlama ve problem çözme güçleri kazandırdı.

Google’ın RT-2 adı verilen en yeni robot modelinin özel gösterimi sırasında bu ilerlemeye bir göz attım. Cuma günü tanıtılan model, Google yöneticilerinin robotların yapım ve programlanma biçiminde büyük bir sıçrama olarak tanımladığı geleceğe doğru ilk adımı teşkil ediyor.

Google’a bağlı DeepMind’ın robotik başkanı Vincent Vanhoucke, “Bu değişikliğin bir sonucu olarak tüm araştırma programımızı yeniden düşünmek zorunda kaldık. Zira daha önce üzerinde çalıştığımız pek çok şey tamamen geçersiz kılındı” diye anlattı.

Kaliforniya Üniversitesi’nden robotik profesörü Ken Goldberg, robotların hala insan düzeyindeki el becerisi konusunda yetersiz kaldığını ve bazı temel görevlerde başarısız olduğunu, ancak Google’ın robotlara yeni akıl yürütme ve doğaçlama becerileri kazandırmak için yapay zeka dil modellerini kullanmasının umut verici bir atılımı temsil ettiğini söyledi.

Goldberg “Çok etkileyici olan, anlambiliminin robotlarla nasıl ilişkilendirdiğidir. Bu robotik için çok heyecan verici” ifadelerini sözlerine ekledi. Bunun büyüklüğünü anlamak için robotların geleneksel olarak nasıl oluşturulduğu hakkında biraz bilgi sahibi olmak faydalı olacaktır.

Yıllar boyunca, Google ve diğer şirketlerdeki mühendislerin robotları mekanik bir görevi (örneğin hamburger çevirmek) yapması için eğitme yöntemi, onları belirli bir komut listesiyle programlamaya dayanıyordu. Daha sonra mühendisler doğru sonuca ulaşıncaya kadar her seferinde komut ayarlamaları yaparak robota bu görevi tekrar ettiriyordu.

Bu yaklaşım bazı sınırlı kullanımlarda işe yaradı, ancak robotları bu şekilde eğitmek yavaştır ve yoğun emek gerektirir zira gerçek dünya testlerinden çok sayıda veri toplanmasını gerektirdi. Eğer bir robota yeni bir şey yapmayı (mesela hamburger yerine krep çevirmeyi) öğretmek istiyorsanız onu genellikle sıfırdan programlamanız gerekirdi.

Kısmen bu sınırlamalardan dolayı robotik yapılara dayalı robotlar, yazılım tabanlı olanlara göre daha yavaş gelişti. ChatGPT’nin yapımcısı OpenAI, yavaş ilerleme ve yüksek kaliteli eğitim verilerinin eksikliği nedeniyle robot ekibini 2021’de dağıttı. 2017 yılında Google’ın ana şirketi Alphabet, Boston Dynamics robotik yan kuruluşunu sattı.

Ancak son yıllarda Google mühendislerinin aklına ‘Robotları tek seferde tek bir görevi yapacak şekilde programlamak yerine, geniş bir yelpazedeki internet komut dosyaları üzerinde eğitilmiş yapay zeka dil modellerini kullanarak yeni beceriler edinmeye teşvik edersek ne olur?’ fikri geldi.

"BU DİL MODELLERİ İKİ YIL ÖNCE KEŞFEDİLDİ"

Şarku’l Avsat’ın The New York Times’tan aktardığına göre Google çalışanı Araştırma Bilimci Karol Hausman, "Bu dil modellerini iki yıl önce keşfetmeye başladılar ve ardından onlarla robotlar arasında bir bağlantı kurmaya başladılar” dedi.

Google, geçtiğimiz yıl duyurduğu PaLM-SayCan projesiyle robotik ve dil modellerini birleştirme çalışmalarına başladı. Proje belli bir seviyede ilgi gördü ancak robotların görüntüleri analiz etme yeteneğinden yoksun olması nedeniyle etkinliği sınırlıydı ve bu, eğer dünyayı dolaşacaklarsa sahip olmaları gereken bir beceriydi. Bu robotlar çeşitli görevleri yerine getirmek için ayrıntılı ve yapılandırılmış komutlar geliştirmeyi başardılar ancak bu komutları eyleme dönüştüremediler.

Yeni Google robotu RT-2 ise bunu yapabiliyor. Bu nedenle şirket bu robota ‘vizyon-dil-eylem’ modeli veya ‘yalnızca etrafındaki dünyayı görüp analiz etmekle kalmayıp aynı zamanda bir robota nasıl hareket edeceğini öğretebilen bir yapay zeka sistemi’ adını veriyor.

Model bunu, robotun hareketlerini bir sayı dizisine (kodlama adı verilen bir süreç) dönüştürerek ve bu kodları dil modelinde kullanılan aynı eğitim verilerine dahil ederek yapıyor. Sonuç olarak, tıpkı Bard’ın bir şiirdeki veya tarihi konudaki kelimeleri öğrenmesi veya ChatGPT’nin tahmin etmesi gibi, RT-2 de bir robot kolunun bir topu yakalamak veya bir paketi çöpe atmak için nasıl hareket etmesi gerektiğini tahmin edebiliyor.

Hausman “Başka bir deyişle, bu model robotların dilini konuşmayı öğrenebilir” diyor.

Bir saat süren gösteride blog ortağım ve ben RT-2’nin bir dizi etkileyici görevi yerine getirmesini izledik. Başarılı görevlerde karmaşık komutlar yerine getirildi. Bunlardan birinde robot, bir Volkswagen otobüsünün modelini bulup birkaç metre ötedeki minyatür bir Alman bayrağına götürerek ‘Volkswagen’i Alman Bayrağı’na Taşı’ işlemini başardı.

Robot ayrıca İngilizce dışındaki dillerdeki talimatları takip etme ve hatta ilgili ilkeler arasındaki teorik ilişkileri bulma yeteneğini de gösterdi. RT-2’nin topu yakalamasını istediğimde kendisine ‘Lionel Messi’yi yakala’ dedim ve o da ilk denemede bu görevi yerine getirmeyi başardı.

Ancak robot mükemmel değildi ve önündeki masanın üzerine konulan meşrubatın aromasını yanlış tanımladı. (Şişe limonla tatlandırılmıştı ama robot portakalı olduğunu belirtti) Başka bir denemede, masada ne tür bir meyve olduğu sorulduğunda robot ‘beyaz’ yanıtı verdi ancak cevap muzdu. Bir Google sözcüsü, robotun Wi-Fi bağlantısı bir süredir kesik olduğu için önceki test sorusuna verilen yanıtı kullandığını söyleyerek hatanın nedenini açıkladı.

Google şu anda RT-2’yi daha büyük ölçekte satmayı veya kullanıma sunmayı planlamıyor. Ancak araştırmacılar, dil modelleriyle donatılmış bu yeni makinelerin, nihayet eğlenceli numaraların ötesine geçen görevleri yerine getirmede son derece etkili olacağına inanıyor. Bu robotlar, örneğin depolarda, tıp alanında, hatta çamaşır katlama, bulaşık makinesini boşaltma veya evi toplama gibi ev işlerinde yardımcı olarak çalışabilirler.

Vincent Vanhoucke “Bu gelişme, robotların ofis, ev gibi insanın var olduğu ortamlarda ve fiziksel görev gerektirebilecek her yerde kullanılmasının kapısını aralıyor” ifadeleri ile sözlerini sonlandırdı. (şarkulavsat)

Yapay zeka devriminin diğer yüzü

 

OpenAI, ChatGPT'nin şirketlere yönelik sürümünü yayınlayacak

 

Üç başkandan şok yapay zeka yorumu!