Alibaba somutlaştırılmış yapay zeka robot modelini tanıttı: Qwen
Alibaba somutlaştırılmış yapay zeka robot modelini tanıttı: Qwen
Alibaba, büyük dil modellerini robotik eylemlerle birleştiren Qwen-Robot model ailesini tanıttı. Pilot test aşamasındaki sistem, robotların çevreyi algılamasını, komutları yorumlamasını ve fiziksel dünyada otonom hareket etmesini hedefliyor.
Yapay zeka yazılımları ile robotik donanımlar arasındaki sınır giderek daralıyor. Çinli teknoloji grubu Alibaba, büyük dil modellerini gerçek dünya robotik eylemleriyle buluşturan Qwen-Robot model ailesini duyurarak 'somutlaştırılmış yapay zeka' alanında yeni bir adım attı. Alibaba’nın Ar-Ge merkezi Tongyi Laboratuvarı tarafından geliştirilen Qwen-Robot paketi, şu aşamada seçilmiş Alibaba Cloud kurumsal müşterileriyle pilot test sürecinde kullanılıyor. Sistem, yapay zekayı yalnızca metin üreten ya da görsel yorumlayan bir yazılım olmaktan çıkarıp fiziksel ortamlarda çalışan robotlar için karar destek altyapısına dönüştürmeyi amaçlıyor. Qwen-Robot ailesi; robotların yön bulması, nesnelerle etkileşim kurması ve çevrenin nasıl değişebileceğini öngörmesi için tasarlanan üç ayrı uzman modelden oluşuyor.ANLAMAK İLE HAREKET ETMEK ARASINDAKİ FARKAlibaba’ya göre Qwen model ailesi, fiziksel dünyayı anlamada güçlü bir altyapıya sahip. Modeller nesneleri tanıyabiliyor, mekansal ilişkileri analiz edebiliyor, karmaşık görsel talimatları takip edebiliyor ve gerçek dünya ortamları hakkında akıl yürütebiliyor. Örneğin sistem, 'Mutfağa git, kırmızı bardağı bul, al ve rafa koy' gibi çok aşamalı bir komutu anlayabilecek düzeyde çalışıyor. Ancak robotik uygulamalarda asıl zorluk, bu komutları anlamaktan çok fiziksel eyleme dönüştürmekte ortaya çıkıyor.Bir görsel-dil modeli, görevin hangi adımlarla yapılacağını belirleyebilse de robotun motor hareketlerini doğrudan yönetemiyor. Bu nedenle insan dili ve görsel algının, robot kolları, hareket sistemleri ve sensörlerle uyumlu fiziksel komutlara dönüştürülmesi gerekiyor. Robot eğitimi için gereken veriler de metin verilerinden farklı bir yapıya sahip. Navigasyon sistemleri, endüstriyel robot kolları, otonom araçlar ve kameralardan gelen veriler farklı formatlarda toplanıyor. Bu verileri tek bir havuzda birleştirmek, çoğu zaman performansı artırmak yerine sistem içinde uyumsuzluklara yol açabiliyor.ÜÇ AYRI MODELLE ROBOTİK GÖREV DAĞILIMIAlibaba, bu sorunu çözmek için Qwen-Robot Suite çatısı altında üç ayrı model geliştirdi. Qwen-RobotNav, robotların karmaşık talimatları takip etmesi, hedef noktalara gitmesi, dinamik hedefleri izlemesi ve otonom sürüş operasyonlarını desteklemesi için navigasyona odaklanıyor. Qwen-RobotManip ise fiziksel etkileşim ve nesne kontrolü için geliştirildi. Model, farklı robotik sistemlerden toplanan geniş eğitim verileriyle robotların nesneleri kavramasını, hareket ettirmesini ve hassas biçimde manipüle etmesini sağlamak üzere tasarlandı.Üçüncü model olan Qwen-RobotWorld, robotların çevrede meydana gelebilecek değişimleri öngörmesine yardımcı oluyor. Bu yapı, robotların yapacakları eylemlerin fiziksel sonuçlarını tahmin edebilmesi için bir tür dünya modeli görevi görüyor. Alibaba’nın hedefi, bu üçlü mimariyle robotların talimatları anlamasını, nesnelerle etkileşim kurmasını, karmaşık ortamlarda bağımsız hareket etmesini ve gerçek dünyada daha isabetli kararlar almasını sağlamak.ROBOT KÖPEKLE SAHA TESTİAlibaba, Qwen-Robot’un saha performansını NVIDIA Jetson Thor donanımı ve tek bir düşük çözünürlüklü kamera kullanan Unitree Go2 dört ayaklı robot üzerinde gösterdi. Robot, önceden yüklenmiş bir harita olmadan, yalnızca sözlü talimatları izleyerek yabancı bir dairede birden fazla oda arasında hareket etti. Şirketin paylaştığı bilgilere göre sistem bu işlemi 196 milisaniyelik çıkarım gecikmesiyle gerçekleştirdi. Bu düşük gecikme, fiziksel dünyada hareket eden robotlar için karar alma ve tepki verme süresi açısından kritik görülüyor. Qwen-RobotManip modeli ise nesne elleçleme ve etkileşim görevlerini kapsayan 38 bin saatten fazla açık kaynak veri üzerinde eğitildi. Model, RoboChallenge gerçek dünya robotik kıyaslama testinin genelci kategorisinde 59,83 işlem puanı ve yüzde 45 görev başarı oranıyla en yüksek puanı aldı.QWEN-ROBOTCLAW VE CHAT2ROBOT DEVREDEAlibaba, Qwen modellerinin fiziksel dünya araçlarıyla birlikte çalışmasını sağlamak amacıyla Qwen-RobotClaw adlı robotik ajan çerçevesini de tanıttı. Bu yapı, robotların yalnızca komutları yorumlamasını değil, çevredeki işaretleri ve fiziksel koşulları dikkate alarak rota ve görev kararları almasını hedefliyor. Yapılan bir testte, tuvalet arayan robot ajan kapıdaki 'arızalı' işaretini görsel olarak algıladı ve dış müdahale olmadan başka bir rotaya yöneldi. Bu örnek, sistemin yalnızca yön bulma değil, çevresel bilgiye göre karar verme yeteneğini de göstermesi açısından öne çıktı. Alibaba ayrıca geliştiricilerin somutlaştırılmış yapay zeka etkileşimlerini test edebilmesi için Chat2Robot adlı tarayıcı tabanlı platformu da açık kaynaklı olarak kullanıma sundu.KÜRESEL REKABET DONANIMA TAŞINIYORAlibaba’nın Qwen-Robot hamlesi, yapay zeka rekabetinin yazılım modellerinin ötesine geçerek robotik donanımlara taşındığı bir döneme denk geliyor. ABD’de Google DeepMind, Gemini Robotics altyapısını geliştirirken Nvidia da Cosmos, Isaac ve GR00T projeleriyle robotik ekosistemini büyütüyor. Physical Intelligence, Skild AI ve Figure AI gibi girişimler de genel amaçlı robotik zeka geliştirmeye odaklanıyor. Çin tarafında ise Alibaba’nın yanı sıra Tencent, Unitree, AgiBot, UBTech, Galbot, Spirit AI, GigaAI, Xpeng ve Xiaomi gibi şirketler somutlaştırılmış yapay zeka alanında yatırımlarını artırıyor. Çin’in üretim ve imalat ölçeği, robotik sistemlerin ticarileşmesi açısından önemli bir avantaj olarak görülüyor. Alibaba’nın Qwen-Robot paketi de bu rekabette yapay zeka modellerini fiziksel dünyada görev yapabilen sistemlere dönüştürme hedefinin yeni örneklerinden biri olarak öne çıkıyor.
Yorumunuz başarıyla alındı, inceleme ardından en kısa sürede yayına alınacaktır.