銀河通用突破具身機器人核心技術——聰明“腦”指揮靈巧“手”

取藥、掛衣服、開瓶蓋,在日復一日大數據加持的交互學習中,具身大模型機器人訓練出決策的“大腦”和執行的“小腦”,指揮日漸靈巧的“手”,能夠獨立完成越來越多的工作。

北京銀河通用機器人有限公司(以下簡稱“銀河通用”)專注具身智能機器人研發,通過億級仿真數據訓練,幫助機器人走進商超和家庭,將科幻小說中的情節變爲現實。

提升學習能力

具身智能是人工智能的一個發展領域,指一種擁有物理身體的智能系統或機器能夠通過感知和交互形成在環境中實時物理互動的能力。簡單說,就是各種不同形態的機器人在真實的物理環境中獲取信息、理解問題、作出決策,從而執行各種任務。

銀河通用實驗室裡,一場具身機器人的實操演示正在進行中:工作人員在平板電腦上點選一樣物品,雙臂輪式機器人接收到指令,通過“視覺”鎖定貨架上的目標,用右手的吸盤準確抓取,放置到左手兩指夾着的籃子裡。機器人的整套動作一氣呵成,展示了其落地的商業場景——夜間無人值守藥店取藥補藥、無人商超上貨拿貨。

“機器人可以代替人完成從接單到找藥、拿藥、裝袋等一系列流程,打包好交給快遞員。”銀河通用創始人、首席技術官王鶴告訴記者,這款機器人只要使用充電樁充足電就可以應用,電量不足時會自動回充,能夠勝任藥店、超市、工廠配料倉內管理員、理貨員等工作。

機器人“能幹”,靠的是海量數據賦予的泛化抓取能力,並在持續數據注入中,不斷學習應付更復雜的情況。比如,當藥店貨架上最前面一盒藥處於倒放或平放狀態時,機器人右手吸盤會直接吸取正常擺放的第二盒藥,這個過程可能導致第一盒藥掉到地上。能力升級後,機器人可以先用左手將非正常排列的藥盒擺放整齊,再用右手抓取。

“作爲人工智能領域的前沿熱點,具身智能已成爲全球科技競爭的新高地、未來產業的新賽道。在多年深耕人工智能領域的基礎上,我們研發的大模型在視覺理解和語言溝通能力方面比較成熟,對機器人操作的研究也實現了一定泛化性。”身兼北京智源研究院具身智能研究中心主任的王鶴介紹,具身機器人“小腦”交互控制、靈巧操作等技能學習能力,與“大腦”的認知、理解、規劃等能力結合在一起,這就是未來通用機器人的藍圖。

把藍圖變成施工圖,銀河通用正致力於將智能機器人產品應用到更廣泛的商業和家庭場景中。在家庭場景的展示中,銀河通用不斷完善中的“靈巧手”可以打開冰箱拿出水瓶、撿起地上的衣服。

仿真合成數據

作爲一家技術驅動的創新企業,銀河通用最引以爲傲的是其“泛化”能力。“我們研發的任意材質物體抓取技術是成功率突破95%的通用泛化物體抓取技術,在行業中處於領先地位。”王鶴說,公司面向通用機器人持續開展技術攻關,在具身大模型、3D視覺感知和“靈巧手”深度學習算法等領域不斷突破核心技術。

提到機器人,不少人會想到車輛裝配流水線上的機械臂。但機械臂提前計算好工作位置,按程序運作即可,並不具備真正的智能。而具身機器人不僅可移動、更靈巧,還能發現問題、“聽懂”指令,分擔員工在生產線上來回巡查的工作壓力,完成許多任務。這樣的能力需要多模態大模型和具身智能賦予。

此前,具身機器人智能化訓練只能靠人工採集數據。以寫字爲例,工程師用遙控器操作機器人完成全過程,費時費力採集的數據有限,機器人也只是“看起來很厲害”——只能在採集數據的場景中,並且物體、光照等因素絲毫不變的前提下,才能使用一支筆寫字,一旦脫離特定空間,就無法正常工作。

“想讓具身機器人不受環境影響,在常規的背景、合理的光照下都能正常工作,就需要讓其具備類似人類小腦的反應能力。”王鶴舉例,同樣抓一杯水,對人而言,是不假思索的下意識動作;對機器人來說,杯子的形態、材質不同,抓杯動作和角度各異,只有學習得足夠多,才能知道怎樣做,這就需要海量數據訓練出泛化抓取能力。

訓練所需的海量數據從哪兒來?靠工程師採集只是杯水車薪。銀河通用打破陳規、另闢蹊徑,以合成仿真技術合成“靈巧手”物體抓取的大量數據,每個物體合成200條視頻,再從一個物體到一類物體……通過成規模注入數據,訓練機器人的抓取能力。

“我們是國內較早做到泛化物體抓取的企業。用物理仿真器生產的數據訓練機器人學習抓取、放置等技能,是我們獨到的能力。”王鶴說,對機器人本體優化後,使用對仿真環境、算法優化後的數據進行訓練,能夠幫助機器人跨越虛擬到現實的鴻溝。

拓展應用場景

“人形機器人集成人工智能、高端製造、新材料等先進技術,有望成爲繼計算機、智能手機、新能源汽車後的顛覆性產品,將深刻變革人類生產生活方式,重塑全球產業發展格局。”銀河通用聯合創始人姚騰洲告訴記者,公司預計今年將發佈應用於商店超市的輪式人形機器人,計劃於2026年開始量產。

除了輪式人形機器人,銀河通用還在加快“靈巧手”、人形機械腿和遙操設備的研發進程,以及解決雙足人形機器人軟硬件相關技術難題,不斷突破展示場景的應用。

人形機器人能否順利商用,不僅取決於它自身的能力水平,成本也是重要的影響因素。“能抓取從地面到1.8米高空之間物品的機器人,量產後一套成本預計有望控制在5萬元左右。”王鶴透露,這些有客來時接客取貨,沒人來時補貨盤貨,店員可以用語音指派、控制的機器人,價格並不高昂。

“新生事物往往會面對不少挑戰。具身智能是典型的多學科技術交叉行業,做具身機器人需要產業和研究雙輪驅動,既是前沿探索,也能產出學術成果,是很好的產學研聯動。”王鶴告訴記者,當前,銀河通用已在北京、深圳和蘇州三地設有研發中心,不斷髮展壯大算法、軟件、硬件研發團隊。

瞄準行業發展趨勢,銀河通用將不斷提升技術創新能力,持續開發人形機器人“大腦”和“小腦”,增強環境感知、行爲控制、人機交互能力,提升人機交互、靈巧抓取、分揀搬運、智能配送等作業能力,加速大模型訓練迭代和產品應用。同時,銀河通用也將積極拓展應用場景,加快技術迭代速度,降低創新成本。 (經濟日報記者 楊學聰)