2025-03-12
3月5日上午,十四屆全國人大三次會議開幕,國務(wù)院政府工作報告中,“具身智能” 首次被提及,明確提出要培育生具身智能、6G等未來產(chǎn)業(yè)。這一舉措為具身智能的發(fā)展注入了強大的政策動力,預示著具身智能將從理論研究邁向更廣闊的產(chǎn)業(yè)化、規(guī)?;l(fā)展階段。
公司充分發(fā)揮自身技術(shù)優(yōu)勢與創(chuàng)新能力,積極融入國家戰(zhàn)略布局與北京等地方發(fā)展規(guī)劃,在具身智能領(lǐng)域持續(xù)深耕,努力構(gòu)建具身智能通用AI Agent,推動具身智能技術(shù)從實驗室走向?qū)嶋H應(yīng)用,助力產(chǎn)業(yè)升級。
邁入工業(yè)應(yīng)用的關(guān)鍵技術(shù)
目前AI集中在內(nèi)容、創(chuàng)作、客服、編程等桌面應(yīng)用,在工業(yè)領(lǐng)域應(yīng)用較少,原因在于工業(yè)場景是3D空間,而目前絕大部分大模型為語言、圖形、視頻等2D模型,在工業(yè)場景應(yīng)用時存在空間計算鴻溝。
具身智能將AI深度嵌入3D物理環(huán)境,在理解真實世界方面具備更全面的感知、理解、交互與決策能力,重新定義人、機器與真實世界、虛擬世界之間的關(guān)系,擁有更強的泛化能力和涌現(xiàn)特性,極大地拓展了AI認知世界的深度與廣度,使其能夠做出更為科學、合理且適應(yīng)性強的決策。
人形機器人是具身智能的關(guān)鍵載體
近一段時間,以VLA(視覺-語言-行為)等為代表的具身智能大模型技術(shù)開始與人形機器人本體融合、進化,讓人形機器人大腦、小腦加速進化,讓人形機器人更加聰明,成為具生智能的關(guān)鍵載體,這是一場從“機械軀殼”到“數(shù)字生命”的進化革命,讓門檻大幅降低、場景快速增多。
基于大模型的模仿學習技術(shù)讓人形機器人通過觀察和模仿人類的行為,直接從人類的示范中學習動作和技能,快速掌握一些復雜的操作,省去了過往復雜且耗時的編程工作。下一步,基于海量3D數(shù)據(jù),通過世界模型+具身智能,機器人可以創(chuàng)建對世界運作方式的內(nèi)部表征,并具備行動后果的推理能力,從而顯著提升對真實世界的感知、推理、執(zhí)行與預測能力,使機器人認識和理解3D世界,并能夠像人類一樣進行推理和規(guī)劃,不僅可以適應(yīng)復雜多變的環(huán)境和任務(wù)需求,更為重要的是,具備自主決策、行動與操作能力,這是人形機器人從動起來,到跑起來,再到用起來的關(guān)鍵。
規(guī)?;l(fā)展的關(guān)鍵平臺
目前產(chǎn)業(yè)共性問題是缺乏通用平臺。缺乏算法(大腦、小腦)通用開發(fā)平臺,多數(shù)企業(yè)都要從0到1獨立研發(fā),導致重復投入和資源分散,影響成本更影響效率。
缺乏通用3D數(shù)據(jù)平臺,高質(zhì)量3D數(shù)據(jù)集稀缺,3D數(shù)據(jù)采集設(shè)備未普及,3D數(shù)據(jù)獲取成本高、標準化程度低,制約具身智能深度訓練。缺乏通用標準認證平臺,硬件接口、通信協(xié)議、數(shù)據(jù)格式等缺乏統(tǒng)一規(guī)范,不同廠商的機器人本體構(gòu)型與軟件架構(gòu)互不兼容,具身智能難以跨本體,制約規(guī)?;瘧?yīng)用。
為實現(xiàn)具身智能在各領(lǐng)域、各行業(yè)的規(guī)模化落地,天娛數(shù)科將具身智能通用AI Agent列為研發(fā)重點,以Behavision命名的AI Agent集“算法+數(shù)據(jù)+算力”三位一體,可實現(xiàn)空間智能MaaS平臺+3D數(shù)據(jù)平臺+云邊端算力協(xié)同,打造通用的大腦(感認知-決策-控制一體化的具身智能大模型)+小腦(技能模型)開發(fā)平臺,實現(xiàn)跨本體互通互用,讓每家機器人本體企業(yè)即插即用,用通用AI Agent推動人形機器人和泛智能機器人產(chǎn)業(yè)邁入“安卓時刻”。
目前,天娛數(shù)科自研的為AI Agent提供多模態(tài)交互感知及復雜任務(wù)處理能力的天星基座大模型,以及面向3D智能領(lǐng)域的行業(yè)大模型“智者千問”兩款大模型已通過中央網(wǎng)信辦備案。3D數(shù)據(jù)平臺已積累超百萬組3D數(shù)據(jù)和50萬組多模態(tài)數(shù)據(jù),端側(cè)算力已集成在視覺模組中。