2025-09-17
在人工智能、具身智能與人形機器人等前沿科技加速演進的當(dāng)下,技術(shù)突破與產(chǎn)業(yè)落地的協(xié)同銜接已成為行業(yè)發(fā)展的核心命題。9月17日,“2025具身智能全球硬科技發(fā)展大會”在天津盛大啟幕。全球頂尖專家、學(xué)者與企業(yè)代表齊聚于此,圍繞 “技術(shù)攻堅突破” 與 “場景落地實踐” 兩大核心議題展開深度交流,共繪具身智能生態(tài)化發(fā)展新藍圖。天娛數(shù)科受邀參會,集團首席數(shù)據(jù)官吳邦毅發(fā)表《Behavision:通用具身智能與物理世界的交互基座》主題演講。演講從產(chǎn)業(yè)演進規(guī)律切入,深入拆解行業(yè)核心瓶頸,系統(tǒng)闡述解決方案,全面解碼天娛數(shù)科的技術(shù)布局與實踐思考,為行業(yè)發(fā)展提供了兼具理論深度與落地價值的經(jīng)驗借鑒。
“當(dāng)前人形機器人產(chǎn)業(yè)正深陷‘四缺’困境:缺乏算法通用開發(fā)平臺,導(dǎo)致企業(yè)重復(fù)投入研發(fā)資源;缺乏通用3D數(shù)據(jù)平臺,直接制約具身智能的高效訓(xùn)練;缺乏標(biāo)準(zhǔn)認證平臺,造成產(chǎn)品兼容性差、生態(tài)協(xié)同受阻;缺乏場景測試與人才培養(yǎng)平臺,則進一步阻礙技術(shù)從實驗室走向產(chǎn)業(yè)實踐?!眳前钜阍谘葜v中直指行業(yè)痛點。
為破解行業(yè)困局,天娛數(shù)科打造了Behavision空間智能MaaS平臺,其核心邏輯為“世界感知—時空推理—泛化執(zhí)行”。作為整合數(shù)據(jù)與算法能力的核心載體,平臺的關(guān)鍵突破在于構(gòu)建了融合“傳感”(感知識別)、“大腦”(認知決策)與 “小腦”(運動執(zhí)行)的通用支撐體系,推動人形機器人“腦體協(xié)同”這一行業(yè)瓶頸的攻克與發(fā)展。
破解人形機器人產(chǎn)業(yè)困局,數(shù)據(jù)是根基。吳邦毅表示:“天娛數(shù)科已構(gòu)建起全國領(lǐng)先的高質(zhì)量3D與多模態(tài)數(shù)據(jù)體系,公司自建專業(yè)級3D動捕與多模態(tài)數(shù)據(jù)采集基地,累計沉淀150萬條3D數(shù)據(jù)、65萬條多模態(tài)數(shù)據(jù),其中包含20萬條機器人任務(wù)訓(xùn)練專業(yè)數(shù)據(jù),從基礎(chǔ)的‘抓取、放置’到復(fù)雜的空間理解和大小腦協(xié)同,覆蓋生活服務(wù)、高端制造、智慧醫(yī)療等關(guān)鍵場景?!?/span>
吳邦毅認為:“物理AI的落地,始于對物理世界的深刻理解。機器要‘會做事’,必先‘懂物理’——既要明晰物體的幾何結(jié)構(gòu)、材質(zhì)硬度、重心分布,也要掌握門如何轉(zhuǎn)動、抽屜如何滑動、零件如何拼接的運動規(guī)律與交互邏輯?!碧鞀蕯?shù)科正是以3D鉸接數(shù)據(jù)為核心,遵循“物理真實性、語義可理解性、場景泛化性”三大核心標(biāo)準(zhǔn):通過毫米級光學(xué)動捕設(shè)備與三維掃描技術(shù),精準(zhǔn)還原物體的幾何結(jié)構(gòu)、表面紋理及動態(tài)交互規(guī)則,為數(shù)據(jù)賦予可信賴的“物理骨架”;依托3D鉸接數(shù)據(jù),對門、抽屜、機械臂等可交互物體的運動關(guān)節(jié)、自由度、受力反饋等屬性進行細粒度標(biāo)注,賦予數(shù)據(jù)理解交互邏輯的“語義靈魂”。如同給AI植入了“物理直覺”,讓機器不再將“門”僅視作一組三維坐標(biāo),而是理解其“可繞合頁旋轉(zhuǎn)、需施加推力開啟”的功能本質(zhì),為后續(xù)的精準(zhǔn)操作奠定認知基礎(chǔ)。
目前,3D鉸接數(shù)據(jù)已成功入選《北京市行業(yè)高質(zhì)量數(shù)據(jù)集典型案例》。此外,公司“人形機器人空間6D動捕長程數(shù)據(jù)”等核心數(shù)據(jù)集已在全國多地數(shù)據(jù)交易平臺上架,推動高質(zhì)量數(shù)據(jù)的市場化流通與產(chǎn)業(yè)共享。
有了高質(zhì)量數(shù)據(jù),算法則是激活價值的“引擎”。算法支撐層面,天娛數(shù)科以自研備案大模型矩陣為核心驅(qū)動力,天星基座大模型、3D智能領(lǐng)域“智者千問”行業(yè)大模型及智慧廣告大模型形成協(xié)同效應(yīng),結(jié)合Embodied Chain-of-Thought Reasoning (ECoT) for VLA算法,讓人形機器人可快速學(xué)習(xí)復(fù)雜動作序列與操作邏輯。
通用大模型與垂類大模型的融合,破解了傳統(tǒng)算法“通用則不精準(zhǔn)、精準(zhǔn)則難泛化”的矛盾。大模型保障人形機器人對任務(wù)目標(biāo)、場景環(huán)境的通用理解與決策,VLA算法則聚焦操作細節(jié)的精準(zhǔn)控制,使人形機器人既能“看懂”復(fù)雜場景需求,又能“做好”精細操作動作。
數(shù)據(jù)與算法的價值落地,最終要靠平臺規(guī)?;瘜崿F(xiàn)。天娛數(shù)科Behavision 空間智能MaaS 平臺作為數(shù)據(jù)與算法的整合核心,通過建立“傳感”(感知識別)、“大腦”(認知決策)與 “小腦”(運動執(zhí)行)一體化的通用支撐體系,打通人形機器人的“腦體協(xié)同”堵點。
平臺創(chuàng)新性搭建原子技能庫,針對輪式、腿足式、多足式人形機器人及單/多軸機械臂等不同形態(tài)設(shè)備,梳理出“移動、抓取、旋轉(zhuǎn)、協(xié)同”等多種原子技能,形成可快速復(fù)用的動作“模板庫”。當(dāng)面臨新任務(wù)時,由傳感模塊獲取環(huán)境與目標(biāo)信息并完成空間感知與語義理解,“大腦”結(jié)合大模型算法生成決策方案,“小腦”則從原子技能庫中調(diào)用適配模塊,實現(xiàn)多場景任務(wù)的快速調(diào)度與高效執(zhí)行。這種“感知-決策-執(zhí)行”閉環(huán),推動人形機器人從1.0的“程序演示”階段躍遷至3.0的“精準(zhǔn)感知+自主決策+高效執(zhí)行”智能新階段。
更關(guān)鍵的是,Behavision平臺通過3D鉸接數(shù)據(jù)的深度應(yīng)用,成功跨越物理AI的“數(shù)據(jù)鴻溝”。吳邦毅表示“該數(shù)據(jù)覆蓋外觀(幾何紋理)、結(jié)構(gòu)(關(guān)節(jié)連接)、物理屬性(質(zhì)量、摩擦系數(shù))、語義(功能用途)四大維度,完整標(biāo)注物體的‘是什么、怎么動、有什么用’,有效填補了傳統(tǒng)數(shù)據(jù)缺少物理屬性、缺功能語義的空白?!边@意味著AI不再是“看得到卻不懂”的“門外漢”,而是能理解“椅子可坐、門可推開、開關(guān)可按”的參與者。
從數(shù)據(jù)筑基到算法突破,從平臺落地到產(chǎn)業(yè)賦能,天娛數(shù)科通過Behavision體系的構(gòu)建,形成了“數(shù)據(jù)-算法-平臺-場景”的完整產(chǎn)業(yè)閉環(huán)。在具身智能生態(tài)化發(fā)展的浪潮中,這種以高質(zhì)量數(shù)據(jù)為核心、以協(xié)同平臺為紐帶的發(fā)展路徑,不僅為企業(yè)自身構(gòu)建了技術(shù)與生態(tài)雙重優(yōu)勢,更將為“人工智能+”戰(zhàn)略的落地提供堅實支撐,加速具身智能從實驗室走向千行百業(yè)的進程。