從“看懂”到“會做”，天娛數(shù)科Behavision構(gòu)建人形機器人智能新基座

2025-09-17

在人工智能、具身智能與人形機器人等前沿科技加速演進的當(dāng)下，技術(shù)突破與產(chǎn)業(yè)落地的協(xié)同銜接已成為行業(yè)發(fā)展的核心命題。9月17日，“2025具身智能全球硬科技發(fā)展大會”在天津盛大啟幕。全球頂尖專家、學(xué)者與企業(yè)代表齊聚于此，圍繞 “技術(shù)攻堅突破” 與 “場景落地實踐” 兩大核心議題展開深度交流，共繪具身智能生態(tài)化發(fā)展新藍圖。天娛數(shù)科受邀參會，集團首席數(shù)據(jù)官吳邦毅發(fā)表《Behavision：通用具身智能與物理世界的交互基座》主題演講。演講從產(chǎn)業(yè)演進規(guī)律切入，深入拆解行業(yè)核心瓶頸，系統(tǒng)闡述解決方案，全面解碼天娛數(shù)科的技術(shù)布局與實踐思考，為行業(yè)發(fā)展提供了兼具理論深度與落地價值的經(jīng)驗借鑒。

“當(dāng)前人形機器人產(chǎn)業(yè)正深陷‘四缺’困境：缺乏算法通用開發(fā)平臺，導(dǎo)致企業(yè)重復(fù)投入研發(fā)資源；缺乏通用3D數(shù)據(jù)平臺，直接制約具身智能的高效訓(xùn)練；缺乏標(biāo)準(zhǔn)認證平臺，造成產(chǎn)品兼容性差、生態(tài)協(xié)同受阻；缺乏場景測試與人才培養(yǎng)平臺，則進一步阻礙技術(shù)從實驗室走向產(chǎn)業(yè)實踐?！眳前钜阍谘葜v中直指行業(yè)痛點。

為破解行業(yè)困局，天娛數(shù)科打造了Behavision空間智能MaaS平臺，其核心邏輯為“世界感知—時空推理—泛化執(zhí)行”。作為整合數(shù)據(jù)與算法能力的核心載體，平臺的關(guān)鍵突破在于構(gòu)建了融合“傳感”（感知識別）、“大腦”（認知決策）與 “小腦”（運動執(zhí)行）的通用支撐體系，推動人形機器人“腦體協(xié)同”這一行業(yè)瓶頸的攻克與發(fā)展。

3D鉸接數(shù)據(jù)

給AI注入“物理直覺”

破解人形機器人產(chǎn)業(yè)困局，數(shù)據(jù)是根基。吳邦毅表示：“天娛數(shù)科已構(gòu)建起全國領(lǐng)先的高質(zhì)量3D與多模態(tài)數(shù)據(jù)體系，公司自建專業(yè)級3D動捕與多模態(tài)數(shù)據(jù)采集基地，累計沉淀150萬條3D數(shù)據(jù)、65萬條多模態(tài)數(shù)據(jù)，其中包含20萬條機器人任務(wù)訓(xùn)練專業(yè)數(shù)據(jù)，從基礎(chǔ)的‘抓取、放置’到復(fù)雜的空間理解和大小腦協(xié)同，覆蓋生活服務(wù)、高端制造、智慧醫(yī)療等關(guān)鍵場景?！?/span>

吳邦毅認為：“物理AI的落地，始于對物理世界的深刻理解。機器要‘會做事’，必先‘懂物理’——既要明晰物體的幾何結(jié)構(gòu)、材質(zhì)硬度、重心分布，也要掌握門如何轉(zhuǎn)動、抽屜如何滑動、零件如何拼接的運動規(guī)律與交互邏輯?！碧鞀蕯?shù)科正是以3D鉸接數(shù)據(jù)為核心，遵循“物理真實性、語義可理解性、場景泛化性”三大核心標(biāo)準(zhǔn)：通過毫米級光學(xué)動捕設(shè)備與三維掃描技術(shù)，精準(zhǔn)還原物體的幾何結(jié)構(gòu)、表面紋理及動態(tài)交互規(guī)則，為數(shù)據(jù)賦予可信賴的“物理骨架”；依托3D鉸接數(shù)據(jù)，對門、抽屜、機械臂等可交互物體的運動關(guān)節(jié)、自由度、受力反饋等屬性進行細粒度標(biāo)注，賦予數(shù)據(jù)理解交互邏輯的“語義靈魂”。如同給AI植入了“物理直覺”，讓機器不再將“門”僅視作一組三維坐標(biāo)，而是理解其“可繞合頁旋轉(zhuǎn)、需施加推力開啟”的功能本質(zhì)，為后續(xù)的精準(zhǔn)操作奠定認知基礎(chǔ)。

目前，3D鉸接數(shù)據(jù)已成功入選《北京市行業(yè)高質(zhì)量數(shù)據(jù)集典型案例》。此外，公司“人形機器人空間6D動捕長程數(shù)據(jù)”等核心數(shù)據(jù)集已在全國多地數(shù)據(jù)交易平臺上架，推動高質(zhì)量數(shù)據(jù)的市場化流通與產(chǎn)業(yè)共享。

算法賦能

兼顧決策與執(zhí)行精度

有了高質(zhì)量數(shù)據(jù)，算法則是激活價值的“引擎”。算法支撐層面，天娛數(shù)科以自研備案大模型矩陣為核心驅(qū)動力，天星基座大模型、3D智能領(lǐng)域“智者千問”行業(yè)大模型及智慧廣告大模型形成協(xié)同效應(yīng)，結(jié)合Embodied Chain-of-Thought Reasoning (ECoT) for VLA算法，讓人形機器人可快速學(xué)習(xí)復(fù)雜動作序列與操作邏輯。

通用大模型與垂類大模型的融合，破解了傳統(tǒng)算法“通用則不精準(zhǔn)、精準(zhǔn)則難泛化”的矛盾。大模型保障人形機器人對任務(wù)目標(biāo)、場景環(huán)境的通用理解與決策，VLA算法則聚焦操作細節(jié)的精準(zhǔn)控制，使人形機器人既能“看懂”復(fù)雜場景需求，又能“做好”精細操作動作。

Behavision

搭建人形“腦體協(xié)同”支撐體系

數(shù)據(jù)與算法的價值落地，最終要靠平臺規(guī)?；瘜崿F(xiàn)。天娛數(shù)科Behavision 空間智能MaaS 平臺作為數(shù)據(jù)與算法的整合核心，通過建立“傳感”（感知識別）、“大腦”（認知決策）與 “小腦”（運動執(zhí)行）一體化的通用支撐體系，打通人形機器人的“腦體協(xié)同”堵點。

平臺創(chuàng)新性搭建原子技能庫，針對輪式、腿足式、多足式人形機器人及單/多軸機械臂等不同形態(tài)設(shè)備，梳理出“移動、抓取、旋轉(zhuǎn)、協(xié)同”等多種原子技能，形成可快速復(fù)用的動作“模板庫”。當(dāng)面臨新任務(wù)時，由傳感模塊獲取環(huán)境與目標(biāo)信息并完成空間感知與語義理解，“大腦”結(jié)合大模型算法生成決策方案，“小腦”則從原子技能庫中調(diào)用適配模塊，實現(xiàn)多場景任務(wù)的快速調(diào)度與高效執(zhí)行。這種“感知-決策-執(zhí)行”閉環(huán)，推動人形機器人從1.0的“程序演示”階段躍遷至3.0的“精準(zhǔn)感知+自主決策+高效執(zhí)行”智能新階段。

更關(guān)鍵的是，Behavision平臺通過3D鉸接數(shù)據(jù)的深度應(yīng)用，成功跨越物理AI的“數(shù)據(jù)鴻溝”。吳邦毅表示“該數(shù)據(jù)覆蓋外觀（幾何紋理）、結(jié)構(gòu)（關(guān)節(jié)連接）、物理屬性（質(zhì)量、摩擦系數(shù)）、語義（功能用途）四大維度，完整標(biāo)注物體的‘是什么、怎么動、有什么用’，有效填補了傳統(tǒng)數(shù)據(jù)缺少物理屬性、缺功能語義的空白?！边@意味著AI不再是“看得到卻不懂”的“門外漢”，而是能理解“椅子可坐、門可推開、開關(guān)可按”的參與者。

從數(shù)據(jù)筑基到算法突破，從平臺落地到產(chǎn)業(yè)賦能，天娛數(shù)科通過Behavision體系的構(gòu)建，形成了“數(shù)據(jù)-算法-平臺-場景”的完整產(chǎn)業(yè)閉環(huán)。在具身智能生態(tài)化發(fā)展的浪潮中，這種以高質(zhì)量數(shù)據(jù)為核心、以協(xié)同平臺為紐帶的發(fā)展路徑，不僅為企業(yè)自身構(gòu)建了技術(shù)與生態(tài)雙重優(yōu)勢，更將為“人工智能+”戰(zhàn)略的落地提供堅實支撐，加速具身智能從實驗室走向千行百業(yè)的進程。