【新智元導(dǎo)讀】剛剛,繼4月初獲得5.28億融資后,短短2個(gè)月,國(guó)內(nèi)頂尖具身智能玩家又?jǐn)孬@近6億元融資!不久前,其首款商用級(jí)人形機(jī)器人Moz1震撼發(fā)布,可單手精準(zhǔn)抽紙,具備超強(qiáng)感知與執(zhí)行力。憑借三維核心競(jìng)爭(zhēng)力,他們正向萬(wàn)億級(jí)賽道加速?zèng)_刺。
從硅谷到中國(guó),多家科技巨頭與初創(chuàng)黑馬同臺(tái)競(jìng)技,掀起了AI從虛擬世界走向物理世界的熱潮。
谷歌AI模型Gemini Robotics,在推理和靈巧操作上,都展現(xiàn)出超強(qiáng)的類人實(shí)力;
Figure AI自研的端到端VLA模型——Helix,讓機(jī)器人從語(yǔ)言理解到動(dòng)作執(zhí)行一氣呵成;
還有UC伯克利系出身的Physical Intelligence,多次迭代π系列模型,通過(guò)多平臺(tái)訓(xùn)練,攻克了洗衣、收納等復(fù)雜任務(wù)。
可見,在這片巨大紅海中,從不缺少重量級(jí)玩家。在技術(shù)迭代與資本助推下,全球的目光都聚焦于這場(chǎng)通往「通用機(jī)器人」的終極競(jìng)賽。
在中國(guó),這條賽道同樣如火如荼。眾多機(jī)器人公司競(jìng)相涌入,試圖在這萬(wàn)億級(jí)市場(chǎng)中搶占先機(jī)。
就在剛剛,千尋智能完成了近6億元PreA+新一輪融資,投資陣容星光熠熠。
本輪融資由京東領(lǐng)投,中國(guó)互聯(lián)網(wǎng)投資基金(簡(jiǎn)稱「中網(wǎng)投」)、浙江省科創(chuàng)母基金、華泰紫金、復(fù)星銳正等知名機(jī)構(gòu)跟投。
堪稱傳奇的是,從2024年2月成立至今,這家公司便以驚人速度完成了多輪融資,成為資本市場(chǎng)的寵兒。
更值得關(guān)注的是,上一輪領(lǐng)投的P7在本輪持續(xù)超額加碼;除此之外,順為資本、華控基金、華發(fā)集團(tuán)、千乘資本、靖亞資本、弘暉基金等老股東的繼續(xù)下注,則是對(duì)千尋發(fā)展?jié)摿Φ某掷m(xù)背書。
作為中國(guó)電商與物流巨擘,京東的投資邏輯清晰且務(wù)實(shí):聚焦核心業(yè)務(wù)效率、優(yōu)化用戶體驗(yàn),并推動(dòng)產(chǎn)業(yè)升級(jí)的技術(shù)創(chuàng)新。
京東集團(tuán)出手,不僅彰顯了千尋在物流等高價(jià)值場(chǎng)景的潛力,也折射出其在具身智能賽道中的獨(dú)特價(jià)值。
千尋創(chuàng)始人兼CEO韓峰濤表示,「重量級(jí)產(chǎn)投方的齊聚,不僅是對(duì)千尋智能的認(rèn)可,更折射出產(chǎn)業(yè)界對(duì)具身智能賽道未來(lái)價(jià)值的高度共識(shí)」。
首先,作為國(guó)內(nèi)首個(gè)高精度全身力控的具身智能機(jī)器人,它擁有26個(gè)自由度(不含靈巧手)。
因?yàn)榛谌蚬β拭芏茸罡叩囊惑w化力控關(guān)節(jié)打造,它在速度、精度、安全性和仿生力控方面,都達(dá)到了行業(yè)的頭部水平。
據(jù)悉,Moz1一體化關(guān)節(jié)的功率密度直接比特斯拉Optimus高出了15%,充分展示了千尋智能在機(jī)器人硬件上的強(qiáng)大實(shí)力
由于搭載了頂級(jí)的運(yùn)控系統(tǒng)和VLA模型,它具有超凡的感知決策能力,性能全面躍升。
開完會(huì)議,Moz 1就可以幫我們收拾會(huì)場(chǎng),把桌上的雜物一件件撿進(jìn)收納盒。
國(guó)內(nèi)領(lǐng)先的高精高速WBC全身運(yùn)動(dòng)系統(tǒng),甚至能讓它完成更換紙巾這樣精密度極高的動(dòng)作。
這個(gè)任務(wù)中,Moz1充分體現(xiàn)了自己的多模態(tài)感知交互能力,和全身協(xié)同的控制能力。
自主完成擦黑板、關(guān)燈這些任務(wù)后,它就乖乖待在會(huì)議室里,等待人類的下一次召喚了。
同時(shí),因?yàn)檫€內(nèi)置了自研的多維度數(shù)采設(shè)備(比如VR/動(dòng)捕/同構(gòu)形等),Moz 1能夠?qū)崿F(xiàn)模型的小時(shí)級(jí)迭代,以極其硬核的硬件,充分支撐技術(shù)落地。
看著它在公司內(nèi)部來(lái)回穿梭、充分融入大家工作流的樣子,我們就知道——如今,是時(shí)候重新定義「勞動(dòng)力」了!
網(wǎng)友銳評(píng)道:沒(méi)想到,上次那個(gè)最會(huì)疊衣服的機(jī)器人,現(xiàn)在又升級(jí)了,簡(jiǎn)直讓保潔阿姨瑟瑟發(fā)抖。
在商用場(chǎng)景,它可以絲滑完成整理、接待、導(dǎo)覽等任務(wù),那么家庭場(chǎng)景的陪伴、互動(dòng)和服務(wù),當(dāng)然也不在話下了。
千尋首款商用級(jí)Moz1人形機(jī)器人之所以具備強(qiáng)大理解泛化能力,離不開具身智能「大腦」VLA(視覺-語(yǔ)言-動(dòng)作)模型的加持。
為此,千尋自研了一款端到端具身模型——Spirit v1,通過(guò)數(shù)據(jù)融合與訓(xùn)練策略,實(shí)現(xiàn)了視覺感知、語(yǔ)言理解、動(dòng)作執(zhí)行的無(wú)縫銜接。
Spirit系模型在短短半年的時(shí)間迭代了三版,實(shí)現(xiàn)了從單一基礎(chǔ)任務(wù)到高難度長(zhǎng)程+數(shù)十個(gè)任務(wù)完成的階躍式進(jìn)步
舉個(gè)栗子,疊衣服這一看似簡(jiǎn)單的任務(wù),實(shí)則對(duì)機(jī)器人提出了極高挑戰(zhàn):每件衣服的褶皺、形狀各異,要比抓糖豆、倒水等任務(wù)高出百倍。
Spirit v1通過(guò)動(dòng)態(tài)場(chǎng)景感知和精確動(dòng)作控制,完成了從抓取、鋪平、折疊到堆疊的全流程,成功率達(dá)70%-80%。
而且,它同時(shí)完成任務(wù)的能力,已從過(guò)去的5個(gè)擴(kuò)展到10個(gè),逼近國(guó)際領(lǐng)先π系模型。
Spirit v1的成功,源于其獨(dú)特的三層訓(xùn)練架構(gòu),通過(guò)融合視頻預(yù)訓(xùn)練、遙操模仿學(xué)習(xí)和RL,構(gòu)建了高效、泛化的技術(shù)壁壘。
這款VLA模型共有70億參數(shù),基于13000小時(shí)數(shù)據(jù)訓(xùn)練。其中,70%來(lái)自海量的互聯(lián)網(wǎng)視頻。
通過(guò)端到端學(xué)習(xí),Spirit v1直接從視頻中提取視覺和動(dòng)作信息,掌握物體的形態(tài)變化、動(dòng)作邏輯,以及場(chǎng)景動(dòng)態(tài)性。
這種方法,能夠賦予模型廣泛的真實(shí)世界先驗(yàn)知識(shí),顯著提升泛化能力,使其快速適應(yīng)多種場(chǎng)景。
在預(yù)訓(xùn)練基礎(chǔ)上,20%的遙操數(shù)據(jù)通過(guò)千尋自研的EfficientImitate算法進(jìn)行精調(diào)。
在端到端框架下,遙操作模仿學(xué)習(xí)進(jìn)一步優(yōu)化了Spirit v1性能,實(shí)現(xiàn)了從示范到自助操作的平滑過(guò)渡。
剩余10%的強(qiáng)化學(xué)習(xí)數(shù)據(jù),則采用全球樣本效率最高的EfficientZero強(qiáng)化學(xué)習(xí)算法,讓機(jī)器人通過(guò)自主探索優(yōu)化行為策略。
以上三層架構(gòu),不僅解決了訓(xùn)練「數(shù)據(jù)荒」的瓶頸,還讓Spirit v1在動(dòng)態(tài)環(huán)境中展現(xiàn)出強(qiáng)大的自主性和適應(yīng)性。
更令人矚目的是,今年5月,千尋首席科學(xué)家高陽(yáng)帶領(lǐng)團(tuán)隊(duì)提出了OneTwoVLA模型,實(shí)現(xiàn)了全新的突破。
這一創(chuàng)新架構(gòu)將傳統(tǒng)機(jī)器人系統(tǒng)中,分離的「推理大腦」和「動(dòng)作四肢」熔煉為單一Transformer模型,真正實(shí)現(xiàn)了「邊想邊做」。
在長(zhǎng)程任務(wù)實(shí)驗(yàn)中,OneTwoVLA加持的機(jī)器人能順利流暢完成涮火鍋、炒菜、調(diào)雞尾酒等復(fù)雜任務(wù),成功率比純動(dòng)作VLA提升30%。
如下示例中,當(dāng)你要求「幫我涮牛肉」,OneTwoVLA會(huì)在每一步預(yù)測(cè)開始推理,還是開始執(zhí)行。
OneTwoVLA的通用視覺定位,還能準(zhǔn)確識(shí)別未見過(guò)的雪碧罐,或是星巴克杯子,展現(xiàn)了超強(qiáng)的開放世界理解能力。
OneTwoVLA的代碼與數(shù)據(jù)已全部開源,標(biāo)志著千尋在通用機(jī)器人技術(shù)路線上的新里程碑,也為行業(yè)提供了更簡(jiǎn)潔、可擴(kuò)展的具身智能路徑。
這家具身智能實(shí)力派的成功不僅在于技術(shù)突破,更在于其以市場(chǎng)需求為導(dǎo)向的商業(yè)化邏輯。
從創(chuàng)立之初,千尋便組建了專門產(chǎn)品團(tuán)隊(duì),深入能源電池、物流、餐飲、康養(yǎng)等上百個(gè)場(chǎng)景進(jìn)行調(diào)研。
他們基于成熟的商業(yè)化經(jīng)驗(yàn),精準(zhǔn)切入高價(jià)值場(chǎng)景,大規(guī)模部署高效收集的海量數(shù)據(jù),持續(xù)反哺模型雷火競(jìng)技優(yōu)化。
最終,形成了一個(gè)「場(chǎng)景需求—技術(shù)攻關(guān)—產(chǎn)品落地—市場(chǎng)反饋」獨(dú)特且有效的商業(yè)閉環(huán)模式。
這種策略確保了技術(shù)研發(fā)與實(shí)際應(yīng)用無(wú)縫銜接,顯著降低落地的風(fēng)險(xiǎn),更是贏得產(chǎn)投方的極大認(rèn)可。
在辦公場(chǎng)景中,千尋機(jī)器人展現(xiàn)出了強(qiáng)大的靈活性。我們看到了,Moz1能自主完成會(huì)議室清潔任務(wù),收納筆、擦拭白板等等。
據(jù)判斷,在物流場(chǎng)景中,智能倉(cāng)儲(chǔ)體系對(duì)高效、靈活機(jī)器人的需求將極其旺盛,正好千尋機(jī)器人也能適配貨物分揀、動(dòng)態(tài)搬運(yùn)等復(fù)雜任務(wù)。
放眼未來(lái),千尋還計(jì)劃從辦公場(chǎng)景逐步向制造、服務(wù)業(yè)、醫(yī)療、康養(yǎng)等高附加值場(chǎng)景滲透,目標(biāo)直指萬(wàn)億級(jí)市場(chǎng)。
尤其在海外市場(chǎng),歐美高人工的成本地區(qū),付費(fèi)意愿強(qiáng)。而創(chuàng)始團(tuán)隊(duì)的國(guó)際化經(jīng)驗(yàn),恰恰為其提供了堅(jiān)實(shí)支撐。
他們?cè)鴰ьI(lǐng)機(jī)器人海外事業(yè)部實(shí)現(xiàn)了從0到1的商業(yè)化落地成果,為千尋的全球化戰(zhàn)略奠定了基礎(chǔ)。
這種清晰的市場(chǎng)拓展途徑,不僅展現(xiàn)了千尋的商業(yè)前瞻性,也成為吸引頂級(jí)投資方的關(guān)鍵因素。
深挖之后可以發(fā)現(xiàn),在如今競(jìng)爭(zhēng)激烈的具身賽道,最終突出重圍的之所以是千尋智能,還是因?yàn)樗吡艘粭l「少有人走的路」。
在技術(shù)上,VLA模型與硬件協(xié)同的獨(dú)特技術(shù)路線,讓它在一眾競(jìng)家中走出了自己的特色。
團(tuán)隊(duì)上,它擁有如今機(jī)器人領(lǐng)域的全球頂尖人才,技術(shù)背景過(guò)硬,行業(yè)眼光高瞻遠(yuǎn)矚。
因此,在瞬息萬(wàn)變的市場(chǎng)競(jìng)爭(zhēng)中,它始終能占據(jù)有利地位,充分獲得了產(chǎn)投方的信任和投資。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
多地七夕結(jié)婚登記數(shù)據(jù)遠(yuǎn)超去年同期,專家預(yù)計(jì)今年結(jié)婚數(shù)量將超去年,或影響明年出生人口數(shù)據(jù)
等了十年,石宇奇終于說(shuō)出這句線月訓(xùn)練曝光:參加力量技術(shù)訓(xùn)練5v5對(duì)抗 提升攻防速度強(qiáng)度
《編碼物候》展覽開幕 北京時(shí)代美術(shù)館以科學(xué)藝術(shù)解讀數(shù)字與生物交織的宇宙節(jié)律
消息稱三星首款 TriFold 三折疊手機(jī)產(chǎn)量規(guī)劃 5 萬(wàn)臺(tái),11 月上市