【新智元導讀】剛剛,繼4月初獲得5.28億融資后,短短2個月,國內(nèi)頂尖具身智能玩家又斬獲近6億元融資!不久前,其首款商用級人形機器人Moz1震撼發(fā)布,可單手精準抽紙,具備超強感知與執(zhí)行力。憑借三維核心競爭力,他們正向萬億級賽道加速沖刺。
從硅谷到中國,多家科技巨頭與初創(chuàng)黑馬同臺競技,掀起了AI從虛擬世界走向物理世界的熱潮。
谷歌AI模型Gemini Robotics,在推理和靈巧操作上,都展現(xiàn)出超強的類人實力;
Figure AI自研的端到端VLA模型——Helix,讓機器人從語言理解到動作執(zhí)行一氣呵成;
還有UC伯克利系出身的Physical Intelligence,多次迭代π系列模型,通過多平臺訓練,攻克了洗衣、收納等復(fù)雜任務(wù)。
可見,在這片巨大紅海中,從不缺少重量級玩家。在技術(shù)迭代與資本助推下,全球的目光都聚焦于這場通往「通用機器人」的終極競賽。
在中國,這條賽道同樣如火如荼。眾多機器人公司競相涌入,試圖在這萬億級市場中搶占先機。
就在剛剛,千尋智能完成了近6億元PreA+新一輪融資,投資陣容星光熠熠。
本輪融資由京東領(lǐng)投,中國互聯(lián)網(wǎng)投資基金(簡稱「中網(wǎng)投」)、浙江省科創(chuàng)母基金、華泰紫金、復(fù)星銳正等知名機構(gòu)跟投。
堪稱傳奇的是,從2024年2月成立至今,這家公司便以驚人速度完成了多輪融資,成為資本市場的寵兒。
更值得關(guān)注的是,上一輪領(lǐng)投的P7在本輪持續(xù)超額加碼;除此之外,順為資本、華控基金、華發(fā)集團、千乘資本、靖亞資本、弘暉基金等老股東的繼續(xù)下注,則是對千尋發(fā)展?jié)摿Φ某掷m(xù)背書。
作為中國電商與物流巨擘,京東的投資邏輯清晰且務(wù)實:聚焦核心業(yè)務(wù)效率、優(yōu)化用戶體驗,并推動產(chǎn)業(yè)升級的技術(shù)創(chuàng)新。
京東集團出手,不僅彰顯了千尋在物流等高價值場景的潛力,也折射出其在具身智能賽道中的獨特價值。
千尋創(chuàng)始人兼CEO韓峰濤表示,「重量級產(chǎn)投方的齊聚,不僅是對千尋智能的認可,更折射出產(chǎn)業(yè)界對具身智能賽道未來價值的高度共識」。
首先,作為國內(nèi)首個高精度全身力控的具身智能機器人,它擁有26個自由度(不含靈巧手)。
因為基于全球功率密度最高的一體化力控關(guān)節(jié)打造,它在速度、精度、安全性和仿生力控方面,都達到了行業(yè)的頭部水平。
據(jù)悉,Moz1一體化關(guān)節(jié)的功率密度直接比特斯拉Optimus高出了15%,充分展示了千尋智能在機器人硬件上的強大實力
由于搭載了頂級的運控系統(tǒng)和VLA模型,它具有超凡的感知決策能力,性能全面躍升。
開完會議,Moz 1就可以幫我們收拾會場,把桌上的雜物一件件撿進收納盒。
國內(nèi)領(lǐng)先的高精高速WBC全身運動系統(tǒng),甚至能讓它完成更換紙巾這樣精密度極高的動作。
這個任務(wù)中,Moz1充分體現(xiàn)了自己的多模態(tài)感知交互能力,和全身協(xié)同的控制能力。
自主完成擦黑板、關(guān)燈這些任務(wù)后,它就乖乖待在會議室里,等待人類的下一次召喚了。
同時,因為還內(nèi)置了自研的多維度數(shù)采設(shè)備(比如VR/動捕/同構(gòu)形等),Moz 1能夠?qū)崿F(xiàn)模型的小時級迭代,以極其硬核的硬件,充分支撐技術(shù)落地。
看著它在公司內(nèi)部來回穿梭、充分融入大家工作流的樣子,我們就知道——如今,是時候重新定義「勞動力」了!
網(wǎng)友銳評道:沒想到,上次那個最會疊衣服的機器人,現(xiàn)在又升級了,簡直讓保潔阿姨瑟瑟發(fā)抖。
在商用場景,它可以絲滑完成整理、接待、導覽等任務(wù),那么家庭場景的陪伴、互動和服務(wù),當然也不在話下了。
千尋首款商用級Moz1人形機器人之所以具備強大理解泛化能力,離不開具身智能「大腦」VLA(視覺-語言-動作)模型的加持。
為此,千尋自研了一款端到端具身模型——Spirit v1,通過數(shù)據(jù)融合與訓練策略,實現(xiàn)了視覺感知、語言理解、動作執(zhí)行的無縫銜接。
Spirit系模型在短短半年的時間迭代了三版,實現(xiàn)了從單一基礎(chǔ)任務(wù)到高難度長程+數(shù)十個任務(wù)完成的階躍式進步
舉個栗子,疊衣服這一看似簡單的任務(wù),實則對機器人提出了極高挑戰(zhàn):每件衣服的褶皺、形狀各異,要比抓糖豆、倒水等任務(wù)高出百倍。
Spirit v1通過動態(tài)場景感知和精確動作控制,完成了從抓取、鋪平、折疊到堆疊的全流程,成功率達70%-80%。
而且,它同時完成任務(wù)的能力,已從過去的5個擴展到10個,逼近國際領(lǐng)先π系模型。
Spirit v1的成功,源于其獨特的三層訓練架構(gòu),通過融合視頻預(yù)訓練、遙操模仿學習和RL,構(gòu)建了高效、泛化的技術(shù)壁壘。
這款VLA模型共有70億參數(shù),基于13000小時數(shù)據(jù)訓練。其中,70%來自海量的互聯(lián)網(wǎng)視頻。
通過端到端學習,Spirit v1直接從視頻中提取視覺和動作信息,掌握物體的形態(tài)變化、動作邏輯,以及場景動態(tài)性。
這種方法,能夠賦予模型廣泛的真實世界先驗知識,顯著提升泛化能力,使其快速適應(yīng)多種場景。
在預(yù)訓練基礎(chǔ)上,20%的遙操數(shù)據(jù)通過千尋自研的EfficientImitate算法進行精調(diào)。
在端到端框架下,遙操作模仿學習進一步優(yōu)化了Spirit v1性能,實現(xiàn)了從示范到自助操作的平滑過渡。
剩余10%的強化學習數(shù)據(jù),則采用全球樣本效率最高的EfficientZero強化學習算法,讓機器人通過自主探索優(yōu)化行為策略。
以上三層架構(gòu),不僅解決了訓練「數(shù)據(jù)荒」的瓶頸,還讓Spirit v1在動態(tài)環(huán)境中展現(xiàn)出強大的自主性和適應(yīng)性。
更令人矚目的是,今年5月,千尋首席科學家高陽帶領(lǐng)團隊提出了OneTwoVLA模型,實現(xiàn)了全新的突破。
這一創(chuàng)新架構(gòu)將傳統(tǒng)機器人系統(tǒng)中,分離的「推理大腦」和「動作四肢」熔煉為單一Transformer模型,真正實現(xiàn)了「邊想邊做」。
在長程任務(wù)實驗中,OneTwoVLA加持的機器人能順利流暢完成涮火鍋、炒菜、調(diào)雞尾酒等復(fù)雜任務(wù),成功率比純動作VLA提升30%。
如下示例中,當你要求「幫我涮牛肉」,OneTwoVLA會在每一步預(yù)測開始推理,還是開始執(zhí)行。
OneTwoVLA的通用視覺定位,還能準確識別未見過的雪碧罐,或是星巴克杯子,展現(xiàn)了超強的開放世界理解能力。
OneTwoVLA的代碼與數(shù)據(jù)已全部開源,標志著千尋在通用機器人技術(shù)路線上的新里程碑,也為行業(yè)提供了更簡潔、可擴展的具身智能路徑。
這家具身智能實力派的成功不僅在于技術(shù)突破,更在于其以市場需求為導向的商業(yè)化邏輯。
從創(chuàng)立之初,千尋便組建了專門產(chǎn)品團隊,深入能源電池、物流、餐飲、康養(yǎng)等上百個場景進行調(diào)研。
他們基于成熟的商業(yè)化經(jīng)驗,精準切入高價值場景,大規(guī)模部署高效收集的海量數(shù)據(jù),持續(xù)反哺模型雷火競技優(yōu)化。
最終,形成了一個「場景需求—技術(shù)攻關(guān)—產(chǎn)品落地—市場反饋」獨特且有效的商業(yè)閉環(huán)模式。
這種策略確保了技術(shù)研發(fā)與實際應(yīng)用無縫銜接,顯著降低落地的風險,更是贏得產(chǎn)投方的極大認可。
在辦公場景中,千尋機器人展現(xiàn)出了強大的靈活性。我們看到了,Moz1能自主完成會議室清潔任務(wù),收納筆、擦拭白板等等。
據(jù)判斷,在物流場景中,智能倉儲體系對高效、靈活機器人的需求將極其旺盛,正好千尋機器人也能適配貨物分揀、動態(tài)搬運等復(fù)雜任務(wù)。
放眼未來,千尋還計劃從辦公場景逐步向制造、服務(wù)業(yè)、醫(yī)療、康養(yǎng)等高附加值場景滲透,目標直指萬億級市場。
尤其在海外市場,歐美高人工的成本地區(qū),付費意愿強。而創(chuàng)始團隊的國際化經(jīng)驗,恰恰為其提供了堅實支撐。
他們曾帶領(lǐng)機器人海外事業(yè)部實現(xiàn)了從0到1的商業(yè)化落地成果,為千尋的全球化戰(zhàn)略奠定了基礎(chǔ)。
這種清晰的市場拓展途徑,不僅展現(xiàn)了千尋的商業(yè)前瞻性,也成為吸引頂級投資方的關(guān)鍵因素。
深挖之后可以發(fā)現(xiàn),在如今競爭激烈的具身賽道,最終突出重圍的之所以是千尋智能,還是因為它走了一條「少有人走的路」。
在技術(shù)上,VLA模型與硬件協(xié)同的獨特技術(shù)路線,讓它在一眾競家中走出了自己的特色。
團隊上,它擁有如今機器人領(lǐng)域的全球頂尖人才,技術(shù)背景過硬,行業(yè)眼光高瞻遠矚。
因此,在瞬息萬變的市場競爭中,它始終能占據(jù)有利地位,充分獲得了產(chǎn)投方的信任和投資。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
多地七夕結(jié)婚登記數(shù)據(jù)遠超去年同期,專家預(yù)計今年結(jié)婚數(shù)量將超去年,或影響明年出生人口數(shù)據(jù)
等了十年,石宇奇終于說出這句線月訓練曝光:參加力量技術(shù)訓練5v5對抗 提升攻防速度強度
《編碼物候》展覽開幕 北京時代美術(shù)館以科學藝術(shù)解讀數(shù)字與生物交織的宇宙節(jié)律
消息稱三星首款 TriFold 三折疊手機產(chǎn)量規(guī)劃 5 萬臺,11 月上市