當(dāng)前位置:首頁 > 外匯資訊 > 正文內(nèi)容

OpenAI機(jī)器人,一出手就是王炸

激石外匯2024-03-14 11:58:05外匯資訊231

激石Pepperstone(http://hppnl.com/)報(bào)道:

「借助 OpenAI 的能力,F(xiàn)igure 01 現(xiàn)在可以與人全面對話了!」

本周三,半個硅谷都在投的明星機(jī)器人創(chuàng)業(yè)公司Figure,發(fā)布了自己第一個 OpenAI 大模型加持的機(jī)器人 demo。

這家公司在 3 月 1 日剛剛宣布獲得 OpenAI 等公司的投資,才十幾天就直接用上了 OpenAI 的多模態(tài)大模型。

如你所見,得到 OpenAI 大模型能力加持的 Figure 01 現(xiàn)在是這個樣子的。

它可以為聽從人類的命令,遞給人類蘋果。

將黑色塑料袋收拾進(jìn)框子里。

將杯子和盤子歸置放在瀝水架上。

需要強(qiáng)調(diào)的是:你看到的這一切,只用到了一個神經(jīng)網(wǎng)絡(luò)。

廣大網(wǎng)友在看到如此驚艷的 demo 后,對機(jī)器人的發(fā)展速度感到震驚,我們似乎正處在這場洶涌的進(jìn)化浪潮中。甚至有人感嘆,已經(jīng)準(zhǔn)備好迎接更多的機(jī)器人了。

還有網(wǎng)友調(diào)侃道:「波士頓動力:好的,伙計(jì)們,這是一場真正的競爭。讓我們回到實(shí)驗(yàn)室,設(shè)計(jì)更多舞蹈套路?!?/p>

所有這些,全是機(jī)器人自學(xué)的!

Figure創(chuàng)始人Brett Adcock表示,視頻中Figure 01展示了端到端神經(jīng)網(wǎng)絡(luò)框架下與人類的對話,沒有任何遠(yuǎn)程操作。并且,機(jī)器人的速度有了顯著的提升,開始接近人類的速度。

Figure機(jī)器人操作高級AI工程師Corey Lynch介紹了此次Figure 01的技術(shù)原理。他表示,F(xiàn)igure 01現(xiàn)在可以做到以下這些:

  • 描述其視覺體驗(yàn)

  • 規(guī)劃未來的行動

  • 反思自己的記憶

  • 口頭解釋推理過程

    他接著解釋道,視頻中機(jī)器人的所有行為都是學(xué)到的(再次強(qiáng)調(diào)不是遠(yuǎn)程操作),并以正常速度(1.0x)運(yùn)行。

    在具體實(shí)現(xiàn)過程中,他們將機(jī)器人攝像頭中的圖像輸入,并將機(jī)載麥克風(fēng)捕獲的語音文本轉(zhuǎn)錄到由 OpenAI訓(xùn)練的大型多模態(tài)模型中,該模型可以理解圖像和文本。該模型對整個對話記錄進(jìn)行處理,包括過去的圖像,從而獲得語言響應(yīng),然后通過文本到語音的方式將其回復(fù)給人類。

    此外,該模型負(fù)責(zé)決定在機(jī)器人上運(yùn)行哪些學(xué)習(xí)到的閉環(huán)行為以完成給定的命令,從而將特定的神經(jīng)網(wǎng)絡(luò)權(quán)重加載到GPU上并執(zhí)行策略。

    將Figure 01 連接到大型預(yù)訓(xùn)練多模態(tài)模型為其提供了一些有趣的新功能。Figure 01 + OpenAI 現(xiàn)在可以:

  • 描述其周圍環(huán)境。

  • 使用常識推理做出決定。例如,「桌子上的盤子和杯子等餐具接下來可能需要放進(jìn)瀝水架」。

  • 將「我餓了」等模棱兩可的高級請求轉(zhuǎn)化為一些適合上下文的行為,例如「遞給對方一個蘋果」。

  • 用簡單的英語描述為什么它執(zhí)行特定的操作。例如,「這是我可以從桌子上為您提供的唯一可食用物品」。

理解對話歷史的大型預(yù)訓(xùn)練模型為Figure 01提供了強(qiáng)大的短期記憶

考慮一個簡單的問題:「你能把它們放在那里嗎?」

其中 「它們」指的是什么?「那里」又是哪里?正確回答這個問題需要反思記憶的能力。

通過預(yù)訓(xùn)練模型分析對話的圖像和文本歷史記錄,F(xiàn)igure 01快速形成并執(zhí)行計(jì)劃:1)將杯子放在瀝水架上,2)將盤子放在瀝水架上。

關(guān)于學(xué)到的低級雙手操作,所有行為均由神經(jīng)網(wǎng)絡(luò)視覺運(yùn)動transformer策略驅(qū)動,將像素直接映射到動作。這些網(wǎng)絡(luò)以10hz 的頻率接收機(jī)載圖像,并以200hz的頻率生成 24-DOF 動作(手腕姿勢和手指關(guān)節(jié)角度)。

這些動作充當(dāng)高速「設(shè)定點(diǎn)」,以供更高速率的全身控制器跟蹤。這是一個有用的關(guān)注點(diǎn)分離,其中:

  • 互聯(lián)網(wǎng)預(yù)訓(xùn)練模型對圖像和文本進(jìn)行常識推理,以得出高級規(guī)劃。

  • 學(xué)習(xí)到的視覺運(yùn)動策略執(zhí)行計(jì)劃,執(zhí)行難以手動指定的快速反應(yīng)行為,例如在任何位置操縱可變形的袋子。

  • 全身控制器確保安全、穩(wěn)定的動力,例如保持平衡。

最后他表示,即使在幾年前,自己還認(rèn)為人形機(jī)器人規(guī)劃和執(zhí)行自身完全學(xué)得行為的同時與人類進(jìn)行完整的對話是幾十年后才能看到的事情。顯然,現(xiàn)在已經(jīng)發(fā)生了太多變化。

Figure,具身智能時代最熱創(chuàng)業(yè)公司

最近,生成式 AI 的競爭正在走向長文本、多模態(tài),各家科技公司和機(jī)構(gòu)也沒有忘記投資下個熱點(diǎn)——具身智能。

具身智能,對于計(jì)算機(jī)視覺、機(jī)器人等領(lǐng)域來說是一個很有挑戰(zhàn)的目標(biāo):假設(shè) AI 智能體(機(jī)器人)不僅能接收來自數(shù)據(jù)集的靜態(tài)圖像,還能在三維虛擬世界甚至真實(shí)環(huán)境中四處移動,并與周圍環(huán)境交互,那我們就會迎來技術(shù)的一次重大突破,從識別圖像等機(jī)器學(xué)習(xí)的簡單能力,轉(zhuǎn)變到學(xué)習(xí)如何通過多個步驟執(zhí)行復(fù)雜的類人任務(wù)。

被生成式 AI 龍頭 OpenAI 看好的具身智能,最有希望通向具身智能的公司,似乎就是這家 Figure。

3月1日,F(xiàn)igure 宣布完成驚人的 6.75 億美元 B 輪融資,公司估值達(dá)到 26 億美元。一眼望去,感覺半個硅谷都投了它:微軟、英特爾、OpenAI Startup Fund、Amazon Industrial Innovation Fund 、英偉達(dá)、貝索斯、「木頭姐」的方舟投資、Parkway Venture Capital、Align Ventures 等。

該公司的產(chǎn)品 Figure 01,據(jù)稱是世界上第一個具有商業(yè)可行性的自主人形機(jī)器人,身高 1.5 米,體重 60 公斤,可承載 20 公斤貨物,采用電機(jī)驅(qū)動。它的可工作時長是 5 小時,行走速度每秒 1.2 米,可以說很多指標(biāo)已經(jīng)接近人類。

自 2023 年 1 月以來,人們對 Figure 的關(guān)注度一直在上升。雖然到目前為止,公司一共才發(fā)布過四個 demo 視頻。其中的一個展示了 Figure 01 是如何制作咖啡的:

據(jù)Figure表示,機(jī)器人練習(xí)這些動作的方法是端到端的,神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時間是10小時。

在 2 月 27 日的視頻里,F(xiàn)igure 01 自主完成了一個典型的物流環(huán)節(jié)任務(wù)——搬運(yùn)空箱。

當(dāng)然,速度還是比人類慢了很多。不過在這些任務(wù)中,F(xiàn)igure 01 都是完全自主地執(zhí)行任務(wù)。所謂「完全自主」,是指只需將機(jī)器人放在地面上(無論放在屋里什么地方),在沒有其他用戶輸入的情況下,直接按開始就行。

在訓(xùn)練過的大型視覺語言模型( VLM )幫助下,人形機(jī)器人會先識別、定位目標(biāo)箱子,然后推理合適的拿放姿勢。接下來,F(xiàn)igure 01 會導(dǎo)航自己到目標(biāo)跟前,檢測抓取點(diǎn)和手部力量,嘗試抓取成功并將箱子放到傳送帶上。

這些技術(shù)亮點(diǎn)也是 Figure 和一直希望回歸機(jī)器人領(lǐng)域的 OpenAI 達(dá)成合作協(xié)議的重要原因之一——將 OpenAI 的研究與 Figure 的機(jī)器人經(jīng)驗(yàn)結(jié)合起來,為人形機(jī)器人開發(fā)下一代 AI 模型。OpenAI 也希望將自己的高性能多模態(tài)大模型擴(kuò)展到機(jī)器人領(lǐng)域。

除了接受大筆風(fēng)投之外,F(xiàn)igure 也在積極拓展落地場景。目前,F(xiàn)igure 01 已經(jīng)開始在寶馬位于南卡羅來納州斯帕坦堡的汽車工廠接受測試,人們計(jì)劃讓機(jī)器人替代人類從事一些危險(xiǎn)度高的任務(wù)。?????????

掃描二維碼推送至手機(jī)訪問。

版權(quán)聲明:本文由激石Pepperstone發(fā)布,如需轉(zhuǎn)載請注明出處。

本文鏈接:http://hppnl.com/news/2778.html

標(biāo)簽: OpenAI機(jī)器人

“OpenAI機(jī)器人,一出手就是王炸” 的相關(guān)文章

激石Pepperstone:TikTok奇襲“蝦廠”大本營

激石Pepperstone(http://hppnl.com/)報(bào)道:作為“東南亞小騰訊”Sea旗下的電商平臺,Shopee只用三年時間就趕超了阿里L(fēng)azada(來贊達(dá)),并在2021年邁出了飛速的擴(kuò)張步伐。但進(jìn)入2022年,Shopee接連關(guān)閉法國、印度、西班牙站點(diǎn),裁員的消息也甚囂塵...

中國恒大首次被提請清盤 知情人士:不會對未來重組產(chǎn)生實(shí)質(zhì)性影響

激石Pepperstone(http://hppnl.com/)報(bào)道:6月27日,中國香港高等法院網(wǎng)站顯示,Top?Shine?Global?Limited?of?Intershore?Consult?(Samoa)?Limited已于香港高等法院向中國恒大集團(tuán)提出清盤呈請,案件編號為H...

9年過去了,人類終于等來大規(guī)模無人機(jī)送貨時代

激石Pepperstone(http://hppnl.com/)報(bào)道:2013年,亞馬遜創(chuàng)始人杰夫貝索斯在《60分鐘》節(jié)目接受采訪時,第一次公開表示亞馬遜正在進(jìn)行無人機(jī)送貨方面的研發(fā)。 終于,九年磨一劍,無人機(jī)配送成為了現(xiàn)實(shí)。? 雖然聽起來無人機(jī)配送并不算難實(shí)現(xiàn),但實(shí)際上,在真實(shí)世界...

連續(xù)第二天!央行再進(jìn)行30億小額逆回購,意味著什么

連續(xù)第二天!央行再進(jìn)行30億小額逆回購,意味著什么

激石Pepperstone(http://hppnl.com/)報(bào)道:7月5日周二,中國央行連續(xù)第二日進(jìn)行30億元7天期逆回購操作,中標(biāo)利率為2.10%,與此前持平。今日1100億元逆回購到期,單日實(shí)現(xiàn)凈回籠1070億元,規(guī)模為四月份以來最大,本周前兩日實(shí)現(xiàn)凈回籠2040億元。 圖片來...

如何理解本輪政策的新焦點(diǎn):政策性、開發(fā)性金融

激石Pepperstone(http://hppnl.com/)報(bào)道: 6月29日國務(wù)院常務(wù)會議決定,運(yùn)用政策性、開發(fā)性金融工具,補(bǔ)充包括新型基礎(chǔ)設(shè)施在內(nèi)的重大項(xiàng)目資本金、或?yàn)閷m?xiàng)債項(xiàng)目資本金搭橋??紤]到此前調(diào)增政策性銀行8000億元信貸額度,不難看出本輪政策焦點(diǎn)正逐步轉(zhuǎn)移至政策性、開發(fā)...

電動車突破千萬輛大關(guān),保有量占比將成為下個首要目標(biāo)

電動車突破千萬輛大關(guān),保有量占比將成為下個首要目標(biāo)

激石Pepperstone(http://hppnl.com/)報(bào)道:我國新能源汽車的發(fā)展隨著6月電動車銷量的爆發(fā)順利進(jìn)入了新的階段,根據(jù)7月6日公安部的最新統(tǒng)計(jì)數(shù)據(jù),截至2022年6月底,我國全國新能源汽車保有量達(dá)到1001萬輛,其中,今年上半年我國新注冊登記的新能源汽車就高達(dá)220....