如果說喬布斯向全球科技行業(yè)親身詮釋了牛仔褲將成為最頂級的時尚;那頂著東西方不同面孔的黃仁勛和埃隆·馬斯克則反復(fù)提醒著世界,黑皮夾克才是屬于新時代的大佬 icon。
今年的特斯拉 AI Day 上,馬斯克沒有花費太多時間暖場。舞臺屏幕左右分開,人形機器人擎天柱(Optimus)邁著六親不認(rèn)的步伐閃亮登場。
如果你叫擎天柱,那么在你胸前的一定就是賽博坦星的至寶——領(lǐng)導(dǎo)模塊(Matrix Of Leadership)了?
終于亮相的機器人
量產(chǎn)單價可能是Model 3的一半
作為變形金剛八十年代引進(jìn)國內(nèi)時期的忠實擁躉,充滿領(lǐng)袖和人格魅力的柱子哥對我來說有極崇高的特殊含義,所以后面還是用 Optimus 的英文原名來稱呼這臺傳說中 Tesla Bot 的原型機。
各種線路和金屬零件裸露在外的 Optimus 走得四平八穩(wěn),頻頻向臺下的與會人士揮手致意。
在演示視頻中,Optimus 不僅能夠自主行走,幫特斯拉辦公室的員工搬運快遞、提起水壺澆花。
另一方面,Optimus 在特斯拉工廠扮演起一名榮耀的車間工人也是有模有樣。
這也是這次 AI Day 之前,在我們的分析中,第一代 Optimus 所能承擔(dān)最普遍、也是最具代表性的工作。也就是說,Optimus 的第一批大客戶,很可能是世界各地的特斯拉超級工廠 Gigafactory。
不過,這副好像自己從實驗室離家出走的模樣還不是 Optimus 的標(biāo)準(zhǔn)形態(tài)。屏幕再次左右分開,裝上外殼的 Optimus,在三位特斯拉團隊的壯漢簇?fù)碇鲁霈F(xiàn)。
這一版本的 Optimus 比起上一位來講,外觀上的完成度更高,想來是相比原型機更加接近量產(chǎn)的狀態(tài):外觀上更加類人,自由度也要更高一些。
用高達(dá)(Gundam)世界觀解釋機體演進(jìn)的術(shù)語來說,好像應(yīng)該叫做先行量產(chǎn)型?不,好像還差了不少,這臺試做機型也還要好幾周的時間才能正常下地走路。
實際上,就算特斯拉機器人團隊在過去的一年中每天工作十幾個小時、一周工作七天,Optimus 還是處在十分早期的階段,未來還有很多空間將其在上市前做得更好。
按照馬斯克的構(gòu)想,未來 3 至 5 年內(nèi) Optimus 的開發(fā)就能成熟。在特斯拉機器人業(yè)務(wù)達(dá)到數(shù)百萬臺的量產(chǎn)規(guī)模時,其單臺售價將會大大低于汽車,預(yù)計價格將不會高于每臺 2 萬美元——注意,遠(yuǎn)低于特斯拉 Model 3 標(biāo)準(zhǔn)續(xù)航升級版不到 4 萬美元的單價。
熟悉馬老師語言體系的各位都知道,這個 roadmap 不用特別當(dāng)真。這不是嘲諷,而是提醒大家,合理地放平期待。
話歸正題。鋪墊十分到位,要是賣藥的話,接下來該出療效了。
馬斯克表示,特斯拉 AI Day 的目的,是用最酷的技術(shù)演示,吸引最有才華的技術(shù)人群,一起把成果量產(chǎn),幫助千百萬人。
「Make it hAppen」。
類似的話術(shù)在第一個階段密集地出現(xiàn),馬斯克以十分美式的風(fēng)格,反復(fù)提醒有識有志之士們加入特斯拉,發(fā)光發(fā)熱。
接下來,特斯拉機器人團隊的技術(shù)負(fù)責(zé)人們輪流上臺介紹了 Optimus 的細(xì)節(jié)和各項進(jìn)展。
讓我們忘記在去年八月 AI Day 2021 上公布的賽博猛男形象,先出場的 Optimus 相當(dāng)于實現(xiàn)了基礎(chǔ)功能的開發(fā)平臺。后面那個看上去完成度更高的「船新版本」,將會繼續(xù)不斷地改進(jìn)。
完整的特斯拉人形機器人「Optimus」重 73 公斤;
靜坐時功耗為 100W;
快速步行時功耗為 500W;
全身上下包含了 200 個以上的自由度,其中手部可以實現(xiàn) 27 個自由度。
從最開始公布到現(xiàn)在,Optimus 已經(jīng)進(jìn)行了三次演進(jìn)。
Optimus 的傳感器陣容之中,核心是與特斯拉 FSD 系統(tǒng)相似的攝像頭。核心能量供給組件為一塊 2.3kWh 的電池組,整個配電和計算系統(tǒng)集成到「機體」的上半身也就是軀干部分。具體來說的話,在這張透視圖中,Optimus 體內(nèi)藍(lán)色的是電子系統(tǒng),橘色部分是電機。
之所以這么設(shè)計,是在某種程度上參考了特斯拉汽車的成熟設(shè)計,盡可能地減少線束的數(shù)量。
現(xiàn)版本 Optimus 全身上下共有 28 處電機執(zhí)行器——理解成人類的關(guān)節(jié)就好。比起之前宣布的 40 個減少了四分之一以上,目的也很簡單,為了降低整體功耗。
這實際上很好理解。就像智能手表的續(xù)航水平,比起單次充電就能維持動輒一兩周的正常使用,一天不充電就趴窩就跟鬧著玩兒似的。
Optimus 充滿電后可以運行一整天。技術(shù)負(fù)責(zé)人沒有說明這個「運行」是相對常規(guī)的使用情況,還是要去碼頭扛大包這種極端的高強度勞動。
為了讓「腦子」更「清醒」,Optimus 使用了一顆特斯拉自研的 SoC 作為其智能中樞的關(guān)鍵組件,支持 wifi 和 LTE(4G)網(wǎng)絡(luò)連接??紤]到機器人身處的場景與汽車的巨大差異,無線網(wǎng)絡(luò)、音頻輸入等支持,是保護(hù)人類用戶和 Optimus 雙方安全的必要組成。
由于 Optimus 的腿腳還不太利索,特斯拉機器人團隊的其中一位負(fù)責(zé)人表示,他們在 Optimus 上使用了和電動車碰撞安全測試相同的預(yù)測模型,通過計算來預(yù)測 Optimus 在各種姿勢和體態(tài)下正常工作的表現(xiàn),這其中包含了摔倒等情況等情況。
為了保護(hù)機體,結(jié)構(gòu)基礎(chǔ)的優(yōu)化也成為了團隊工作的重點,胸前設(shè)置了能量吸收區(qū)域,不僅能夠幫助機體在摔倒時避免將胳膊和關(guān)節(jié)等關(guān)鍵組件損壞,還能避免直接「摔傻」。
這些有點像是人類的生理結(jié)構(gòu)特性,和在即將跌倒的瞬間反射性采取的一系列生理防御機制。畢竟,受傷之后不管是人類的治療、靜養(yǎng),還是機器人的維修、檢查,各種意義上來講都挺貴的不是嗎。
說到像人,特斯拉機器人團隊為 Optimus 加入了仿生學(xué)概念的設(shè)計。比如,仿照人類膝蓋關(guān)節(jié)的構(gòu)成,將機器膝蓋的關(guān)節(jié)分為 4 個電機。
這么做的前提包含了一系列精密的計算。團隊對試驗過程中收集到的各種數(shù)據(jù),通過微積分的方式進(jìn)行了大量模擬,來微調(diào)電機的功率。一方面降低行動的功耗,另一方面避免了「用力過猛」導(dǎo)致的機體失衡等潛在危險因素。
節(jié)省成本的關(guān)鍵之一,是在前面提到的 Optimus 全身上下 28 處電機中,只采取了 6 種不同的設(shè)計。用極簡的平臺化設(shè)計來提高產(chǎn)能,還能一并降低維護(hù)的成本,很有特斯拉的工業(yè)風(fēng)格不是嗎?
這些關(guān)鍵的電機中,關(guān)鍵部位的負(fù)荷能力之大,單個組件就足以吊起一臺三角鋼琴。
作為人類身上最為精巧的組件,對手部肌肉的控制與靈活運用,可以說是人類進(jìn)化的關(guān)鍵之一。在這方面,特斯拉機器人團隊為 Optimus 設(shè)計了精密但靈敏的小型電機,使之不僅具備搬動沉重物體的能力,還能靈巧地處理那些對精度有較高要求的工作。
為了幫助 Optimus 實現(xiàn)基礎(chǔ)動作,還用上了動作捕捉系統(tǒng),學(xué)習(xí)人類搬動物品時的運動軌跡,再結(jié)合機體的解構(gòu)特點,對整個體態(tài)控制進(jìn)行規(guī)劃。
雖然說 Optimus 用上了很多特斯拉汽車的技術(shù),但對于制造機器人來說,可是大大的不同。畢竟汽車只需要考慮在路上跑的情況,而設(shè)想中雙足人形機器人的活動場景則要比特斯拉汽車復(fù)雜得多。步行只是基礎(chǔ),從上下樓梯、蹲下站起、轉(zhuǎn)身到搬動物體、擰螺絲、電鉆打孔等等等等,都是 Optimus 需要面對的重任。
說到這里,讓我們順便撈一下 87 版《機械戰(zhàn)警》里火力和武德一樣充沛,卻在下樓梯摔得四仰八叉的反派機器人 ED-209。
《機械戰(zhàn)警》中的第一代 ED-209 機器人
在變得有用之前,Optimus 從 2022 年 4 月的蹣跚學(xué)步,到 9 月份正常走路,花了 5 個月時間。幸好馬斯克在創(chuàng)造生命方面足夠有天賦,相信在跟育兒差不多的培育人工智能上也會比同行們走得更快。
為什么特斯拉一定要將自己的量產(chǎn)型機器人設(shè)計成人形?
第一,因為難。相對于非人形機器人,人形使得其設(shè)計和實現(xiàn)難度極具增加。但是實現(xiàn)它,對特斯拉上下來說意義更加巨大。
第二,更具可能性?,F(xiàn)實世界中,應(yīng)用于各行各業(yè)的機器人已經(jīng)很多。舉個簡單的例子,我們中很多人都見過馱著菜品的傳菜機器人穿梭于餐廳、或是頂著屏幕在醫(yī)院大廳四處溜達(dá)的信息窗口機器人。
這些無一例外都是針對單一場景進(jìn)行設(shè)計的。而形體和動作方式更接近人類的人形機器人,在使用場景的可能性上大大超過形態(tài)各異的「前輩」們,也更加具備進(jìn)入人類生活的基本條件。
特斯拉要做的是有用的機器人,而不是技術(shù)玩票。
馬斯克在多個場合表示,Optimus 人形機器人會是特斯拉最重要的產(chǎn)品開發(fā)項目,甚至?xí)绕嚇I(yè)務(wù)與 FSD 計劃更有價值。
特斯拉機器人最初的定位,就是代替人們從事重復(fù)枯燥、具有危險性的工作。而為了讓其走得更長遠(yuǎn),在家做飯、修剪草坪、照顧老人這些讓機器人走進(jìn)千家萬戶的基本場景,才會是特斯拉機器人在人類生活中最真實的寫照。
盡管今年的 AI Day 綿延不絕地持續(xù)了好幾個小時,馬斯克還是沒有忘記在活動結(jié)束后第一時間上線跟網(wǎng)友們激情互動。這不,他還說之后 Optimus 機器人還會有貓女(catgirl)版。
說實話,如果特斯拉上下真有這個閑心的話,我到希望他們以后出個 Daft Punk 版,也許這才更能襯托馬斯克的那身黑皮夾克。
法國傳奇電子音樂組合 Daft Punk
一年80倍,F(xiàn)SD迭代駛上快車道
相比于初次亮相的人形機器人原型機,F(xiàn)SD 算是老生常談了。作為老朋友的 FSD,很難再看到顛覆性的技術(shù)飛躍,但是硬核的優(yōu)化也不少。
首先是測試規(guī)模的擴大。目前,FSD Beta 自動駕駛測試版有 16 萬名客戶,2021 年還只有 2000 名。一年之間,測試數(shù)量擴大了 80 倍。對于堅持純視覺路線的 FSD 來說,推送規(guī)模的擴大,意味著能夠提供源源不斷的高價值數(shù)據(jù)作為「養(yǎng)料」。
利用自動標(biāo)注、模擬的訓(xùn)練數(shù)據(jù),來訓(xùn)練由識別算法和環(huán)境建模算法等構(gòu)成的 FSD 主體算法框架,完成整個迭代的過程,是 FSD 自動駕駛算法的開發(fā)流程。
在去年的 AI DAY 上,特斯拉透露了在自動駕駛技術(shù)上使用了 Occupancy.NETworks 神經(jīng)網(wǎng)絡(luò)模型,直接在神經(jīng)網(wǎng)絡(luò)中完成 2D 的圖像平面到 3D 的 BEV 空間的變換,提升了多攝像頭感知下的準(zhǔn)確性和穩(wěn)定性。今年,進(jìn)一步將整個閉環(huán)流程優(yōu)化。
比如,為了提高效率,特斯拉建立了一個「自動標(biāo)注機器」,用智能標(biāo)注代替人工標(biāo)注。
借助自動標(biāo)志機制,能夠在相機顯示不清楚時使用其他剪輯來填充圖片,更智能地選取視頻幀,提高視頻幀質(zhì)量的同時減少數(shù)量,將訓(xùn)練速度提高 30%。
同樣地,仿真模擬的效率和質(zhì)量也進(jìn)行了優(yōu)化?;谲囕v采集到的真實信息,可以將通常要幾個星期人工完成的重建模擬環(huán)境,在不到 30 分鐘內(nèi)完成。
目前,F(xiàn)SD 深度神經(jīng)網(wǎng)絡(luò)達(dá)到 100 萬參數(shù),15 萬+神經(jīng)網(wǎng)絡(luò)層,37.5 萬個鏈接,過去一年里工程師們對 7.5 萬個神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練。這些都是優(yōu)化訓(xùn)練模型的結(jié)果。
不只是訓(xùn)練模型的到了優(yōu)化,在決策方面也做出了優(yōu)化。這次特斯拉的工程師們專門提到了對自動駕駛的史詩級難題——無保護(hù)左轉(zhuǎn)做出的改進(jìn),在無保護(hù)左轉(zhuǎn)時,不僅能識別、預(yù)判行為的行為,也能識別小狗。
其實在最近 FSD 的幾次更新中,無保護(hù)左轉(zhuǎn)更自然、減少激進(jìn)的「極限操作」一直是一個趨勢,這也讓自動駕駛越來越更接近人的駕駛行為。
當(dāng)然,在優(yōu)化了 FSD 后,馬斯克又來「放衛(wèi)星」了,「從技術(shù)角度來看,我們已經(jīng)具備了年底進(jìn)入全球市場的能力?!?/strong>
已經(jīng)數(shù)不清這是第幾次 FSD 全面開放的預(yù)告了,不過技術(shù)之外各地區(qū)監(jiān)管政策,才是決定國內(nèi)車主們能不能體驗到 FSD 的關(guān)鍵。
Dojo 超級計算機:
劍指英偉達(dá),覬覦亞馬遜
去年在 AI DAY 上亮相時,Dojo 就因為趕超芯片大廠的潛力備受關(guān)注。今年 Dojo 直接拉出了英偉達(dá) A100 來對標(biāo)。
Dojo 超級計算機的單個訓(xùn)練模塊由 25 塊特斯拉自研的神經(jīng)網(wǎng)絡(luò)訓(xùn)練芯片——D1 組成。由于每個 D1 芯片之間都是無縫連接在一起,相鄰芯片之間的延遲極低,訓(xùn)練模塊最大程度上實現(xiàn)了帶寬的保留。
相比于去年首發(fā)時,Dojo 的設(shè)計更加集成。這使得一個 Dojo 訓(xùn)練模塊,相當(dāng)于 6 個通用 GPU 性能,而能耗和成本僅相當(dāng)于 1 個 GPU。
簡單來說,Dojo 能將通常需要幾個月的工作減少到一個星期。
在與英偉達(dá) A100 的對比中,特斯拉的工程師給出了 Dojo 和英偉達(dá) A100 在跑經(jīng)典圖像分類模型 ResNet-50 時的結(jié)果,Dojo 可以實現(xiàn)比 A100 更高的幀率;而跑神經(jīng)網(wǎng)絡(luò)模型 Occupancy Network 時,Dojo 的性能倍增;最終的目標(biāo)是 4.4 倍于 A100 的單芯片訓(xùn)練速度,和更低的能耗、成本。
當(dāng)然,對于實力強勁的 Dojo,馬斯克的預(yù)期也不是只給特斯拉自己用,「也會考慮 AWS 一樣的方式對外商用?!?/strong>
看來,Dojo 的目標(biāo)對手不只有英偉達(dá),也有亞馬遜云。
2023 年第一季度,第一個 Dojo Exa POD 就將完工面世,對于大家最直接的用處,可能就是大幅度提高 FSD 數(shù)據(jù)處理的速度。
最后
就在 AI DAY 的前一天,馬斯克在社交網(wǎng)絡(luò)上說,這次活動的目的是為了招聘人工智能和機器人領(lǐng)域的工程師。
不知道極客的工程師們,有沒有被這場全程硬核的 AI DAY 「撩」到呢?