UniAD大模型開(kāi)路,智能車(chē)駛?cè)階GI時(shí)代

HiEV大蒜粒車(chē)研所 整合編輯:龔震 發(fā)布于:2024-05-14 17:38

在剛剛結(jié)束不久的北京車(chē)展上,除一眾明星車(chē)型亮相,供應(yīng)鏈企業(yè)也開(kāi)始大秀肌肉,其中尤其以端到端大模型為代表,煥新一代的智駕技術(shù)棧掀起了新一輪熱潮。

作為首個(gè)提出感知決策一體化自動(dòng)駕駛通用模型的公司,商湯絕影也在這次車(chē)展上第一次向公眾展示了面向量產(chǎn)的端到端自動(dòng)駕駛解決方案UniAD(Unified Autonomous Driving)的道路測(cè)試表現(xiàn)。

UniAD,讓智能駕駛「像人一樣」

相信不少用戶已經(jīng)關(guān)注到,今年以來(lái),幾乎所有車(chē)企或產(chǎn)業(yè)鏈公司在宣傳智駕時(shí),最常用的形容詞之一,就是「媲美真人駕駛」。

端到端大模型的出現(xiàn),其重要方向之一就是解決「駕駛擬人化」的問(wèn)題。

商湯絕影在這次北京車(chē)展上,展示出了在無(wú)高精地圖、僅靠視覺(jué)感知的實(shí)際道路測(cè)試成果

無(wú)論是城市道路還是無(wú)線的鄉(xiāng)村道路上,搭載UniAD的車(chē)輛都能準(zhǔn)確地完成大角度左轉(zhuǎn)上橋、避讓占道車(chē)輛及施工區(qū)域、繞行跑步行人等一系列高難度操作。

通常城市道路錯(cuò)綜復(fù)雜,鄉(xiāng)村道路更是路況難測(cè),比如永遠(yuǎn)不知道什么時(shí)候會(huì)有慢行車(chē)擋路;什么時(shí)候會(huì)有電動(dòng)小三輪突然從側(cè)方出現(xiàn);什么時(shí)候前方會(huì)有占道施工或臨時(shí)堵塞等等。

這種無(wú)固定性、遇到情況需要依靠車(chē)主自身經(jīng)驗(yàn)解決的行駛場(chǎng)景,在自動(dòng)駕駛領(lǐng)域被稱之為Corner Case。

盡管類似場(chǎng)景和挑戰(zhàn),在整個(gè)駕駛過(guò)程中的占比可能不到10%,能否解決這樣的場(chǎng)景,卻是智駕從定位「小眾科技」贏得大眾信任的關(guān)鍵,也是智駕系統(tǒng)安全性的關(guān)鍵。

隨著城區(qū)智駕成為高階智駕競(jìng)爭(zhēng)的主戰(zhàn)場(chǎng),場(chǎng)景計(jì)算的復(fù)雜度呈指數(shù)級(jí)增長(zhǎng)。大量的人力資源投入也只是增加有限的規(guī)則,無(wú)法應(yīng)對(duì)數(shù)量無(wú)限的復(fù)雜場(chǎng)景和長(zhǎng)尾路況。

基于此,端到端技術(shù)的出現(xiàn)開(kāi)辟了一條新路徑,將智駕的開(kāi)發(fā)范式從鋪設(shè)大量人力,轉(zhuǎn)變?yōu)槌掷m(xù)算力投入和高質(zhì)量數(shù)據(jù)輸入。

今年年初,特斯拉開(kāi)始向部分用戶推送FSD V12版本的端到端自動(dòng)駕駛方案,業(yè)內(nèi)也出現(xiàn)了越來(lái)越多的端到端智駕方案,不過(guò)大部分端到端方案采用的是更容易落地的由感知和決策兩個(gè)模型組成的「兩段式」架構(gòu),兩個(gè)模型之間依然存在信息傳遞過(guò)濾或丟失的問(wèn)題。

而UniAD將感知、決策、規(guī)劃等模塊都整合到一個(gè)全棧Transformer端到端模型,也就是一個(gè)完全感知決策一體化的「端到端」技術(shù)棧。

借助商湯科技大裝置的算力、高質(zhì)量仿真數(shù)據(jù)以及模型性能,UniAD端到端方案有更高的能力上限,以及強(qiáng)大的學(xué)習(xí)和思考能力;數(shù)據(jù)驅(qū)動(dòng)的端到端模型泛化能力強(qiáng)、迭代效率快,可以幫助車(chē)企低成本快速開(kāi)城;純視覺(jué)感知的無(wú)圖方案,進(jìn)一步降低系統(tǒng)的軟硬件成本,助力智駕普及,實(shí)現(xiàn)全國(guó)都能開(kāi)。

在端到端系統(tǒng)基礎(chǔ)上,商湯絕影在這次車(chē)展期間還介紹了新一代自動(dòng)駕駛大模型DriveAGI,推動(dòng)自動(dòng)駕駛從數(shù)據(jù)驅(qū)動(dòng)向認(rèn)知驅(qū)動(dòng)的躍遷。

大模型登陸小米SU7,智能座艙升維開(kāi)卷

在此之前的4月23日,商湯科技發(fā)布全新升級(jí)的「日日新SenseNova 5.0」大模型。

據(jù)悉,6000億參數(shù)的「日日新5.0」采用混合專家架構(gòu)(MOE),具備更強(qiáng)的知識(shí)、數(shù)學(xué)、推理及代碼能力,成為國(guó)內(nèi)首個(gè)全面對(duì)標(biāo)甚至超越GPT-4 Turbo的大模型,多模態(tài)能力領(lǐng)先GPT-4V。

基于端云結(jié)合的架構(gòu),商湯端側(cè)大模型大幅超越同量級(jí)大模型,越級(jí)比肩7B、13B大模型,更適合車(chē)端部署。

據(jù)官方透露,前不久上市的小米SU7將AI大模型帶進(jìn)座艙,而商湯日日新大模型也全面助力小愛(ài)同學(xué)車(chē)載語(yǔ)音場(chǎng)景應(yīng)用。

但這不是商湯絕影發(fā)力座艙體驗(yàn)升維的全部。

據(jù)悉,商湯絕影從去年發(fā)售的Apple Vision Pro汲取靈感,憑借感知技術(shù)和高效的迭代效率,將3D Gaze高精視線交互和3D動(dòng)態(tài)手勢(shì)交互這兩大全新座艙3D交互演示帶到現(xiàn)場(chǎng),讓觀眾體驗(yàn)到更符合人類直覺(jué)的艙內(nèi)交互方式,推動(dòng)座艙交互向更安全、更便利的3D交互升維進(jìn)化。

據(jù)現(xiàn)場(chǎng)演示,操作人員坐在模仿座艙的屏幕前,通過(guò)3D Gaze高精視線交互和3D動(dòng)態(tài)手勢(shì)交互,方法與Apple Vision Pro相類似。據(jù)說(shuō),這是全球首創(chuàng)的能夠通過(guò)視線定位與屏幕圖標(biāo)進(jìn)行交互的智能座艙技術(shù)。

目前,采用「非接觸式」交互已經(jīng)成為智能座艙交互革命的必然趨勢(shì),而視線交互是最為直接和便捷的方案之一。但過(guò)去,受限于精度等原因,DMS通常只能做到分心監(jiān)測(cè)等艙內(nèi)大面積區(qū)域的識(shí)別,很難通過(guò)它進(jìn)行具體的交互動(dòng)作。

商湯絕影全球首創(chuàng)3D Gaze高精視線交互,通過(guò)提升視線的精度,能精準(zhǔn)識(shí)別到駕駛員注視中控屏或者后排用戶看向后排屏幕的具體的某個(gè)圖標(biāo)并進(jìn)行交互,實(shí)現(xiàn)「所見(jiàn)即所選」。

這背后,是一套「千人千眼」的高精度三維眼球模型

商湯絕影使用先進(jìn)的眼動(dòng)追蹤技術(shù)和高精度的眼部成像設(shè)備,收集并分析駕駛員的眼部數(shù)據(jù),精準(zhǔn)為每個(gè)人的定制個(gè)性化的眼球模型,再以「千人千眼」的高精度三維眼球模型為基礎(chǔ),結(jié)合創(chuàng)新的亞像素級(jí)細(xì)節(jié)定位和信息融合技術(shù),突破了座艙場(chǎng)景下的視線精度難題,配合手勢(shì)、語(yǔ)音甚至是眨眼等方式,將給用戶帶來(lái)更智能、更個(gè)性化的艙內(nèi)視覺(jué)交互體驗(yàn)。

3D動(dòng)態(tài)手勢(shì)交互則是以超高精的三維手部重建為基礎(chǔ),實(shí)時(shí)捕捉、識(shí)別與分析用戶的三維手勢(shì)動(dòng)作,實(shí)現(xiàn)對(duì)車(chē)輛功能控制的技術(shù),能讓用戶通過(guò)手勢(shì)隔空進(jìn)行各類座艙交互。

商湯絕影表示,已經(jīng)實(shí)現(xiàn)這兩大艙內(nèi)3D交互功能相互配合,如同Vision Pro裸眼上車(chē),革命性改變了座艙交互的方式,讓用戶從傳統(tǒng)的物理按鍵和屏幕觸控方式中解脫出來(lái),打造更符合人類直覺(jué)的自然交互體驗(yàn)。

絕影尋找自己的「問(wèn)界」

未來(lái)汽車(chē)智能化的競(jìng)爭(zhēng),本質(zhì)上是通用人工智能技術(shù)融合應(yīng)用的比拼。」這是商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家、絕影智能汽車(chē)事業(yè)群總裁王曉剛的觀點(diǎn)。

而在智能汽車(chē)的浪潮里,商湯絕影給自己的定位是:加速智能汽車(chē)駛?cè)階GI時(shí)代的核心技術(shù)伙伴,將人工智能技術(shù)與汽車(chē)產(chǎn)業(yè)深度融合,構(gòu)建了駕 - 艙 - 云三位一體的通用人工智能 (AGI) 技術(shù)架構(gòu),打造了智能駕駛、智能座艙和AI云的多元產(chǎn)品體系。從技術(shù)實(shí)力上來(lái)看,背靠商湯的商湯絕影,有毋庸置疑的技術(shù)底蘊(yùn)和研發(fā)實(shí)力,但再好的技術(shù)也需要強(qiáng)力的產(chǎn)品來(lái)推動(dòng)落地和背書(shū)。在這一方面,商湯絕影還需要更多強(qiáng)有力的合作伙伴。截至2023年12月,商湯絕影已與本田、比亞迪、長(zhǎng)城、廣汽、紅旗、極氪、哪吒、奇瑞、蔚來(lái)等超過(guò)30家國(guó)內(nèi)外車(chē)企攜手合作,覆蓋超90款車(chē)型,累計(jì)交付195萬(wàn)輛智能汽車(chē)。其中不乏廣汽埃安旗下高端豪華品牌昊鉑王牌車(chē)型GT這樣的高端車(chē)型,也有極氪X、奇瑞捷途旅行者等中端定位的車(chē)型,但商湯絕影還需要更加強(qiáng)有力的爆款車(chē)型,讓真正的消費(fèi)級(jí)市場(chǎng)有所感知。智能車(chē)時(shí)代,商湯絕影也在找尋自己的那個(gè)「問(wèn)界」。

文章來(lái)源:HiEV大蒜粒車(chē)研所

HiEV大蒜粒車(chē)研所

原創(chuàng)IP推薦

換一換

網(wǎng)友評(píng)論

聚超值•精選

最新內(nèi)容

UniAD大模型開(kāi)路,智能車(chē)駛?cè)階GI時(shí)代

商湯絕影在北京車(chē)展上展示了UniAD端到端自動(dòng)駕駛解決方案的道路測(cè)試成果。該技術(shù)通過(guò)感知、決策和規(guī)劃等模塊整合為一個(gè)全棧Transformer端到端模型,實(shí)現(xiàn)智能駕駛的「媲美真人駕駛」目標(biāo)。

智駕技術(shù)棧 | 端到端大模型
追尾自燃,高速誤剎車(chē),車(chē)企智駕的過(guò)度營(yíng)銷該停止了

新能源車(chē)安全性引發(fā)擔(dān)憂,智能駕駛系統(tǒng)存在過(guò)度營(yíng)銷和夸大宣傳。近期山西運(yùn)城問(wèn)界M7 Plus碰撞事故再次引起關(guān)注。專家認(rèn)為,新能源車(chē)事故頻發(fā)可能與動(dòng)力形式變化導(dǎo)致的車(chē)輛性能過(guò)剩有關(guān)。此外,隱藏式門(mén)把手設(shè)計(jì)對(duì)救援造成阻礙、AEB等輔助駕駛功能被過(guò)度神話也是問(wèn)題所在。

新能源車(chē)安全性 | 智能駕駛
造了50萬(wàn)輛車(chē)后,蔚來(lái)自認(rèn)為的護(hù)城河是什么

蔚來(lái)是一家新造車(chē)品牌,在建設(shè)Nio Power換電站、打造用戶社區(qū)等方面進(jìn)行了大量創(chuàng)新和探索。通過(guò)高端品牌定位、銷售能力和柔性生產(chǎn)能力以及體系化服務(wù)能力,他們逐漸建立起自己的護(hù)城河。蔚來(lái)希望先在高端市場(chǎng)打下基礎(chǔ),然后再進(jìn)軍主流市場(chǎng)競(jìng)爭(zhēng)。

蔚來(lái) | 護(hù)城河
余承東不當(dāng)CEO了,汽車(chē)圈可能少了位高管網(wǎng)紅。

華為官方網(wǎng)站上顯示,余承東從終端BG CEO變成了董事長(zhǎng),由何剛接替CEO職位。余承東是華為的重要人物,在過(guò)去幾年里帶領(lǐng)公司進(jìn)軍汽車(chē)行業(yè),并取得了不錯(cuò)的成績(jī)。他推動(dòng)的智選車(chē)業(yè)務(wù)在市場(chǎng)上表現(xiàn)出色,與合作伙伴賽力斯、問(wèn)界等品牌一起取得了成功。

余承東 | CEO
李書(shū)福又一次得償所愿

極氪智能科技成功登陸紐交所,募資約4.41億美元。吉利汽車(chē)成為最大認(rèn)購(gòu)方,持股比例接近75%。極氪計(jì)劃將資金用于開(kāi)發(fā)更先進(jìn)的電動(dòng)汽車(chē)技術(shù)、擴(kuò)大產(chǎn)品組合、銷售和營(yíng)銷以及一般企業(yè)用途。然而,面臨研發(fā)費(fèi)用增加、盈利能力不穩(wěn)定等挑戰(zhàn),極氪需要尋找屬于自己的競(jìng)爭(zhēng)優(yōu)勢(shì)。

極氪智能科技 | IPO
太平洋科技旗下
讀懂科技出行 · 聚焦未來(lái)出行趨勢(shì)
APP下載
微信公眾號(hào)
B站
新浪微博
聯(lián)系我們
二維碼 回到頂部