比特斯拉還少1個(gè)攝像頭!智能車賽道最隱秘的AI視覺玩家浮現(xiàn)
智能車賽道,藏著一個(gè)最隱秘的AI視覺玩家。
(資料圖片僅供參考)
這個(gè)玩家尚未官宣任何智能車相關(guān)的業(yè)務(wù)進(jìn)展,但又在最核心、最前沿、最被渴求的自動(dòng)駕駛系統(tǒng)能力上屢屢展現(xiàn)競(jìng)爭(zhēng)力——全球AI頂會(huì)冠軍級(jí)的統(tǒng)治力。
不僅具體技術(shù)上突出,在目標(biāo)檢測(cè)、語(yǔ)義分割、視覺推理等方面有諸多頂會(huì)級(jí)研究;還拿下多個(gè)自動(dòng)駕駛相關(guān)比賽的冠軍,甚至還用7個(gè)攝像頭的純視覺方案,完成了高速、城區(qū)和泊車環(huán)境的自動(dòng)駕駛。
這個(gè)玩家不是特斯拉的AI團(tuán)隊(duì),這個(gè)玩家是曠視科技。
在最近的AI頂會(huì)CVPR中,大模型加持下的視覺研究,正在驅(qū)動(dòng)自動(dòng)駕駛方向的新研究,而曠視研究院,在一眾自動(dòng)駕駛和智能車玩家參與的競(jìng)賽中,獲得了考察自動(dòng)駕駛環(huán)境感知能力的冠軍。
AI視覺領(lǐng)域的超級(jí)明星,現(xiàn)如今在業(yè)務(wù)上還沒有與智能車傳出關(guān)聯(lián)。
但有這樣的技術(shù)研究和成果,當(dāng)真會(huì)純出于學(xué)術(shù)研究?
曠視刷榜了什么自動(dòng)駕駛比賽?
曠視研究院參加的這個(gè)比賽,是CVPR 2023專門面向自動(dòng)駕駛感知決策系統(tǒng)設(shè)立的挑戰(zhàn)賽。
其中OpenLane拓?fù)潢P(guān)系挑戰(zhàn)賽冠軍,被曠視收入囊中。
挑戰(zhàn)賽一共四個(gè)賽道,除了曠視參加的OpenLane拓?fù)潢P(guān)系挑戰(zhàn)賽(OpenLane Topology),還有在線高精地圖構(gòu)建挑戰(zhàn)賽(Online HD Map Construction)、三維占據(jù)柵格預(yù)測(cè)挑戰(zhàn)賽(3D Occupancy Prediction)和nuPlan規(guī)劃挑戰(zhàn)賽(nuPlan Planning)。
其中,OpenLane拓?fù)潢P(guān)系賽道主要考察自動(dòng)駕駛技術(shù)理解場(chǎng)景的能力。
賽道要求基于OpenLane-V2(OpenLane-Huawei)數(shù)據(jù)集,輸入給定環(huán)視相機(jī)照片,參賽者需要輸出車道中心線和交通元素的感知結(jié)果,以及這些元素之間的拓?fù)潢P(guān)系預(yù)測(cè)。
也就是說(shuō),這個(gè)比賽不是考察以往自動(dòng)駕駛感知中,對(duì)車道邊緣線或者交通標(biāo)志單一的識(shí)別能力,而是要求自動(dòng)駕駛技術(shù)可以感知車道中心線,還要能理解車道中心線和交通元素的邏輯關(guān)系,比如綠燈亮了,這意味著哪條車道可以通行。
那么如何判定冠軍?OpenLane-V2數(shù)據(jù)集提供了判定標(biāo)準(zhǔn):OLS分?jǐn)?shù)(OpenLane-V2 Score),通過(guò)計(jì)算感知結(jié)果和拓?fù)漕A(yù)測(cè)mAP的平均值判定得分。
在34個(gè)參賽隊(duì)伍中,來(lái)自曠視研究院的隊(duì)伍得分唯一超過(guò)55分,達(dá)到分,具有明顯優(yōu)勢(shì)。
那么,曠視用了什么樣的方法?
曠視的自動(dòng)駕駛純視覺方案
首先感知階段,對(duì)于交通元素檢測(cè)和車道中心線檢測(cè)兩個(gè)感知任務(wù),曠視分別采用了兩個(gè)不同的模型。
對(duì)于交通元素檢測(cè),曠視使用主流2D檢測(cè)模型YOLO系列中最新一代YOLOv8作為baseline,相較于其他2D檢測(cè)方法YOLO速度更快,性能更準(zhǔn)確。
△圖片來(lái)源:GitHub用戶RangeKing
再加上比賽使用的數(shù)據(jù)集OpenLane-V2標(biāo)注了交通標(biāo)識(shí)和車道的對(duì)應(yīng)關(guān)系,曠視在YOLOv8訓(xùn)練過(guò)程中增加Strong augmentation、Reweighting classification loss、Resampling difficult samples、Pseudo label learning和Test-time augmentation共5個(gè)trick,通過(guò)和前視角圖像交互生成對(duì)應(yīng)交通元素的特征。
對(duì)于車道中心線檢測(cè),曠視使用自研PETRv2模型作為baseline。PETRv2提供了一個(gè)統(tǒng)一的純視覺3D感知框架,可以用于3D目標(biāo)檢測(cè)和BEV分割。
而在這次比賽中,曠視利用PETRv2從多視角圖像中提取2D特征,以及利用攝像頭截錐空間中生成3D坐標(biāo),把2D特征和3D坐標(biāo)輸入3D位置編碼器。
隨后使用3D位置編碼器給Transformer解碼器生成key和value組件,lane queries再通過(guò)全局注意力機(jī)制和圖像特征進(jìn)行交互,生成3D車道中心線檢測(cè)成果和對(duì)應(yīng)的車道中心線特征。
而在拓?fù)潢P(guān)系預(yù)測(cè)階段,曠視基于YOLOv8和PETRv2搭建了一個(gè)多階段的網(wǎng)絡(luò)框架,并利用兩個(gè)感知任務(wù)生成的成果拼接對(duì)應(yīng)特征,再使用兩層MLP預(yù)測(cè)對(duì)應(yīng)的拓?fù)潢P(guān)系矩陣。
(圖注:曠視最終在驗(yàn)證集上的預(yù)測(cè)結(jié)果,包括邊框、類別和置信度)
最后從OLS得分來(lái)看,曠視團(tuán)隊(duì)的這套方法在交通元素感知(DETt)、車道線之間拓?fù)潢P(guān)系預(yù)測(cè)(TOPll)和車道線與交通元素拓?fù)潢P(guān)系預(yù)測(cè)(TOPlt)方面均領(lǐng)先于其他參賽者。
智能車賽道最隱秘的AI視覺玩家
參加這次比賽的,是曠視研究院的MFV(Megvii-Foundation model-Video)團(tuán)隊(duì)。
比賽成果論文一作是吳東明,2019年在北京理工大學(xué)徐班取得學(xué)士學(xué)位,后來(lái)繼續(xù)在北理攻讀計(jì)算機(jī)系的博士學(xué)位,師從沈建冰教授,在2022年成為曠視研究院的研究實(shí)習(xí)生。
論文的其他作者也都來(lái)自曠視研究院,其中Chang Jiahao畢業(yè)于中國(guó)科技大,Li Zhuoling畢業(yè)于香港大學(xué)。
值得一提的是,這次挑戰(zhàn)賽使用的PETRv2模型,還是曠視研究院創(chuàng)始院長(zhǎng)孫劍博士去世前,帶領(lǐng)研究團(tuán)隊(duì)發(fā)布的學(xué)術(shù)成果之一。
并且,這也不是曠視唯一的自動(dòng)駕駛相關(guān)研究成果。
除了PETR系列大模型,曠視還發(fā)布過(guò)BEVDepth檢測(cè)模型(可對(duì)3D目標(biāo)實(shí)現(xiàn)高精度的深度估計(jì)),LargeKernel3D(首次證明大卷積核對(duì)3D視覺任務(wù)的可行性和必要性),BEVStereo(nuScenes純視覺方案3D目標(biāo)檢測(cè)SOTA)等……都是行業(yè)領(lǐng)先級(jí)的技術(shù)成果。
△BEVStereo模型框架
一直以來(lái),曠視研究院都是曠視AI技術(shù)的研發(fā)“大腦”,主攻深度學(xué)習(xí)和計(jì)算機(jī)視覺方向,也是包括AI生產(chǎn)力平臺(tái)Brain++、開源深度學(xué)習(xí)框架天元MegEngine、移動(dòng)端高效卷積神經(jīng)網(wǎng)絡(luò)ShuffleNet等成果的誕生地,已經(jīng)對(duì)外發(fā)表了超過(guò)120篇全球頂會(huì)論文;斬獲頂級(jí)賽事中冠軍數(shù)超過(guò)40項(xiàng),擁有1300余件業(yè)務(wù)相關(guān)專利授權(quán)。
而且在區(qū)別于純研發(fā)或前沿技術(shù)預(yù)研布局的企業(yè)研究院,曠視研究院從一開始就被作為作戰(zhàn)部隊(duì)使用,所以曠視研究院的最新成果、瞄準(zhǔn)的方向,一般都不會(huì)一時(shí)興起,或者純?yōu)檠芯慷芯俊?/p>
于是這也是曠視接二連三在自動(dòng)駕駛、智能車賽道方向上產(chǎn)出頂級(jí)成果后,需要關(guān)注的地方。
相比老朋友商湯科技,曠視至今沒有官宣任何智能車、自動(dòng)駕駛業(yè)務(wù)或合作,而商湯則推出了專門的智能車業(yè)務(wù)品牌絕影,由聯(lián)合創(chuàng)始人王曉剛帶隊(duì),目標(biāo)要成為商湯的支柱型新增長(zhǎng)引擎。
對(duì)于智能車和自動(dòng)駕駛這樣的萬(wàn)億規(guī)模賽道,曠視會(huì)始終心如止、按兵不動(dòng)?不太可能。
更何況從技術(shù)研究能力到技術(shù)實(shí)現(xiàn)水平,都已經(jīng)通過(guò)頂會(huì)得到了展現(xiàn)。
以及,曠視研究院還展示過(guò)一段自動(dòng)駕駛預(yù)研Demo,僅使用7個(gè)攝像頭,就能實(shí)現(xiàn)高速公路和城區(qū)的自動(dòng)駕駛,并且還能完成水平、垂直以及側(cè)方位停車。
這是什么水平?
作為參考,純視覺王者特斯拉,自動(dòng)駕駛感知方案最少也需要8個(gè)攝像頭。
論文傳送門:
/e2ead/AD23Challenge/Track_1_
關(guān)鍵詞:
您可能也感興趣:
為您推薦
麻醉也可治療失眠 但不宜長(zhǎng)期使用
臺(tái)媒:李玟遺體將被解剖 李玟為何會(huì)被解剖遺體
聯(lián)合打擊整治!山東省今年已打掉非法社會(huì)組織58家
更多
- 比特斯拉還少1個(gè)攝像頭!智能車賽道最隱秘的AI視覺玩家浮現(xiàn)
- 高級(jí)審計(jì)師考試《高級(jí)審計(jì)實(shí)務(wù)》考點(diǎn)習(xí)題:案例題(十五)及答案
- 美反戰(zhàn)組織聯(lián)合創(chuàng)始人:集束彈藥將使烏克蘭未來(lái)數(shù)十年承受后果
- 丘壑的意思和造句_丘壑的意思
- 易普力(002096.SZ)子公司聯(lián)合體中標(biāo)有關(guān)石英砂巖礦開采施工項(xiàng)...
- 暑運(yùn)期間 重慶新開恢復(fù)多條國(guó)際航線
- 《消夏避暑夜游報(bào)告2023》顯示:我國(guó)居民夜間旅游出行意愿強(qiáng)烈
- 舊金山抗議者利用交通錐阻礙自動(dòng)駕駛車輛
更多
- 《博德之門3》發(fā)行預(yù)熱短片展示新地點(diǎn)和浪漫鏡頭
- 差距巨大!國(guó)家信息中心:特斯拉單車?yán)麧?rùn)是比亞迪的8.5倍
- 時(shí)代出版: 公司暫未使用高算力、高速度的光模塊服務(wù)器
- 粵媒曝里皮用人標(biāo)準(zhǔn)!一習(xí)慣讓恒大主力絕望,拿最佳也進(jìn)不了國(guó)足
- 羅馬尼亞擬設(shè)F-16戰(zhàn)機(jī)飛行員區(qū)域培訓(xùn)中心
- 江淮汽車:上半年銷量27.88萬(wàn)輛,純電動(dòng)乘用車產(chǎn)銷同比雙雙下跌
- 黃瀾前老公照片(黃瀾的前夫是誰(shuí) 真的沒有人敢說(shuō)出來(lái)嗎)
- 7月7日山東地區(qū)醋酸行情整理上行
排行
- 易普力(002096.SZ)子公司聯(lián)合體中標(biāo)有關(guān)石英砂巖礦開采施工項(xiàng)...
- 科技智庫(kù)需要進(jìn)一步加快智庫(kù)成果轉(zhuǎn)化
- 雄安設(shè)立兩年 290家京企“搶灘登陸”
- 女子拽男友公交車方向盤受審 涉嫌危害公共安全罪
- 成都實(shí)施創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略,將挖掘培養(yǎng)高素質(zhì)職工人才
- “人造雪粉”接觸眼睛或被誤食可能有危險(xiǎn)
- 這一年,我們?yōu)榭萍肌俺尺^(guò)的架”真不少
- “四成人不知電商法”該如何破題
- 監(jiān)督搭平臺(tái)信息都上網(wǎng) 打通精準(zhǔn)監(jiān)督‘最后一公里’
- 智能烹飪機(jī),選購(gòu)有講究
最近更新
- 比特斯拉還少1個(gè)攝像頭!智能車賽道最隱秘的AI視覺玩家浮現(xiàn)
- 一夜10大轉(zhuǎn)會(huì)動(dòng)態(tài):奧納納接近加盟曼聯(lián),米蘭即將簽下普利西奇
- 人壽學(xué)生保險(xiǎn)查詢?cè)趺床??保險(xiǎn)保障有哪些?
- 怎么統(tǒng)計(jì)的?馬卡記者:姆巴佩今年來(lái)皇馬的概率為97%
- 上樹ESPN:姆巴佩認(rèn)為不得不離隊(duì)&皇馬已備好一切,總價(jià)超2億歐
- 澤塔奧特曼最終話劇透圖搶先看女主洋子平安無(wú)事遙輝有危險(xiǎn)
- 向云端,扎西次仁和他的背包
- 商務(wù)部:投資便利化協(xié)定將為我國(guó)企業(yè)對(duì)外投資提供更多保障
- “20寶龍04”盤中臨時(shí)停牌
- 蘇家屯區(qū)氣象臺(tái)發(fā)布雷電黃色預(yù)警信號(hào)
- 上海黃浦區(qū)建設(shè)領(lǐng)域碳達(dá)峰實(shí)施方案:新建建筑可再生能源替代...
- 巴西經(jīng)濟(jì)學(xué)家:過(guò)度依賴美元傷害拉美經(jīng)濟(jì)
- 莫德納入華,中國(guó)疫苗行業(yè)迎來(lái)“鯰魚”
- 美國(guó)真要告別加密貨幣?拉斯維加斯加密行業(yè)崗位竟消失了80%
- 上海貴酒鄢克亞:白酒價(jià)格倒掛不是經(jīng)銷商的問(wèn)題,本質(zhì)上是源...
- 她們重新定義偉大|「SHE POWER·2023影響力女性50」征集啟動(dòng)
- 電影《失孤》原型郭剛堂兒子被拐案一審開庭
- 7月7日基金凈值:中郵睿信增強(qiáng)債最新凈值1.114
- 夢(mèng)幻模擬戰(zhàn)高里炙烤能量棒皮膚如何獲得
- 崩壞星穹鐵道epic國(guó)際服介紹
- 【電源設(shè)備】歐洲新能源車銷量點(diǎn)評(píng):6月銷量同環(huán)比雙升
- 【煤炭行業(yè)】煤炭債季度復(fù)盤:二季度長(zhǎng)期限發(fā)行明顯增加,煤...
- 城市綠化相關(guān)股票有哪些?A股城市綠化概念股名單匯總
- 2023年鎵金屬概念股名單全梳理(7月7日)
- 華東重機(jī)兩次80億布局光伏,押寶TOPcon前景如何?
- 多舉措保供 確保居民“菜籃子”量足價(jià)穩(wěn)
- 無(wú)人駕駛出租車可以收費(fèi)載客了
- 陳哲遠(yuǎn)趙露思拍雜志 趙露思教陳哲遠(yuǎn)摸頭 基本情況講解
- 力星股份(300421.SZ):生產(chǎn)的滾動(dòng)體產(chǎn)品在國(guó)內(nèi)高端新能源汽車...
- 港股異動(dòng) | 中國(guó)儒意(00136)午后漲超4% 近日配股凈籌40億...
今日要聞
- 比特斯拉還少1個(gè)攝像頭!智能車賽道最隱秘的AI視覺玩家浮現(xiàn)
- 華潤(rùn)旗下金沙窖酒 業(yè)績(jī)腰斬,想獨(dú)占“金沙”商標(biāo)?該路不通!
- 交運(yùn)ETF(159662)漲超1.2%,傳化智聯(lián)、招商南油、中信海直、京滬高鐵漲幅居前
- 都是同齡人,為什么有人顯老,有人卻顯得更年輕?原因終于找到了!
- 《博德之門3》發(fā)行預(yù)熱短片展示新地點(diǎn)和浪漫鏡頭
- 應(yīng)城市陳河鎮(zhèn)姜志容榮獲“孝感楷?!狈Q號(hào)
- 高級(jí)審計(jì)師考試《高級(jí)審計(jì)實(shí)務(wù)》考點(diǎn)習(xí)題:案例題(十五)及答案
- 美反戰(zhàn)組織聯(lián)合創(chuàng)始人:集束彈藥將使烏克蘭未來(lái)數(shù)十年承受后果
- 中國(guó)車企馳騁海外:新能源賽道“換道超車” 海外建廠熱潮迭起
- 青春“揚(yáng)帆”大實(shí)習(xí)