很多廠商都說要在 2020 年推出自動(dòng)駕駛汽車,無論這些車的自動(dòng)駕駛程度如何,都要依靠“計(jì)算機(jī)視覺”技術(shù)來實(shí)現(xiàn)。 計(jì)算機(jī)視覺 (Computer Vision,CV),這是一門研究如何使機(jī)器” 看” 的科學(xué),更進(jìn)一步說就是用攝影機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和判別決策等機(jī)器視覺,并進(jìn)一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測(cè)的圖像。 作為一個(gè)科學(xué)學(xué)科,計(jì)算機(jī)視覺研究與其相關(guān)的理論和技術(shù),試圖建立能從圖像或者多維數(shù)據(jù)中獲取「信息」的人工智能系統(tǒng)。比爾·蓋茨說過:IT 界的下一次大事將是計(jì)算機(jī)視覺與深度學(xué)習(xí)的結(jié)合。 怎么才能讓機(jī)器或智能汽車變得像人類一樣聰明? 首先要讓它感受到這個(gè)世界,然后再對(duì)感受到的信息處理反饋。從任天堂的 Wii 到微軟的 Kinect,再到谷歌的 Project Tango,都是如此。 2014 年 2 月,谷歌已經(jīng)成功為該項(xiàng)目研發(fā)出了一款 Android 手機(jī)原型機(jī),配備了一系列攝像頭、傳感器和芯片,能實(shí)時(shí)為用戶周圍的環(huán)境進(jìn)行 3D 建模。另外還有微軟的 Hololens 全息眼鏡,從這些設(shè)備上,我們看到了計(jì)算機(jī)視覺技術(shù)的飛速發(fā)展。 視頻和圖像之中包含了大量的數(shù)據(jù),過去我們不知道怎么讓機(jī)器來捕捉和利用這些數(shù)據(jù)。但隨著深度學(xué)習(xí)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)的提出和運(yùn)用,這些數(shù)據(jù)慢慢的能被機(jī)器解讀到了。這些進(jìn)步為以后的汽車自動(dòng)駕駛,打下了獲得信息和處理信息的基礎(chǔ)。 目前在研究計(jì)算機(jī)視覺技術(shù)的有很多公司,比如 SenseTime(商湯)、Cogtu(知圖科技)、Deepglint(格靈深瞳)等。 商湯是做計(jì)算機(jī)學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的典型公司,核心技術(shù)有人臉識(shí)別、圖像識(shí)別、圖像處理、智能監(jiān)控。
此外就是格靈深瞳,這家公司的聯(lián)合創(chuàng)始人趙勇,在剛剛閉幕的 2015 杭州云棲會(huì)議上提到:目前絕大多數(shù)自動(dòng)駕駛技術(shù)非常昂貴,一輛自動(dòng)駕駛汽車感知成本可能要上百萬人民幣,比汽車本身還貴。在他展示的視頻里,計(jì)算機(jī)視覺技術(shù)讓每輛車都有自己的眼睛。這套系統(tǒng)在汽車行駛的時(shí)候像人的眼睛一樣能看懂交通標(biāo)識(shí),道路信息和各種不同的路況。 計(jì)算機(jī)視覺技術(shù)除了在汽車上使用外,還可以在智能交通領(lǐng)域幫上忙。在路口的紅綠燈可以通過使用該技術(shù),來判斷所在道路交通流量,然后自動(dòng)變燈,增加路口的通行能力。
從論文數(shù)量和創(chuàng)業(yè)公司數(shù)量就可以看出來,近兩年計(jì)算機(jī)視覺發(fā)展速度很快。但對(duì)于自動(dòng)駕駛來說,目前仍面臨諸多問題,比如對(duì)芯片的計(jì)算速度要求很高、高昂的成本等等。計(jì)算機(jī)視覺可以讓自動(dòng)駕駛成為現(xiàn)實(shí),但離普及的程度還有一段距離。
|