我國學者墨子和他的學生,做了世界上第一個小孔成倒像的實驗,解釋了小孔成倒像的原因,指出了光沿直線進行的性質。2000多年後的今天,機器視覺技術變得越來越複雜,工業(yè)領域的圖像處理更多的專注于3D傳感器,同時越來越多的技術已經(jīng)完善並且投入到實際應用中,包括焊縫的檢測,以及在生産過程中對未分類部件進行倉揀或精確測量金屬板?梢哉f,機器視覺已經(jīng)轉向了3D成像。
GGII數(shù)據(jù)顯示,2019年中國機器視覺市場規(guī)模65.50億元(該數(shù)據(jù)未包含計算機視覺市場規(guī)模),同比增長21.77%。2014-2019年複合增長率爲28.36%。GGII預測,到2023年中國機器視覺市場規(guī)模將達到155.6億元。
機器視覺典型應用
機器視覺,或者說計算機分析和預測圖像內(nèi)容的能力,通常只取決于輸入的圖像的好壞。這就是爲什麼工程師們一直孜孜不倦地從硬件和軟件的角度創(chuàng)造出新的、更好的三維成像技術手段的原因。
什麼是3D成像?
在研究成像時,工程師可以從人眼捕獲講和釋圖像的方法中找到靈感。
一種視差模擬相機的工作原理
人類視覺系統(tǒng)的工作方法是,每只眼睛從不同的角度觀看世界,並通過稱爲視差的過程將這些圖像合並爲一個圖像。3D成像采用雷同的方法,每次拍攝都使用兩個鏡頭,每個鏡頭拍攝的圖像彼此都不雷同。
主動與被動3D成像
3D成像技術比照工作原理,第一分爲被動式和主動式兩類。
被動式視覺效仿生物的雙眼視覺(binocular vision)原理,由至少2枚圖像傳感器(image sensor)組成,運用其觀測對象在每個圖像傳感器單獨成像的位置,結合2枚圖像傳感器的相對物理位置,依據(jù)幾何關系測量原理,可以計算出景深(depth),如下圖所示。
雙目視覺系統(tǒng)的核心在于關聯(lián)同一觀測點在各自圖像傳感器中的坐標位置,如上圖的左圖所示。然而,在實際使用中,由于受到外部環(huán)境和拍攝對象外表紋理屬性等客觀因素影響,特征點自動匹配在算法上較爲複雜,匹配精度也直接影響到景深計算精度,影響系統(tǒng)整體結果。
主動式視覺系統(tǒng)則由于其工作原理的不同,有效解決了這一問題。
主動式視覺系統(tǒng)使用獨立的人工光源,主動投射到觀測對象來測量景深。主動式視覺根據(jù)投射光源和景深技術原理的不同,又分爲三小類:三角測距法、結構光法、飛行時間法。如下圖所示。下面做詳細介紹:
主動視覺系統(tǒng)分類
(1)三角測距法(triangular)
三角測距法是使用投射光源、觀測對象和接收圖像傳感器的空間位置,使用三角幾何學計算景深的方法。此方法是衆(zhòng)多主動式3D景深視覺系統(tǒng)的底層基礎算法。
(2)結構光法(structured light)
結構光法可以認為是針對在被動式視覺系統(tǒng)中特征點匹配問題的對策性方案。如下圖所示,結構光的含義是主動光源通過特定圖案編碼投射到被測物體,例如將分布較麋集的均勻光柵投影到被測物體上面,由于被測物體外表的不規(guī)則性具有的不同深度,反照到圖像傳感器的光柵條紋會有所變形,那個過程可以看作是由物體外表的深度信息對光柵的條紋進行了調(diào)制。通過對比圖像傳感器接收到的產(chǎn)生畸變的光柵圖案和原生圖案,就可以解析出每個觀測點的深度信息,形成深度點云(point cloud),即深度幀(depth frame)。
結構光景深成像原理示意圖
(3)飛行時間法(time of flight)
飛行時間又稱TOF,簡要來說,是基于測量投射的光源信號發(fā)射與接收之間的時間差,計算出景深或距離的一種景深計算方法。
TOF根據(jù)如何測量時間差又可細分爲脈沖波測距和連續(xù)波測距。脈沖波測距原理是直接測量脈沖信號發(fā)射和接收的時間差;連續(xù)波測距則是通過連續(xù)發(fā)射整數(shù)波長,通過計算接收波與發(fā)射波之間的相位差,間接計算時間差,如下圖所示。
TOF景深成像原理示意圖
3D成像應用
許多領域可以極大地受益于3D成像。
目前比較熱門的應用就是自動駕駛汽車。隨著3D成像技術的改進,自動駕駛汽車的視覺系統(tǒng)將會更好,讓它們實時做出更準確、更安全的決策。另外增強現(xiàn)實也是將受益于3D成像應用。
除了機器視覺,醫(yī)學領域特別可以看到許多值得注重的應用,3D成像在超聲、心髒探查和外科視覺等領域的應用將極大地造福于醫(yī)生和患者。
視覺引導脊柱外科手術
3D成像是已成爲科技領域熱門領域之一,隨著技術在電路層面的不斷完善,很多領域都也許將3D成像確立爲一項司空見慣的技術。