來源:公司資(zī)訊 | 2021.08.16
一(yī)、應用背景
在第十六屆全國大(dà)學生(shēng)智能車(chē)競賽全國總決賽中(zhōng),爲了适應線上總決賽的要求,室内視覺AI組的比賽采用了賽道積分(fēn)與識别積分(fēn)分(fēn)離(lí)的比賽形式,這樣可以保證比賽過程中(zhōng)更加的緊湊高效。
智能車(chē)在識别圖片任務
爲了避免人工(gōng)對于識别過程的幹預,整個識别過程是由計算機随機給出Apriltag,數字,動物(wù)以及水果圖片,由參賽車(chē)模自動根據拍攝的照片給出識别結果。
由于之前的比賽,Apriltag,數字,動物(wù)以及水果分(fēn)别位于賽道的不同位置,Apriltag位于賽道上,數字位于三岔路口,動物(wù)和水果則位于賽道兩旁。所以智能車(chē)模可以預先根據車(chē)模所處在賽道的不同位置,指導攝像頭所拍攝的圖片中(zhōng)的種類分(fēn)别屬于哪一(yī)大(dà)類。然後在分(fēn)别調取不同的識别模型和算法來進一(yī)步處理圖片。
在新的比賽模式下(xià),所有的圖片都是随機出現,因此,需要預先判斷圖片屬于哪一(yī)大(dà)類,然後才能夠調取原來的識别模型。那麽改如何設計一(yī)個簡單的分(fēn)類算法,将獲取的圖片先劃分(fēn)到三大(dà)類(Apriltag,數字以及動物(wù)與水果)呢?
本文下(xià)面就讨論一(yī)個利用圖片的像素顔色來進行分(fēn)類的簡單算法。
二、原始數據
1、數據庫來源
在第十六屆智能汽車(chē)競賽AI視覺組分(fēn)賽區數據集發布給出了應用在智能車(chē)競賽中(zhōng)的四類圖片的數據集合以及下(xià)載的方式。
智能車(chē)競賽數據集合:
AprilTag:25h9系列0~9
數字:0~9
動物(wù)圖片:五個子類:牛(93)、狗(101)、豬(88)、貓(99)、馬(95)
水果圖片:橙子(86)、榴蓮(75)、蘋果(88)、葡萄(89)、香蕉(93)
數據庫總體(tǐ)數量927張圖片。
三、圖片顔色
1、基本識别方案
爲了建立一(yī)個非常簡單的Apriltag,數字、動物(wù)和水果的分(fēn)類器,需要結合已知(zhī)先驗知(zhī)識,借助于簡化的模式識别的方法建立分(fēn)類器;
抛開(kāi)對于圖片内的形态識别特征,轉換使用基于像素的統計規律,這樣可以大(dà)大(dà)提高檢測速度;
因此,計劃使用圖片的顔色空間的統計特性來區分(fēn)三類。
由于Apriltag,數字都是黑白(bái)的圖片;利用這一(yī)點可以用于區分(fēn)水果與動物(wù);
Apriltag與數字在黑白(bái)的占空比方面不同,可以利用圖片的灰度分(fēn)布統計來,或者平均灰度來區分(fēn)這兩類。
2、圖片的RGB轉換HSV
根據黑白(bái)圖片與參賽圖片之間關系,可以把Apriltag,數字分(fēn)布與動物(wù)水果進行區分(fēn)。爲了有效區分(fēn)彩色圖片與黑白(bái)圖片,則需要将圖片從RGB轉換到HSV空間。在HSV(Hue,Saturation,Value)中(zhōng),S分(fēn)量表示色彩的保護度,也就是顔色距離(lí)白(bái)色與純色之間的差異度量。通常取0%~100%,S值越大(dà)顔色就越飽和。
3、利用平均色飽和度區分(fēn)彩色與黑白(bái)圖片
如果取一(yī)個阈值SminS_{\min}Smin作爲區别黑白(bái)與彩色圖片的阈值,SminS_{\min}Smin越大(dà),對于黑白(bái)圖片的誤判成彩色圖片概率就越低,但對于彩色圖片誤判成黑白(bái)圖片的概率就越大(dà)。
當阈值取10的時候,判斷黑白(bái)照片與彩色照片的正确率大(dà)約爲95%,當阈值取20的時候,正确率已經下(xià)降到90%以下(xià)了。
由于使用攝像頭攝取圖片的時候,存在一(yī)定的圖片白(bái)平衡失真,上面色飽和阈值不能夠設置太高,否則就會使得黑白(bái)圖片被誤判成彩色圖片。
4、圖片灰度
如果僅僅通過色保護度來區分(fēn)黑白(bái)圖片(Apriltag,數字)與彩色照片(動物(wù)和水果)會存在比較大(dà)的誤差。下(xià)面還可以通過圖片的灰度分(fēn)布差異來進一(yī)步區分(fēn)黑白(bái)圖與彩色圖片。
對比黑色圖片(Apriltag,數字)圖片的亮度分(fēn)布,它的分(fēn)布主要集中(zhōng)在最高值與最低值,中(zhōng)間分(fēn)布很少。因此,可以利用這個差異進一(yī)步區分(fēn)黑白(bái)圖片與彩色圖片。
如果取35作爲阈值,使用次級亮度平均值來區分(fēn)黑白(bái)圖與彩色圖片,可以達到100%的正确率。
五、利用S,V區分(fēn)設置分(fēn)類器
爲了提高分(fēn)類器的适應性,可以考慮聯合圖片的S,V來區分(fēn)黑白(bái)圖與彩色圖。計算圖片的平均色飽和度值SaveS_{ave}Save以及次級平均亮度值VaveV_{ave}Vave。選擇兩個合适的阈值:STS_TST以及VTV_TVT,對于同時滿足:Save六、區分(fēn)Apriltag與數字
根據圖片的平均色保護度以及次級平均亮度可以将黑白(bái)圖片與動物(wù)水果圖片區分(fēn)開(kāi)來。那麽如何區分(fēn)Apriltag與數字呢?
如果對于前面給出的APriltag和數字亮度值的分(fēn)布來看,可以看到Apriltag的黑色背景值比白(bái)色背景多,而數字則恰好反過來,它的白(bái)色背景像素多餘黑色背景像素。利用這一(yī)點差異,可以對于黑白(bái)圖片中(zhōng)的黑色像素(也就是V值低于圖片平均灰度的像素)的個數進行統計,如果黑色像素的個數高于所有像素個數的50%,則是Apriltag圖片,反之則是數字圖片。
※算法總結※
對于全國大(dà)學生(shēng)智能車(chē)競賽競賽室内視覺AI組用于識别Apriltag,數字,動物(wù)以及水果任務,本文提出了基于圖片像素的HSV空間的統計值,建立了一(yī)個簡單的大(dà)類分(fēn)類器。利用這個分(fēn)類器可以非常精确的在第一(yī)時間吧圖片分(fēn)成Apriltag,數字以及彩色圖片(動物(wù)和水果),然後在利用不同的識别模型進一(yī)步識别。
由于這個過程應用了對于圖片庫的先驗知(zhī)識,一(yī)方面可以繼續應用原來已經建立好的Apriltag、數字、動物(wù)以及水果識别模型,另一(yī)方面也可以提高整個識别的效率。
對于本文前面提到的算法中(zhōng)的阈值,需要根據實際采集到的圖片進行進一(yī)步優化,使得最終的識别效率達到最高。