大華股份DH-MDS算法取得KITTI Semantic Segmentation排行榜第一名
(網(wǎng)址: www.cvlibs.net/datasets/kitti/eval_semseg.php)
大華股份已建成用于算法訓練的超大規(guī)模計算中心和數(shù)據(jù)中心,重點研究并商用化多個領(lǐng)域算法,已形成核心競爭力。2017年大華股份在場景流、光流和文字識別檢測等領(lǐng)域分別取得第一;2018年在2D車輛目標檢測、MOT跟蹤、行人重識別等國際競賽中分別取得第一;2019年初,在實例分割國際競賽中取得第一。本次在語義分割算法領(lǐng)域再次取得新突破。
關(guān)于KITTI:
KITTI數(shù)據(jù)集由德國卡爾斯魯厄理工學院和豐田美國技術(shù)研究院聯(lián)合創(chuàng)辦,是目前國際上最大的計算機視覺算法評測數(shù)據(jù)集之一。數(shù)據(jù)集用于評測立體圖像(Stereo)、光流(Optical Flow)、視覺測距(Visual Odometry)、物體檢測(Object Detection)和跟蹤(Tracking)、道路分割(Road)、語義分割(Semantics)等計算機視覺技術(shù)在車載環(huán)境下的性能。KITTI包含市區(qū)、鄉(xiāng)村和高速公路等場景采集的真實圖像數(shù)據(jù),每張圖像中最多包含15輛車和30個行人,且存在不同程度的遮擋與截斷。
語義分割:
語義分割是指將計算機輸入圖像的每個像素分類為所屬對象類別的過程。它不僅是計算機視覺的基本任務,同時在自動駕駛、機器人場景理解以及虛擬現(xiàn)實方面有著非常重要的應用。
在KITTI語義分割任務中,需要把各種場景下的汽車、行人、道路、摩托車、自行車、交通標志、建筑物和植被等19類物體準確分割出來。同時,訓練集只提供200張數(shù)據(jù),屬于小樣本學習。
本次國際比賽,大華股份為提升語義分割精度,汲取了圖像分類、單目標分割和全像素語義分割等先進算法的優(yōu)點,構(gòu)建了基于多位置和通道特征的全局關(guān)注機制,并采用遷移學習和增量學習方法,有效提升了算法的分割精度。
該競賽語義分割效果:
在大華實際產(chǎn)品和未來產(chǎn)品中的應用
車道線分割
車道線分割并疊加顯示
機器人場景理解及語義地圖構(gòu)建:
【來源:千家網(wǎng)】