摘要: 為了解決違禁品帶入公共場(chǎng)合的問(wèn)題,本文對(duì)違禁品的識(shí)別進(jìn)行了研究。在安檢儀中,加入改進(jìn)的YOLOv3網(wǎng)絡(luò)檢測(cè)算法,使其能夠檢測(cè)出違禁品,而在基礎(chǔ)網(wǎng)絡(luò)上,引入多維輸入圖和多分辨率輸入圖,增加了樣本的多樣性,有效解決了模型的適應(yīng)性差的問(wèn)題。在端到端的網(wǎng)絡(luò)上,用分層方法進(jìn)行特征提取和分類,獲得不同尺度的特征圖,以此來(lái)提高網(wǎng)絡(luò)測(cè)試的精度,并采用聚類算法確定目標(biāo)輪廓,使其能夠精準(zhǔn)定位。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的網(wǎng)絡(luò)識(shí)別目標(biāo)精度在90%以上,高于原網(wǎng)絡(luò)的精準(zhǔn)度。本網(wǎng)絡(luò)效果好,具有較高的識(shí)別率,且封裝在模塊中,操作簡(jiǎn)單。該研究可有效提醒安檢員防止違禁品帶入公共場(chǎng)合,造成公共事故。
關(guān)鍵詞: YOLOv3; 端到端; 特征提取; 聚類算法
隨著人口的不斷增多,公共場(chǎng)所的人口密度變得越來(lái)越大,一旦發(fā)生事故就后會(huì)產(chǎn)生擁堵的情況,逃離的可能性很小,因此,嚴(yán)禁違禁品帶入人口密度大的場(chǎng)合[1]是解決問(wèn)題的關(guān)鍵。2011年,在河南信陽(yáng)段高速上,因車廂內(nèi)違法裝載易燃危險(xiǎn)化學(xué)品突然發(fā)生爆燃,導(dǎo)致客車起火燃燒,造成人員的死亡和受傷。目前,安全檢查主要包括行李物品檢查、旅客證件檢查、手提行李物品檢查和旅客身體檢查。其中,旅客證件檢查主要是確定乘客基本信息,其它三項(xiàng)檢查均是防止乘客攜帶刀、槍、易燃易爆品等危險(xiǎn)物品,以確保公共場(chǎng)所及交通的安全。但在春運(yùn)或法定假期期間,由于客流量較大,排隊(duì)安檢會(huì)發(fā)生擁堵情況,而且工作量的增加,也會(huì)使工作人員觀察不仔細(xì),導(dǎo)致違禁品帶入公共場(chǎng)合,危害公共安全[2]。因此,針對(duì)這種狀況,本文比較了你只看一次[35](you only look once version 3,YOLOv3)、單一多盒檢測(cè)器[67](single shot multibox detector,SSD)、快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò)[89](fast regionbased convolutional neural network,F(xiàn)ast RCNN)等網(wǎng)絡(luò)的區(qū)別,最終選擇了基于卷積結(jié)構(gòu)的YOLOv3網(wǎng)絡(luò),對(duì)其進(jìn)行改進(jìn),優(yōu)化網(wǎng)絡(luò)架構(gòu)及層數(shù),使其在計(jì)算過(guò)程中減少計(jì)算量。同時(shí),根據(jù)樣本信息,更改先驗(yàn)框維度大小,提高對(duì)目標(biāo)的精準(zhǔn)定位,對(duì)樣本進(jìn)行多樣化處理,并進(jìn)行多尺度訓(xùn)練,以保證算法能夠快速準(zhǔn)確的識(shí)別和定位出目標(biāo)物體。該研究為工作人員減輕了工作負(fù)擔(dān),同時(shí)也降低了公共場(chǎng)合事故的發(fā)生率。
1YOLOv3相關(guān)理論
1.1基礎(chǔ)層
1.1.1Darknet53
0~74層是YOLOv3主結(jié)構(gòu),其含有53層卷積層,故叫做Darknet53。YOLOv3結(jié)構(gòu)、DBL模塊結(jié)構(gòu)和res unit模塊結(jié)構(gòu)如圖1所示。Darknet53是由多個(gè)殘差層組成,殘差模塊和殘差層見圖1中的res unit和res n,并用卷積層替代池化層,控制梯度的傳播,在訓(xùn)練過(guò)程中,有效解決了迭代次數(shù)增多而產(chǎn)生的梯度消失或爆炸問(wèn)題。
1.1.2多尺度訓(xùn)練
75~105層是3個(gè)尺度的特征層,在每個(gè)尺度中,通過(guò)卷積操作和上采樣操作,將相同尺寸的特征圖合成一個(gè)特征圖,經(jīng)過(guò)卷積處理得到新的特征圖。在原YOLOv3中,歸一化尺度為416×416,在darknet53之后,進(jìn)行卷積操作得到13×13特征圖,作為最小尺度y1。將79層的13×13特征圖進(jìn)行卷積和上采樣操作,得到的特征圖與61層的26×26特征圖合并,得到中尺度y2。將91層的26×26特征圖進(jìn)行卷積和上采樣操作,得到的特征圖與36層的52×52特征圖合并,得到最大尺度y3(見圖1)。多尺度訓(xùn)練[10]可以更好地識(shí)別大小不一的目標(biāo),提高目標(biāo)識(shí)別率,小尺度可檢測(cè)小目標(biāo),大尺度可檢測(cè)大目標(biāo),可以提高網(wǎng)絡(luò)精度。本文中的樣本縮放比例太大,會(huì)造成圖片像素重疊,進(jìn)而識(shí)別不出目標(biāo)。因此,將歸一化尺度更改為608×608,3個(gè)尺度設(shè)置為19×19,38×38,76×76。
1.2回歸及改進(jìn)
1.2.1分類方法
YOLOv3的分類方法,由單標(biāo)簽多分類的Softmax函數(shù)更換為多標(biāo)簽多分類的邏輯回歸。邏輯回歸分類步驟分為3步,分別是線性函數(shù)、數(shù)值到概率的轉(zhuǎn)換及概率到標(biāo)簽的轉(zhuǎn)換。
輸入為X,邏輯回歸采用sigmoid函數(shù),將決策邊界轉(zhuǎn)換成值,保持在0~1之間的概率函數(shù),用概率確定樣本標(biāo)簽是某一類別的可能性。
為防止概率函數(shù)hθX過(guò)擬合,需在損失函數(shù)后加一項(xiàng),則損失函數(shù)為
式中,m是樣本個(gè)數(shù);y是真實(shí)值;λ是正則化公式強(qiáng)度參數(shù);hθX是輸出結(jié)果。
損失函數(shù)梯度為
其中,λ為正則化的強(qiáng)度。
通過(guò)學(xué)習(xí)率對(duì)特征系數(shù)的迭代,得出某一值,就可算出特征向量系數(shù)θ。
1.2.2邊框預(yù)測(cè)
邊框預(yù)測(cè)是YOLOv3的方法,使用先驗(yàn)框的定義,即用Kmeans++算法對(duì)訓(xùn)練集上的目標(biāo)尺寸大小進(jìn)行聚類分析,使之有相似特征目標(biāo)歸為一類,并根據(jù)尺寸大小確定anchor box的維度。
YOLOv3運(yùn)用與特征金字塔網(wǎng)絡(luò)[11](feature pyramid networks,F(xiàn)PN)相近的上采樣和融合思想,將輸入圖像分為多個(gè)尺寸不同的特征圖,然后進(jìn)行檢測(cè)。YOLOv3中分成3個(gè)尺度,并將每個(gè)尺度輸入圖像的網(wǎng)格單元(grid cell)中,預(yù)測(cè)3個(gè)bounding box,且每個(gè)bounding box有5個(gè)基本參數(shù),分別是x,y,w,h,confidence。
推薦閱讀:中國(guó)公共安全(學(xué)術(shù)版)
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問(wèn)題 >
SCI常見問(wèn)題 >