国产精品无码无卡无需播放器,日韩AV无码午夜免费福利制服,世界上面积最大的国家,黑森林福利视频导航

卷積神經網絡識別方法范例6篇

前言:中文期刊網精心挑選了卷積神經網絡識別方法范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

卷積神經網絡識別方法范文1

關鍵詞關鍵詞:人臉識別;卷積神經網絡;圖像識別;深度學習;模式識別

DOIDOI:10.11907/rjdk.171043

中圖分類號:TP317.4

文獻標識碼:A文章編號文章編號:16727800(2017)005018603

0引言

人臉識別是近年來模式識別、圖像處理、機器視覺、神經網絡及認知科學領域的研究熱點[12]。所謂人臉識別,是指給定一個靜態人臉圖像或動態視頻,利用存儲有若干已知身份的人臉數據庫驗證單個或多個人的身份[1]。作為生物特征識別的一個重要方面,人臉識別有著廣泛的應用場景,如:檔案管理系統、公安系統的犯罪身份識別、銀行和海關的監控、安全驗證系統、信用卡驗證等領域。在人臉識別巨大魅力的影響下,國內互聯網公司也開始了人臉識別應用的探索,如百度推出的人臉考勤系統、阿里支付寶的刷臉登錄等功能都是人臉識別的具體應用。目前,人臉識別的代表性方法主要有以下幾種:Turk和Pentland[3]提出的特征臉(Eigenface)方法;基于線性區別分析,Belhumeur 等[4]提出了Fisherface方法;基于統計理論,劍橋大學的 Samaria和Fallside[5]提出了隱馬爾科夫模型[5](HMM),Lawrence 等[6]提出的通過多級自組織映射神經網絡(SOM)[6]與卷積神經網絡相結合進行人臉識別。上述方法雖然獲得了良好的識別正確率,但需要人工參與特征提取,然后將提取的特征送入分類器進行識別,過程較為復雜。

卷積神經網絡[79]是近年發展起來,并引起廣泛重視的一種高效深度學習識別算法,其已成為當前語音分析和圖像處理領域的研究熱點。相比傳統的神經網絡而言,卷積神經網絡具有權值共享、局部感知的優點。局部感知的網絡結構使其更接近于生物神經網絡,權值共享大大減少了模型學習參數的個數,同時降低了神經網絡結構的復雜性。在圖像處理領域,卷積神經網絡的優點體現得更為突出,多維的圖像數據可以直接作為網絡的輸入,特征提取和分類均集成在網絡中,避免了傳統識別算法中復雜的特征提取和訓練分類器過程。除此之外,卷積神經網絡對圖像中的位移、比例縮放、旋轉、傾斜或其它形式的變形具有很好的魯棒性。為了解決傳統人臉識別算法特征提取和訓練分類器困難的問題,本文借鑒Lenet-5[10]的結構,設計一個適合ORL數據集人臉識別任務的卷積神經網絡結構。

1卷積神經網絡

1.1用于ORL人臉識別的CNN

本文提出的7層卷積神經網絡模型由輸入層、2個卷積層、2個降采樣層、一個全連接層和一個Sigmoid輸出層組成。卷積核的大小均為5×5,降采樣層Pooling區域的大小為2×2,采用Average Pooling(相鄰小區域之間無重疊),激活函數均采用Sigmoid函數。每一個卷積層或降采樣層由多個特征圖組成,每個特征圖有多個神經元,上層的輸出作為下一層的輸入。此外,本文實驗學習率的取值為常數1.5,該卷積神經網絡結構如圖1所示。

1.2卷積層

卷積神經網絡中的卷積層一般稱C層[11](特征提取層)。卷積層的輸入來源于輸入層或者采樣層。卷積層中的每一個特征圖都對應一個大小相同的卷積核,卷積層的每一個特征圖是不同的卷積核在前一層輸入的特征圖上作卷積,然后將對應元素累加后加一個偏置,最后通過激活函數得到。假設第l層榫砘層,則該層中第j個特征圖的計算表達式如式(1)。

xlj=f(∑i∈Mjxl-1iklij+blj)(1)

這里的Mj表示選擇的上一層輸出特征圖的集合。

1.3降采樣層

降采樣層是對上一層的特征圖進行下采樣處理,處理方式是在每一個特征圖內部的相鄰小區域進行聚合統計。常見的下采樣方式有兩種:Average Pooling和Max Pooling。其中,Average Pooling是取小區域內像素的平均值,而Max Pooling是取小區域內像素的最大值。降采樣層只是對輸入的特征圖進行降維處理,不改變特征圖的個數。假設down表示下采樣操作,βlj表示乘性偏置,blj表示加性偏置,則降采樣層中某個特征圖的計算表達式如下:

xlj=f(βljdown(xl-1j)+blj)(2)

1.4輸出層

卷積神經網絡的輸出層一般為分類器層,常用的有徑向基(RBF)函數輸出單元、Sigmoid輸出單元和Softmax回歸分類器。在ORL人臉識別任務中,采用Sigmoid函數輸出單元,輸出層的編碼采用非分布編碼“one-of-c”的方式。由于采用Sigmoid函數,每一個單元輸出值是0-1范圍內的一個正數,代表該樣本屬于該單元對應類別的概率。數值最大的那個單元即為樣本的預測類別。假設x為全連接層的輸出,則輸出層輸出結果的計算表達式如下:

y=f(wTx+b)(3)

其中,f表示激活函數,這里采用Sigmoid函數,Sigmoid函數表達式如下:

f(x)=11+e-x(4)

2實驗結果與分析

實驗在Windows7 64位下的Matlab 2014a中進行,采用Matlab深度學習工具箱DeepLearnToolbox。PC的內存8G,CPU主頻為3.2GHZ。

ORL人臉數據集是在1992年至1994年之間由AT &T Cambridge實驗室拍攝的人臉圖像所構成。數據集中包含40個不同人物的臉部圖像,每個人物包含10張圖像,總共400張。每個類別中的臉部圖像在不同的時間拍攝得到,存在如下差異:①光線;②面部表情,如眼睛的閉合和睜開狀態,面部是否帶有微笑的表情等;③一些面部細節上的差異,如是否佩戴眼鏡等。該數據集中所有人臉圖像均為灰度圖像,且圖像中人物面部朝向基本一致,都朝向正前方。

圖2為ORL數據集中部分人臉圖像。數據集中每個原始圖像大小為92*112像素,本文實驗中對這些圖像進行預處理,使每一幅圖像的尺寸調整為28*28,并對每一副圖像進行歸一化處理,這里采用簡單的除255的方式。隨機選取每一個類別的8張圖像作為訓練樣本,剩下的2張作為測試樣本。因此,訓練集有320個樣本,測試集有80個樣本。

2.1改變C3層卷積核個數對網絡的影響

卷積神經網絡性能的好壞與卷積層卷積核的個數密切相關,但每一個卷積層應該設置多少個卷積濾波器,目前并沒有數學理論指導。為了研究卷積核個數對網絡最終識別準確率的影響,本文保持C1層卷積核個數不變,通過改變C3層卷積核的個數,形成新的網絡結構,用訓練集訓練網絡,訓練迭代次數均為60次,然后用測試集對每一種網絡結構的性能進行測試。實驗結果如表1所示。

從表1可以看出,當C3層有10個卷積核時,網絡模型對測試集的識別正確率最高。卷積核的個數與識別準確率并不成正比關系,當卷積核個數過多時,網絡的識別準確率會下降,這是因為在卷積核個數增加的同時,需要學習的參數也隨之增加,而數據集中訓練樣本的規模較小,已不能滿足學習的要求。

2.2改變C1層卷積核個數對網絡的影響

由上述實驗結果可知,C3層卷積核個數為10時,網絡識別效果最好。因此,為了研究卷積層C1層卷積核個數對識別準確率的影響, C3層保留10個卷積核,改變C1層卷積核的個數構造新的網絡結構,用測試集針對不同網絡結構就測試集和訓練集的識別準確率進行測試。實驗結果如表2所示。

從表2的實驗結果可以得到相同結論:卷積層卷積核的個數并非越多越好,卷積核個數過多,網絡需要學習的參數也隨之增加,當訓練集中樣本個數無法滿足學習需要時,網絡識別準確率就會下降。

2.3與其它算法比較

為進一步說明本文所提卷積神經網絡結構的有效性和優越性,將該結構(C1層6個卷積核,C3層10個卷積核,學習率1.5)的實驗結果與其它識別方法在ORL數據集上的實驗結果進行對比,結果如表3所示。可以看出,本文所提方法比Eigface、ICA的識別效果好,與2DPCA方法的識別準確率一樣,比FisherFace方法的識別準確率只低了0.20%,這進一步證實了本文所提網絡結構的有效性。

3結語

本文在理解Lenet-5結構的基礎上,提出一種適用于ORL人臉數據集的卷積神經網絡結構。實驗結果表明,本文提出的卷積神經網絡結構,不僅避免了復雜的顯式特征提取過程,在ORL數據集上獲得98.30%的識別正確率,而且比大多數傳統人臉識別算法的效果都好。此外,本文還通過大量驗就每個卷積層卷積核個數對網絡識別準確率的影響進行了詳細研究與分析,這對設計CNN網絡結構具有一定的參考意義。

參考文獻參考文獻:

[1]李武軍,王崇駿,張煒,等.人臉識別研究綜述[J].模式識別與人工智能,2006,19(1):5866.

[2]張翠平,蘇光大.人臉識別技術綜述[J].中國圖象圖形學報,2000,5(11):885894.

[3]YANG M H.Face recognition using kernel methods[J].Nips,2002(2):14571464.

[4]祝秀萍,吳學毅,劉文峰.人臉識別綜述與展望[J].計算機與信息技術,2008(4):5356.

[5]SAMARIA F,YOUNG S.HMMbased architecture for face identification[J].Image and Vision Computing,1994,12(8):537543.

[6]LAWRENCE S,GILES C L,TSOI A C.Convolutional neural networks for face recognition[C].Proceedings CVPR'96,1996 IEEE Computer Society Conference on Computer Vision and Pattern Recognition,1996:217222.

[7]陳耀丹,王連明.基于卷積神經網絡的人臉識別方法[J].東北師范大學學報:自然科學版,2016,48(2):7076.

[8]盧官明,何嘉利,閆靜杰,等.一種用于人臉表情識別的卷積神經網絡[J].南京郵電大學學報:自然科學版,2016,36(1):1622.

[9]李彥冬,郝宗波,雷航.卷積神經網絡研究綜述[J].計算機應用,2016,36(9):25082515.

[10]LCUN Y,BOTTOU L,BENGIO Y,et al.Gradientbased learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):22782324.

卷積神經網絡識別方法范文2

關鍵詞 人臉識別;Gabor小波;小波網絡;神經網絡;特征抽取

中圖分類號TP39 文獻標識碼A 文章編號 1674-6708(2012)58-0183-02

0 引言

隨著信息技術的發展,人臉識別因在公安、身份驗證、安全驗證系統、醫學、考勤系統等各方面的巨大應用前景而成為當前人工智能和模式識別領域的研究熱點。人臉識別是指利用攝像頭捕捉人的面部圖片,利用計算機分析比較人臉的生物特征來進行身份識別。雖然人類能夠輕易識別出人臉和表情,但是人臉機器識別卻是一個難度極大的課題[1]。

基于Gabor小波彈性圖匹配算法作為一種有效的人臉識別方法,雖然方法簡單,但是實現復雜、計算量大、耗時多,本文提出了一種改進的基于局部特征Gabor小波的BP神經網絡方法,此方法避免了彈性如匹配算法的高計算量,神經網絡由于學習和記憶能力,提高了算法容錯性。本文采用Gabor小波特征空間作為神經網絡輸入空間,然后使用神經網絡作為分類器。

1 基于局部特征的Gabor小波

1.1 Gabor濾波器數組

二維圖像的離散Gabor 變換的定義見文獻[4],對特征點圖像模板進行離散Gabor 變換的Gabor核函數如下:

式中參數描述三角函數的波長,參數描述小波的方向性。依David S. Bolme 的取值對人臉圖像的處理間隔4 個像素,即分別取{4 , ,8, , 16};對的取值從0到π的區間分別取{0 ,π/ 8 ,2π/ 8 ,3π/ 8 ,4π/ 8 ,5π/ 8 ,6π/ 8 ,7π/ 8}共8個方向,π到2π區間的方向性由于小波的奇偶對稱性而省去。參數描述三角函數的相角,取∈{ 0 , π/2} ;參數描述高斯半徑,取=;參數描述高斯的方向角,選取=1 ;這樣通過選取一系列的5個不同的和8個方向的,就可以得到40個二維的復數離散Gabor濾波器組。

1.2 Gabor小波特征值

GaborJet是根據特征點的位置坐標(xn,yn),對特征點作Gabor變換得到的。具體方法是對每一個特征點,以(xn,yn)為中心提取該特征點周圍的正方形圖像區域的圖像灰度信息,然后通過該圖像區域與特定波長、方向的2D Gabor濾波器卷積,從而得到該特征點的頻率信息等。

2 改進的BP神經網絡

1988年,Rumelhart、Hinion和Williams提出了用于前向神經網絡學習訓練的誤差反向傳播算法(Error Back Propagation,EBP,簡稱BP),成功地解決了多層網絡中隱含層神經連接權值的學習問題[2]。

BP神經網絡訓練過程即學習過程:神經網絡在外界輸入樣本的刺激下不斷改變網絡的連接權值,以使網絡的輸出不斷地接近期望的輸出。學習的本質是對各連接權值的動態調整,令輸出結果達到預期目標。學習規則是在學習過程中網絡中各神經元的連接權變化所依據的一定的調整規則。圖1為改進BP神經網絡的模型圖。

原始BP算法的主要缺點[3]為:收斂速度慢和可能陷入局部極值。本文對BP算法進行了改進,改進方法如下:

1)Sigmoid函數的改進:在實驗過程中將產生較大的誤差時,S型函數的標準形式用來生成輸出的分類,并可能會出現不收斂。因此為了解決這個問題的辦法是采取 改進的S型函數如式2.1所示。k的值越大越容易收斂,但收斂速度較慢;k較小可以使得S型函數較穩定,其收斂速度快,但容易產生不穩定。經多次不同值的實驗,最終選定 k=3. 5。

2)學習速率自調整模型:學習速率自調整的BP算法縮短了學習時間。神經網絡學習過程,即連接下層節點和上層節點之間的權重拒陣Wij的設定和誤差修正過程。BP網絡自學習方式:需要設定期望值和輸入樣本。自學習模型為:

h 是學習因子;是輸出節點i的計算誤差;Oj是輸出節點j的計算輸出;a是動量因子。

3 人臉識別實驗與結果分析

采用ORL人臉數據庫,每個人臉有10幅不同細節的圖片。識別率檢測數據庫A:選擇30個人作為測試對象。取每個人的前4幅圖片共120幅圖片作為人臉數據庫。然后使用另外的180幅圖片進行測試。

由于定位特征點位置會有一些誤差,所以在試驗階段人臉數據庫中的人臉特征點位置手工標注,這樣可以從初始階段減少誤差。人工標注圖像的各個特征點的實例如圖2所示:

對每個特征點特區Gabor特征,存入數組作為BP神經網絡輸入。然后使用樣本進行訓練得到神經網絡分類器。當訓練完成后,采用測試圖片進行識別統計識別效率和識別時間。

其中一組訓練和識別樣本實驗結果如表1所示。

其中前5列是該人的訓練樣本,后5列是該人的識別樣本。由于本系統神經網絡輸出數目與數據庫中人物數一樣,所以每個人有8個輸出,每行表示測試圖片與數據庫中一個人相似度。訓練時輸出為,其中0.9表示輸出目標,訓練誤差為0.01。輸出為0.9附近就是識別目標。

采用不同的方法系統識別率不同,或者相同方法采用不同人臉圖像庫系統識別率也會不同。根據上面實驗,表2統計了不同人臉識別算法的識別率。

分別在PC平臺上進行測試,EBGM大約需要1s時間,而本算法只需要0.01s,大大提高了算法效率。

4 結論

基于EBGM與本文人臉識別算法比較,本文算法有效的解決了傳統彈性圖匹配算法計算復雜的問題,無需進行彈性圖粗匹配和精確匹配,只需要訓練,在識別時保留了Gabor小波生物特性基礎上大大提高了傳統算法實時性。在識別能力上,神經網絡具有學習分類作用,比傳統彈性圖匹配具有更高的識別率。

參考文獻

[1]焦峰,山世光,崔國勤,等.基于局部特征分析的人臉識別方法[J].計算機輔助設計與圖形學學報,2003,15(1).

[2]M Riedmiiler and H Braum.A direct adaptive method for faster baek Propagation learning:The RPOP algorlthm. Proceedings of the IEEE International Coference on Neural Networks(ICNN).San Fraueisco, 1993:586-591.

[3]Phillips P J, Moon H, Rizvi S A, et al.The FERET Evaluation Methodology for Face recongition Algorithms. IEEE Transaction on Pattern Analysis and Machine Intelligence,2000, 22(10):1090-1104.

卷積神經網絡識別方法范文3

關鍵詞:車牌識別系統; 智能交通; 技術

中圖分類號: TP391.4文獻標識碼:A文章編號:1009-3044(2008)18-20ppp-0c

Research on Licence Plate Recognition System

YI Lian-jie

(Loudi Vocational and Technical College Loudi Huanan417000)

Abstract: The licence plate recognition system has an importantrole of morden intelligent traffic system. This paper narrated the key technology ofthe licence plate recognition system and discussed the existing problems and development of the licence plate recognition system.

Keywords: the licence plate recognition system; intelligent traffic system; technology

車牌識別系統是智能交通系統的關鍵部分,可廣泛應用于交通管理、監控和電子收費等場合。車牌識別系統就是以車牌作為車輛的唯一標識,采用計算機視覺和模式識別技術對汽車車牌的自動識別。

1 車牌識別系統的組成

典型的車牌識別系統由車輛檢測、圖像采集、車牌識別等部分組成(圖1)。車輛檢測就是使用車輛傳感器或紅外線檢測等來判斷車輛是否通過某一位置。當車輛駛過探測部位時,CCD攝像機拍攝車輛圖像,由圖像采集卡采集圖像并輸入計算機。車牌識別部分由計算機和識別軟件組成,從由CCD攝像機采集的圖像中自動尋找車牌,然后對找到的車牌進行字符切分和識別,最后獲得車牌號碼,并將識別結果送至監控中心等場合。

圖1車牌識別系統的組成

在整個識別系統中,以車牌識別最為關鍵。識別過程有兩個步驟,首先從圖像中找出確切的車牌位置,即車牌定位,然后對找出的車牌進行字符切分和識別。車牌識別過程包含兩大關鍵技術:1.車牌區域定位技術;2.車牌字符切分和識別技術。

2 車牌定位技術

圖像輸入計算機后,系統要自動找出車牌的準確位置。車牌區域定位是車牌字符切分和識別的基礎,是提高系統識別率的關鍵。車牌定位過程包括三個步驟:圖像預處理、車牌搜索和車牌糾偏。

2.1 圖像預處理

圖像預處理的作用:平滑去噪和車牌特征增強。

平滑去噪就是消除圖像上由于光照、車牌污損等產生的噪聲干擾。平滑方法主要有平均濾波、中值濾波和指數函數濾波等方法。中值濾波和指數濾波平滑效果好且能較好保持牌照和字符邊緣,但在平滑效果和處理速度方面不如平均濾波。

通常的車牌定位算法是依據車牌特征從圖像中找出車牌,因此必須使車牌區域顯示出與非車牌區域不同的獨有的特征,車牌特征增強使圖像中車牌區域明顯突出。通常有下述增強方法:邊緣檢測法、二值化法、量化法、數學形態學法。

具有不同灰度的相鄰區域之間存在邊緣,在車牌區域存在車牌邊框邊緣和車牌字符邊緣。邊緣檢測法就是要檢測出這些邊緣。有關邊緣檢測的算法很多,考慮實時性要求,采用簡單的微分算子,如一階微分算等。這些算子采用小區域模板與圖像卷積實現邊緣檢測。文獻[1]提出一種牌照字符邊緣特征增強的方法,該方法使用線性濾波器函數將每一行中多個連續的水平方向梯度值相加,使得字符的垂直邊緣增強。微分算子對噪聲較為敏感,因此在使用之前需要平滑去噪。LOG算子是高斯指數平滑法與Laplacian算子相結合的邊緣檢測方法,既能消除噪聲又能很好的突出車牌字符的邊緣。

二值化增強法先確定一個閾值,然后將圖像中各個像素的灰度值都與這個閾值比較,根據比較結果將整個圖像的像素點分為兩類,車牌區域歸為一類,便于車牌搜索。為了滿足實時性要求,采用簡單、快速的二值化法,如平均閾值法,反積分自適應閾值法等。

文獻[3]使用神經網絡來對彩色圖像量化,使得車牌區域的字符為一種特定的顏色,然后進行顏色過濾或線掃描,借此提取車牌。該方法首先必須選取車牌樣本圖像,并且要把RGB顏色模式轉換為HSI模式,以HSI各分量值作為輸入對神經網絡進行訓練,再以訓練好的神經網絡對圖像的各像素點量化分類,該方法抗干擾能力強,量化前可不要求平滑,

數學形態學表示以形態為基礎對圖像進行分析的數學工具,它的基本思想使用具有一定形態的結構元素去量度和提取圖像中的對應形狀以達到對圖像分析和識別的目的。數學形態學有四種基本的運算:膨脹,腐蝕,開啟和閉合。出于以下兩個意圖而使用形態學方法:1.將開啟和閉合結合起來,消除二值化后的車牌區域中存在的細小空洞;2.采用水平線段的結構元素膨脹,使二值化后的車牌區域成為一連通區域。

需要說明的是,上述方法往往不是單獨使用,如二值化法是對邊緣檢測后的圖像進行,而形態學方法是在二值化圖上實現。不能簡單的評價圖像預處理方法的優劣,因為這與所對應的車牌搜索方法緊密相關。

2.2 車牌搜索

車牌搜索就是根據車牌區域特征在圖像中尋找車牌的過程。根據搜索的方式可把車牌搜索方法分為以下幾種:投影統計法、線掃描法、模板匹配法和反Hough變換法等。車牌搜索法要與相應的車牌增強法配合使用(見表2)。

表2車牌增強法用于不同搜索法的情況

投影統計法對邊緣化或二值化圖像進行水平和垂直累加投影,根據投影直方圖呈現的連續峰、谷、峰的分布的特征來提取車牌,或對由形態學膨脹運算后的圖像水平和垂直投影,在投影圖上尋找波峰和波谷而確定車牌位置。文獻[24]提出的采用高斯指數函數對投影圖平滑,能有效消除投影圖的毛刺,使車牌位置為明顯的波峰,提高車牌定位的精度。

線掃描搜索法則是對邊緣化或二值化后的圖像逐行水平掃描,穿過車牌區域的掃描線因為字符邊緣的存在,灰度呈現起伏的峰、谷、峰的變化,或頻繁交替出現亮基元、暗基元的特征,以提取車牌。文獻[3]用神經網絡對彩色圖像量化之后,再逐行水平掃描,分別獲取顏色向量和長度向量,能與標準車牌區域的顏色向量和長度向量匹配的為車牌區域。

模板匹配搜索法是以特定的模板在圖像區域滑動,以與模板匹配的局部區域為車牌。使用的模板有線模板、倒”L”角模板、矩形框模板。線模板以水平線段或垂直線段為模板,來檢測車牌的邊框角點;倒“L”模板以倒“L”結構為模板來尋找車牌邊框的左上角;矩形框模板以一個與車牌長寬比例相當的矩形框作為模板,在整個圖像區域滑動,以符合某一判別函數值的區域作為車牌區域。

反Hough變換搜索法是基于車牌形狀特征的方法,先對圖像進行Hough變換,然后在Hough參數空間尋找車牌的四個端點。

上述搜索法可以結合使用,如文獻[25]提出的自適應邊界搜索法,先用倒”L”模板尋找車牌邊框的左上角,然后用水平線掃描和垂直線掃描找出下邊框和右邊框。投影統計搜索法和線掃描搜索法處理速度快,能對大小不同的車牌識別,但定位精度不高和出現虛假車牌的情況,需要提高定位精度和去除虛假車牌的后續工作。模板匹配搜索法能比較準確的找到車牌位置,但難以滿足實時性要求,可以采用神經網絡或遺傳算法來加快搜索進程。反Hough變換搜索法除了能準確找到車牌位置,還能確定車牌的傾斜角度,對噪聲、輪廓線中斷不敏感,但在有直線干擾下可能實效,文獻[28]提出的快速Hough變換的策略能滿足實時性要求。

2.3 車牌糾偏

由于車輛運行軌跡不定、攝像機位置偏斜等原因,使得圖像中車牌扭曲,為了后續正確的車牌字符切分和識別,就須對車牌糾偏,使車牌達到規范的位置和大小。采用的糾偏方法通常先是用Hough變換確定水平邊框傾斜角度和垂直邊框傾斜角度,然后糾偏。文獻[22]提出使用Rodan 變換可用來確定傾斜角度。

3 車牌字符識別技術

車牌定位之后就要對車牌字符識別。這一過程包含下列幾個步驟(見圖2):車牌二值化,字符切分,字符特征提取和字符識別。這里只討論后三個步驟。

圖2 車牌字符識別步驟

3.1 字符切分

字符切分把車牌上的字符分開,得到一個個的字符圖像。常用的字符切分方法有投影法、模板匹配法、區域生長法、聚類分析法等。

投影法把車牌圖像垂直累加投影,形成峰谷交替的投影直方圖,找到投影圖的各個谷就能把字符分開。模板匹配法以字符大小的矩形作為模板,根據字符的寬度初步確定每個字符的起始位置,然后以此模板在初定位置附近滑動,找到最佳匹配位置而切分字符。區域生長法對每個需要分割的字符找一個像素作為生長起點的種子,將種子像素周圍鄰域中與之相同或相近性質的像素合并到種子像素所在的區域,然后將這些新像素當作新的種子繼續進行上述過程,直到再沒有滿足條件的像素可被包含進來。基于聚類分析的方法對車牌圖像從上到下逐行掃描,如屬于字符類的兩像素間距離小于閾值,可認為兩像素為同一字符,由此而得字符像素的聚類。

3.2 字符特征提取和車牌字符識別

目前使用的車牌字符特征提取的方法可歸納為下述三種:1.基于字符統計特征。計算字符圖像的多階原點矩,多階中心矩以及中心慣性矩,以中心矩與中心慣性矩的比值作為字符特征向量,這樣提取的特征量具有平移,旋轉和尺度不變性,但運算量大;也有把字符在多個方向上的投影(如水平方向,垂直方向,右斜方向,左斜方向)和二階中心矩的比值作為特征向量。2.基于結構特征。輪廓特征,粗網格特征,層次輪廓特征以及字符特征點.這類特征提取計算量較少,但對噪聲和位置變化比較敏感,需要去噪和對字符歸一化。3.基于變換。對原始特征(像素點矩陣)進行傅里葉變換、K-L變換或小波變換等,提取的特征向量反映字符的結構特征和統計特征,相似字符的特征矢量距離較大,效果較好。實際應用中往往是多種特征的提取,多種特征提取方法的使用。

對車牌字符特征提取之后,就把相應的特征值輸入分類器識別,目前對于車牌字符的分類識別方法歸納為下列幾種。(1)模板匹配。該方法首先對待識字符進行二值化并將其縮放為字符數據庫中模板大小,然后與所有的字符模板比較匹配,計算相似度,以最大相似度者為識別結果。(2)PCA子空間分類器。子空間分類器由訓練樣本相關矩陣的特征向量構成,單個模式的子空間建立彼此獨立,相互之間沒有聯系,以待識別字符的特征向量與所對應的子空間距離最小作為結果。(3)基于人工神經網絡。人工神經網絡有抗噪聲、容錯、自適應、自學習能力強的特點。多隱含層的BP神經網絡,BAM(Bidirectional association memories)神經網絡方法,自諧振ART神經網絡識別等是此方法的典范。(4)基于邏輯規則推理的識別方法。文獻[18]提出基于歸納推理的字符識別,該方法在訓練時自動生成識別規則。(5)基于隨機場圖像模擬的識別方法。該方法識別率高,并且可對灰度圖像直接提取字符特征,抗干擾性強。另外使用感知器的識別,通常感知器只用于相似字符對的識別,作為其他識別方法的補充。

4 總結與展望

從已有車牌識別系統的性能分析來看,正確識別率和識別速度兩者難以同時兼顧。其中原因包括目前的車牌識別技術還不夠成熟,又受到攝像設備、計算機性能的影響。

現代交通飛速發展,LPR系統的應用范圍不斷擴寬,對車牌識別系統的性能要求將更高。對現有的算法優化或尋找識別精度高、處理速度快、應用于多種場合的算法將是研究的主要任務。

參考文獻:

[1] 廖金周,宣國榮.車輛牌照的自動分割[J].微型電腦應用,1999(7):32-34.

[2] 劉智勇.車牌識別中的圖像提取及分割[J].中文信息文報,2000(3):29-34.

[3] Wu Wei,Mingjun Wang.An Automatic Method of Location for Number_Plate Using Color Features IEEE 2001.

[4] 郭捷,施鵬飛.基于顏色和紋理分析的車牌定位方法[J].中國圖像圖形學報,2002,7(5):473-476.

[5] 章毓晉.圖像工程(上)――圖像處理與分析[M].清華大學出版社.

卷積神經網絡識別方法范文4

關鍵詞:載荷反求;正則化;虛擬減縮;迭代方法

中圖分類號:TP391.9 文獻標志碼:A

Load Identification of Virtual Iteration Based

on Tikhonov Regularization and Model Reduction

ZHANG Bangji,ZHOU Shouyu, XIE Qingxi,ZHANG Nong

(State Key Laboratory of Advanced Design and Manufacturing for Vehicle Body,Hunan University, Changsha 410082, China)

Abstract: The model reduction technique was applied to solve the dynamic response. In order to make the system show the actual responses of the expected signals, the iteration procedure was then used to modify the load signals based on Tikhonov regularization load identification. Furthermore, the accuracy of the load signals was identified. The comparison of the proposed method with the traditional Tikhonov method shows that the proposed method can retain a good anti-noise characteristic, and improve the precision of load identification. The accuracy of the load identification by the proposed method is much higher than that of the traditional method.

Key words:load identification; regularization; virtual reduction; iterative methods

工程振動問題備受關注,結構動態載荷的精確獲取可為工程結構的振動分析、疲勞分析等提供基礎,然而因經濟性或技術條件的限制,許多情況下載荷難以通過直接測量的方式獲取,如汽車車身所受的激振力、輪船行駛時受到的波浪式沖擊載荷等.因此利用載荷反求方法間接獲取激振載荷具有重要意義.

載荷反求是通過系統響應和振動特性來反求結構所受載荷,是動力學第二類反問題[1].國內外學者針對動態載荷反求的理論和技術研究做了很多工作[2-4].傳統的反求方法有時域法與頻域法兩大類[5],隨著計算機技術的發展,遺傳算法[6]、神經網絡[7]等新方法被應用于載荷反求領域.Kim等人[8]利用結構動力學關系構建載荷反求動力學方程,通過頻響函數求逆法進行載荷反求,用奇異值分解法(SVD)改善頻響函數求逆過程中的矩陣病態問題;Choi等人[9-10]運用最小二乘的Tikhonov正則化方法解決矩陣的病態問題,在提高載荷反求結果穩定性與抗干擾性方面效果良好,并對比分析了不同正則化參數選擇方法對載荷反求精度的影響.國內在正則化反求法方面做了很多研究[11-13],其中應用較廣的是Tikhonov正則化反求法.郭榮等[14]綜合運用Tikhonov正則化與奇異值分解的反求方法,有效提高了結構載荷反求精度.

然而Tikhonov等正則化反求法存在其自身的缺陷,由于該方法對反求載荷有平滑的作用,導致在響應測試噪聲水平較高,或者系統線性程度不高的情況下,在反求信號的峰值處將很難得到較好結果[12].對此,結合文獻[15]中室內試驗臺架驅動文件生成方法,提出新的載荷反求方法.其基本流程是,將Tikhonov正則化所反求的載荷重新激勵系統,將獲得的響應與真實期望響應對比,通過誤差反饋補償來逐步修正Tikhonov正則化反求法所得到的載荷信號,以提高在載荷峰值處的反求精度.考慮到在實際工程中,所研究的對象往往是復雜結構仿真模型,迭代中l繁的正向求解過程相當耗時,甚至導致反求過程難以實現.對此,本文結合模型減縮技術,對大型有限元結構進行降階處理,得到規模較小的等價模型,在保證響應計算精度的同時,極大縮短正問題的求解時間,提高計算效率.

1 虛擬迭代載荷反求原理

1.1 Tikhonov正則化理論

對于線性系統,在待反求載荷f(t)的作用下,系統的響應可以由單位脈沖響應函數與動態載荷的卷積分形式表示為:

y(x,t)=∫t0G(x,t-t)f(t)dt(1)

式中:y(x,t)為結構測點x處的響應,可以是位移、速度、加速度等;f(t)為載荷的時間歷程;G(x,t)是相應的載荷作用點到響應點的Green函數,即單位脈沖響應.

考慮零初始條件系統,可將式(1)中的卷積分在時域內進行n個等間隔時間點離散,可化為一組線性方程組:

1.2 迭代反求算法

線性時不變系統響應噪聲水平不高時,采用最優正則化參數的Tikhonov方法可較精確地反求激勵載荷,但是當系統響應噪聲水平較高時,即使是最優的正則化參數,也難以平衡解的逼近性與穩定性這對矛盾;且在工程實際中,系統的各個環節,如汽車的襯墊等連接部件,在一定程度上都存在非線性因素,導致反求難度增大.對此,采用迭代的方法,根據響應誤差反饋補償,逐步修正所求載荷信號,使其達到要求[16].

首先,對一個已知系統,其響應信號Yδ,由上述Tikhonov正則化方法反求,計算出初始載荷信號為:

1.3 減縮技術

載荷的迭代反求過程,需要反復計算仿真系統的動響應,仿真系統通常用有限元的方式表達.但對于有限元模型,通常網格越密仿真精度越高,但密集的網格會導致響應求解時間增長,尤其在反復迭代計算過程中,正問題的求解時間過長是影響迭代的重要因素.對此,采用模型減縮技術,對原始有限元模型進行降階等效,再對降階模型進行迭代響應計算,從而解決計算精度與計算效率之間的矛盾.本文采用的減縮方法是IRS[19]方法.

IRS 減縮方法是一種基于 Guyan靜力減縮法并考慮慣性力影響的改進方法.系統的運動方程可以表示為:

1.4 迭代收斂條件

上述Tikhonov迭代正則化算法可用流程框圖表示,如圖1所示.

2 數值算例

為了驗證上述迭代法對Tikhonov正則化反求結果的優化作用,以及模型減縮技術對迭代效率改善的正確性與有效性,下面給出幾種不同載荷形式的算例進行仿真對比分析.選用一塊帶約束的平板,在ABAQUS中建立如圖2所示的有限元模型,平板一邊兩端用螺栓夾緊固定,模型中平板的彈性模量為210 GPa,密度為7.85 g/cm3,厚度為4 mm,邊長為500 mm.

2.1 模型減縮應用及結果分析

為提高響應計算速度以及迭代效率,對該模型進行減縮降階,在確保模型精度不受影響的情況下,用近似的低階模型代替原來復雜的高階系統模型來進行迭代反求.對該有限元模型,質量矩陣和剛度矩陣通過ABAQUS被直接導出,在模型上選取包括激振點與拾振點在內共 176個節點,用IRS減縮法在 MATLAB 中對平板模型進行模型減縮,并用模態置信度(MAC值)分析減縮前后模型模態振型吻合程度,驗證該減縮模型的精度[20].

2.1.1 減縮前后振型對比

2.1.2 動響應計算效率分析

在載荷反求過程中往往需要反復多次求取系統響應,因此動響應計算效率是衡量反求實際效果的重要標準.分別對算例原模型、IRS減縮模型求動態響應,比較相同時間歷程的動態響應所消耗實際CPU時間,結果如圖4所示.

由此可見,相比于原模型,IRS減縮模型大大減少了動響應計算時間,因此,模型減縮很大程度上提高了計算效率,所需計算響應時間歷程越長,效果越明顯.在本文數十次迭代計算動態響應過程中,IRS模型減縮技術的應用將極大地提高迭代計算響應效率.

2.2 載荷反求對比分析

在板面節點308#施加垂直于板面的單位載荷,選取響應節點62#垂直板面方向速度作為響應(如圖2所示).首先計算載荷點到響應節點對應的Green函數;再以不同形式載荷下的響應,進行載荷反求;最后對仿真得到的響應數據加入一定水平的隨機噪聲來模擬測試誤差.此時帶噪聲的速度響應可用下式來表示:

式中:Y(t)為仿真得到的速度響應;std(Y(t))為速度響應Y(t)的標準差;lnoise為噪聲水平的百分數;rand(-1,1)是區間-1,1的隨機數[12].

在速度響應中加入15%的模擬噪聲,首先用傳統的Tikhonov正則化方法進行載荷反求,以L曲線法確定最優正則化參數,得到待求載荷,計算反求精度;再以此反求載荷,作為初始激勵載荷,用上述虛擬迭代方法修正載荷信號,進行反求優化,以達到精度要求;最后對比優化前后載荷反求精度.

選用不同頻率、不同幅值周期正弦、正弦掃頻(10~100 Hz)、三角波以及隨機激勵等形式的激振力激振進行載荷反求,反求結果如圖5-圖9所示.

由圖5-圖9可以看出,對不同形式的激勵,在一定噪聲水平情況下,傳統的L曲線法確定最優參數的Tikhonov正則化方法能夠很好地抑制噪聲對反求結果的干擾,具有很強的穩健性.但在載荷峰值處,反求誤差較大,反求整體精度受影響,這主要是由于正則化方法對反求載荷有平滑的作用,使得該方法在載荷峰值難以得到準確的反求結果.Tikhonov正則化方法對這幾種載荷反求的加權誤差為8.0%左右.而本文提出的迭代Tikhonov正則化方法不僅能夠繼承傳統正則化方法反求結果穩健性的優點,同時還可以改善其在載荷峰值處反求結果,提高反求精度,反求結果加權誤差最低可降至2.0%.迭代Tikhonov正則化方法無論對確定信號還是隨機載荷激勵都有很好的反求精度,且對如圖9所示中的高頻載荷段迭代反求也有很高的精度.

3 結 論

本文在傳統Tikhonov正則化反求方法的基礎上,提出了一種新的迭代改進方案.結合有限元算例和模型減縮技術,分別采用傳統Tikhonov方法和本文迭代方法對三角、正弦以及隨機載荷等激勵進行載荷反求.結果表明:

1)本文提出的基于Tikhonov正則化迭代反求方法不僅能夠繼承傳統Tikhonov正則化反求法有效抑制噪聲的特點,同時還可以提高其在峰值載荷處的反求精度,整體反求精度高;

2)應用模型減縮技術可以提高動響應求解效率,有助于載荷反求迭代過程的開展,最終又快又好的求得激勵載荷.

參考文獻

[1] MARCHUK G I. Methods of numerical mathematics[M]. Berlin: Springer-Verlag, 1975: 16-18.

[2] O興盛,劉杰,丁飛,等.基于矩陣攝動的隨機結構動態載荷識別技術[J].機械工程學報,2014, 50(13):148-156.

SUN Xingcheng, LIU Jie, DING Fei, et al. Identification method of dynamic loads for stochastic structures based on matrix perturbation theory[J]. Journal of Mechanical Engineering, 2014, 50(13): 148-156.(In Chinese)

[3] 彭凡,馬慶鎮,肖健,等.整體平動自由結構載荷時域識別技術研究[J].振動與沖擊,2016, 35(6):91-95.

PENG Fan, MA Qingzhen, XIAO Jian, et al. Load identification technique in time domain for free structures with overall translation[J]. Journal of Vibration and Shock, 2016, 35(6): 91-95.(In Chinese)

[4] SANCHEZ J, BENAROYA H. Review of force reconstruction techniques[J]. Journal of Sound and Vibration, 2014, 333(14): 2999-3018.

[5] 胡寅寅,率志君,李玩幽,等.設備載荷識別與激勵源特性的研究現狀[J].噪聲與振動控制,2011(4):1-5.

HU Yinyin, LV Zhijun, LI Wanyou, et al. Status QUO of study on machine,s load identification technique[J]. Noise and Vibration Control, 2011(4): 1-5.(In Chinese)

[6] 劉杰,許燦,李凡,等.基于λ-PDF 和一次二階矩的不確定性反求方法[J].機械工程學報,2015, 51(20):135-143.

LIU Jie, XU Can, LI Fan, et al. Uncertain inverse method based on λ-PDF and first order second moment[J]. Journal of Mechanical Engineering, 2015, 51(20): 135-143.(In Chinese)

[7] 莫旭輝,韓旭,鐘志華.基于漸近神經網絡的汽車前輪定位參數反求[J].湖南大學學報:自然科學版,2008, 35(6):18-22.

MO Xuhui, HAN Xu, ZHONG Zhihua. Identification of front wheel alignment based on the progressive neutral NETW ORK method[J]. Journal of Hunan University:Natural Sciences, 2008, 35(6): 18-22.(In Chinese)

[8] KIM Y C, NELSON P A. Optimal regularisation for acoustic source reconstruction by inverse methods[J]. Journal of Sound and Vibration, 2004, 275(3): 463-487.

[9] CHOI H G, THITE A N, THOMPSON D J. Comparison of methods for parameter selection in Tikhonov regularization with application to inverse force determination[J]. Journal of Sound and Vibration, 2007, 304(3/5): 894-917.

[10]CHOI H G, THITE A N, THOMPSON D J. A threshold for the use of Tikhonov regularization in inverse force determination[J]. Applied Acoustics, 2006, 67(7): 700-719.

[11]張磊,曹越云.總體最小二乘正則化算法的載荷識別[J].振動與沖擊,2014, 33(9):159-164.

ZHANG Lei, CAO Yueyun. Load identification using CG-TLS regulariztion algorithm[J]. Journal of Vibration and Shock, 2014, 33(9): 159-164.(In Chinese)

[12]韓旭,劉杰.時域內多源動態載荷的一種計算反求技術[J].力學學報,2009, 41(4):595-602.

HAN Xu, LIU Jie. A computational reverse technique for multi source dynamic loads in time domain[J]. ACTA Mechanica, 2009, 41(4): 595-602.(In Chinese)

[13]常曉通,閻云聚.基于Green函數和正則化的動態載荷識別方法[J].振動、測試與診斷,2014, 34(1):124-129.

CHANG Xiaotong, YAN Yunju. Dynamic load identification method based on Green function and regularization[J]. Journal of Vibration,Measurement & Diagnosis, 2014, 34(1): 124-129.(In Chinese)

[14]郭s,房懷慶.基于Tikhonov正則化及奇異值分解的載荷識別方法[J].振動與沖擊,2014, 33(6):53-58.

GUO Rong, FANG Huaiqing. Novel load identification method based on the combination of Tikhonov regularization and singular value decomposition[J]. Journal of Vibration and Shock, 2014, 33(6): 53-58.(In Chinese)

[15]HAY N C, ROBERTS D E. Road simulators: the iterative algorithm for drive file creation[C]//2006 SAE World Congress.Detroit, Michigan, 2006: 2006-2011.

[16]陳棟華,靳曉雄,周f.汽車室內道路模擬試驗系統控制算法的研究[J].噪聲與振動控制,2006(1):31-35.

CHEN Donghua, JIN Xiaoxiong, ZHOU Hong. Study on contorl algoirthm for vehicle road simulation test system[J]. Noise and Vibration Control, 2006(1): 31-35.(In Chinese)

[17]杜永昌.車輛道路模擬試驗迭代算法研究[J].農業機械學報,2002, 33(2):5-7.

DU Yongchang. Research on iteration algorithm used for vehicle road simulation[J]. Transactions of the Chinese Society of Agricultural Machinery, 2002, 33(2): 5-7.(In Chinese)

[18]汪斌,過學迅,李孟良.基于迭代學習控制的道路模擬算法[J].汽車工程,2010, 32(8):686-689.

WANG Bin, GUO Xuexun, LI Mengliang. Road simulation algorithn based on iterative leaming control[J]. Automotive Engineering, 2010, 32(8): 686-689.(In Chinese)

[19]O'CALLAHAN J C. A procedure for an improved reduced system (IRS) model[C]//Proceedings of the 7th International Modal Analysis.Las Vegas: Union College Press, 1989: 17-21.

主站蜘蛛池模板: 宣威市| 巴楚县| 渭南市| 石楼县| 平乐县| 根河市| 宝清县| 浦城县| 成都市| 古丈县| 华蓥市| 岑溪市| 武义县| 阿拉善右旗| 武强县| 运城市| 阳曲县| 澄江县| 清新县| 浮梁县| 淳安县| 准格尔旗| 通州市| 罗城| 锦屏县| 桃源县| 嵊州市| 饶阳县| 华池县| 临猗县| 洪湖市| 留坝县| 台前县| 鄂托克旗| 蓬溪县| 长汀县| 凤庆县| 郯城县| 长治市| 天峨县| 康平县|