前言:中文期刊網(wǎng)精心挑選了深度神經(jīng)網(wǎng)絡(luò)綜述范文供你參考和學(xué)習(xí),希望我們的參考范文能激發(fā)你的文章創(chuàng)作靈感,歡迎閱讀。
深度神經(jīng)網(wǎng)絡(luò)綜述范文1
關(guān)鍵詞:垃圾郵件;深度置信網(wǎng)絡(luò);分類;受限玻爾茲曼機(jī);支持向量機(jī)
0 引言
電子郵件的速度快、成本低等優(yōu)勢使其成為人們用于思想和信息交流的強(qiáng)大工具,然而伴隨而來的垃圾郵件成為當(dāng)今網(wǎng)絡(luò)的一個(gè)重要問題[1]。根據(jù)Ferris的研究估計(jì),垃圾郵件數(shù)量占美國一家企業(yè)組織總電子郵件的15%至20%。在這樣的情況下,垃圾郵件造成了大量的帶寬浪費(fèi)和郵件系統(tǒng)超載。由于以上嚴(yán)重問題,必須采取措施來解決垃圾郵件現(xiàn)象。已有研究證明最好的方法是垃圾郵件過濾。
通常有兩種郵件過濾的方法:知識工程(Knowledge Engineering, KE)以及機(jī)器學(xué)習(xí)(Machine Learning, ML)。基于第一種方法的垃圾郵件過濾通常使用預(yù)定義的集合和用戶定義的規(guī)則,這樣的規(guī)則嘗試識別信息中垃圾郵件的典型特點(diǎn);然而,已經(jīng)證明在實(shí)踐中該方法的泛化能力較差。
實(shí)驗(yàn)表明機(jī)器學(xué)習(xí)分類器具有更好的性能,因此大量的分類方法被提出來實(shí)現(xiàn)垃圾郵件檢測任務(wù)。Puniskis等[2]將神經(jīng)網(wǎng)絡(luò)方法應(yīng)用到垃圾郵件分類。也有其他研究人員將樸素貝葉斯法(Naive Bayes, NB)和支持向量機(jī)(Support Vector Machine, SVM)[3-9]應(yīng)用到垃圾郵件分類任務(wù)中。深度置信網(wǎng)絡(luò)(Deep Belief Net, DBN)是擁有深層架構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),其中包含多個(gè)隱含層,而使用DBN的障礙在于如何訓(xùn)練這樣的深層網(wǎng)絡(luò)。通常情況下,由于網(wǎng)絡(luò)權(quán)值的隨機(jī)初始化,基于梯度的優(yōu)化容易陷入局部最小值[10]。Hinton等[11]提出了一種新的貪婪逐層非監(jiān)督算法來初始化基于受限玻爾茲曼機(jī)(Restricted Boltzmann Machine, RBM)的DBN。這個(gè)算法提供了網(wǎng)絡(luò)權(quán)值的初始化方法,隨后使用基于梯度的算法如梯度下降法來微調(diào)網(wǎng)絡(luò)權(quán)值。研究指出,DBN初始化方法的有效性在多個(gè)數(shù)據(jù)集中得到驗(yàn)證[12]。
在受限玻爾茲曼機(jī)的快速學(xué)習(xí)算法的驅(qū)動下, 本文提出了使用深度置信網(wǎng)絡(luò)來解決垃圾郵件問題,并且在三個(gè)充分研究的垃圾郵件數(shù)據(jù)集上評價(jià)分類方法的性能。將本文的算法和較好的垃圾郵件檢測方法支持向量機(jī)分類器[13]進(jìn)行比較,結(jié)果表明,基于深度置信網(wǎng)絡(luò)的方法表現(xiàn)出和SVM相似的性能或者說比SVM更好的性能。
1 深度置信網(wǎng)絡(luò)分類
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)研究主要關(guān)注的是訓(xùn)練網(wǎng)絡(luò)來找到正確的權(quán)重,可以正確地將輸入樣本分類。最成功的算法是著名的反向傳播(Back Propagation,BP)算法。反向傳播的問題是:ANN代表一個(gè)f(X,W)的非線性映射,其中:X是輸入向量,W是整個(gè)網(wǎng)絡(luò)的權(quán)重矩陣。隨著網(wǎng)絡(luò)層數(shù)的增加,函數(shù)f變得越來越復(fù)雜,如此一來將得到多個(gè)局部最小值。反向傳播算法根據(jù)權(quán)重W的初始化來收斂到某一最小值,但有時(shí)它會收斂到一個(gè)表現(xiàn)差的局部最小值而不是全局最小值。對于一些人工智能任務(wù),有些局部最小值是沒有問題的,但是有些是不可以接受的。此外,隨著網(wǎng)絡(luò)層數(shù)的增加,訓(xùn)練時(shí)間變得越來越長。反向傳播的另一問題是它需要大量的標(biāo)簽數(shù)據(jù),這對于許多需要分類的人工智能任務(wù)來說是不可能的。對于之前提到的問題,Hinton等[11]基于DBN和RBM介紹了一種快速學(xué)習(xí)算法來訓(xùn)練深度人工神經(jīng)網(wǎng)絡(luò)。
1.1 深度置信網(wǎng)絡(luò)模型
DBN由多層RBM和一層BP神經(jīng)網(wǎng)絡(luò)構(gòu)成,它的結(jié)構(gòu)如圖1所示。其中,多層RBM網(wǎng)絡(luò)采用無監(jiān)督的學(xué)習(xí)方法,而BP神經(jīng)網(wǎng)絡(luò)采用有監(jiān)督的學(xué)習(xí)方法。自底向上每一層RBM對輸入數(shù)據(jù)進(jìn)行提取、抽象,盡可能保留重要信息,將最后一層RBM網(wǎng)絡(luò)的輸出信息作為BP神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)。由于每層RBM訓(xùn)練只能使該層網(wǎng)絡(luò)參數(shù)達(dá)到最優(yōu),而不能使整個(gè)網(wǎng)絡(luò)達(dá)到最優(yōu),因此本文使用有監(jiān)督的BP神經(jīng)網(wǎng)絡(luò)將誤差反向傳播,自頂向下微調(diào)整個(gè)模型。同時(shí),經(jīng)過若干層RBM網(wǎng)絡(luò)優(yōu)化得到的信息作為BP神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),解決了BP神經(jīng)網(wǎng)絡(luò)由于隨機(jī)初始值容易陷入局部最小值和收斂速度慢的問題。DBN網(wǎng)絡(luò)是一種深層學(xué)習(xí)模型,增加RBM網(wǎng)絡(luò)的層數(shù),可以使提取的信息更抽象,網(wǎng)絡(luò)的精度更高。
3.3 實(shí)驗(yàn)結(jié)果
下面描述DBN和SVM訓(xùn)練的細(xì)節(jié)以及在三個(gè)數(shù)據(jù)集上的分類性能表現(xiàn)。對于LingSpam,設(shè)置k=1500,而對于SpamAssassin和Enron1設(shè)置k=1000。對于SpamAssassin,需要去掉其中的HTML標(biāo)簽。三個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)都使用10折交叉驗(yàn)證[15]。Lingspam已經(jīng)被其創(chuàng)建者劃分為10份;對于其他兩個(gè)數(shù)據(jù)集,隨機(jī)將語料庫拆分成10份,并保證每一部分保留原有語料庫的垃圾郵件比例。
為了將DBN應(yīng)用到垃圾郵件檢測,必須決定隱含層個(gè)數(shù)
以及每層隱含單元的個(gè)數(shù)的合適值。
根據(jù)已有研究,實(shí)驗(yàn)選擇了比較簡單的有3個(gè)隱含層的網(wǎng)絡(luò)[11-12];通過選擇不同隱含單元為網(wǎng)絡(luò)嘗試不同的配置,設(shè)置三個(gè)隱含層的神經(jīng)元個(gè)數(shù)分別為50、50、200,每一層神經(jīng)元的數(shù)量適度的變化并沒有顯著的影響結(jié)果。為了強(qiáng)調(diào)DBN方法對于不同架構(gòu)的魯棒性,本文實(shí)驗(yàn)使用相同的架構(gòu)。
4 結(jié)語
通過逐層無監(jiān)督的學(xué)習(xí)方法預(yù)訓(xùn)練深度網(wǎng)絡(luò)的權(quán)值參數(shù),解決了權(quán)值的初始化問題,提出了基于深度置信網(wǎng)絡(luò)的分類方法,并將其應(yīng)用到垃圾郵件過濾中。實(shí)驗(yàn)結(jié)果表明,深度置信網(wǎng)絡(luò)的分類方法在垃圾郵件過濾中有較好的表現(xiàn),但是也有一些問題將在今后的工作中繼續(xù)探討,例如,如何更好地選擇深度置信網(wǎng)絡(luò)隱藏層數(shù)以及每層的單元個(gè)數(shù)來提高算法的性能。
參考文獻(xiàn):
[1]PU C, WEBB S. Observed trends in spam construction techniques: a case study of spam evolution [C]// CEAS 2006: Proceedings of the Third Conference on Email and AntiSpam. Mountain View, California: CEAS, 2006: 104-112.
[2]PUNIKIS D, LAURUTIS R, DIRMEIKIS R. An artificial neural nets for spam Email recognition [J]. Electronics and Electrical Engineering, 2006, 69(5): 73-76.
[3]ANDROUTSOPOULOS I, PALIOURAS G, MICHELAKIS E. Learning to filter unsolicited commercial Email [M]. Athens, Greece: "DEMOKRITOS", National Center for Scientific Research, 2004.
【谷歌圖書查找】
[4]METSIS V, ANDROUTSOPIULOS I, PALIOURAS G. Spam filtering with naive Bayes ― which naive Bayes? [C]// CEAS 2006: Proceedings of the Third Conference on Email and AntiSpam. Mountain View, California: CEAS, 2006: 27-28.
[5]ZHANG L, ZHU J, YAO T. An evaluation of statistical spam filtering techniques [J]. ACM Transactions on Asian Language Information Processing, 2004, 3(4): 243-269.
[6]HOVOLD J. Naive Bayes spam filtering using wordpositionbased attributes [C]// CEAS 2005: Proceedings of the Second Conference on Email and AntiSpam. Palo Alto, CA: CEAS, 2005: 41-48.
[7]FUMERA G, PILLAI I, ROLI F. Spam filtering based on the analysis of text information embedded into images [J]. The Journal of Machine Learning Research, 2006, 7: 2699-2720.
[8]ALMEIDA T A, ALMEIDA J, YAMAKAMI A. Spam filtering: how the dimensionality reduction affects the accuracy of Naive Bayes classifiers [J]. Journal of Internet Services and Applications, 2011, 1(3): 183-200.
[9]ALMEIDA T A, YAMAKAMI A, ALMEIDA J. Evaluation of approaches for dimensionality reduction applied with Naive Bayes antispam filters [C]// ICMLA09: Proceedings of the 2009 International Conference on Machine Learning and Applications. Piscataway: IEEE, 2009: 517-522.
[10]SUN Z, XUE L, XU M, et al. Overview of deep learning[J]. Application Research of Computers, 2012, 29(8): 2806-2810. (孫志軍,薛磊,許明陽,等.深度學(xué)習(xí)研究綜述[J]. 計(jì)算機(jī)應(yīng)用研究, 2012, 29(8): 2806-2810.
[11]HINTON G E, OSINDERO S, TEH YW. A fast learning algorithm for deep belief nets [J]. Neural Computation, 2006, 18(7): 1527-1554.
[12]BENGIO Y, LAMBLIN P, POPOVICI D, et al. Greedy layerwise training of deep networks [C]// NIPS06: Proceedings of the 2007 Twentieth Annual Conference on Neural Information Processing Systems. Cambridge: MIT Press, 2007, 19: 153-160.
[13]BEUGES C J C. A tutorial on support vector machines for pattern recognition [J]. Data Mining and Knowledge Discovery, 1998, 2(2): 121-167.
深度神經(jīng)網(wǎng)絡(luò)綜述范文2
關(guān)鍵詞: 粒子群優(yōu)化算法; 神經(jīng)網(wǎng)絡(luò); 體育動作; 識別與分類
中圖分類號: TN711?34 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2016)19?0049?04
Abstract: In order to improve the recognition accuracy of sports action, a sports action recognition model based on particle swarm optimizing neural network is proposed. The background subtraction method is used to process the sports video image to obtain the profile of sports action, segment the sports action, and extract the features of sports action. The kernel component analysis is performed for features. The BP neural network is used to train the feature vector. The particle swarm optimization algorithm is used to select the parameters of BP neural network to establish the recognition classifier of sports action. The test results show that the proposed model can improve the recognition rate of sports action and reduce the false recognition rate of sports action, and meet the online recognition requirement of sports action.
Keywords: particle swarm optimization algorithm; neural network; sports action; recognition and classification
0 引 言
隨著經(jīng)濟(jì)水平不斷增長,人們越來越重視體育運(yùn)動,而動作是體育運(yùn)動的基本行為,對體育動作進(jìn)行正確識別和分析,有利于規(guī)范運(yùn)動員的動作和科學(xué)訓(xùn)練,提高運(yùn)動員成績,因此對體育動作識別進(jìn)行研究具有十分重要的意義[1?3]。
體育動作識別是多分類的模式識別問題,包括兩個(gè)關(guān)鍵問題:體育動作特征和體育動作的分類[4]。體育動作特征有側(cè)影和輪廓兩種類型,側(cè)影特征維數(shù)高,使得體育動作的分類器輸入向量數(shù)量過大,計(jì)算時(shí)間復(fù)雜度較長,不能滿足體育動作的在線識別要求[5?7]。相對于側(cè)影特征,輪廓特征能夠更好地刻畫體育的動作類別,常采用傅里葉變換獲得體育動作輪廓特征,特征數(shù)量越多,越不利于體育動作的分類和識別,需要對輪廓特征進(jìn)行降維處理,選擇一些重要特征進(jìn)行體育動作識別建模[8]。體育動作識別的分類器主要采用神經(jīng)網(wǎng)絡(luò)設(shè)計(jì),尤其BP神經(jīng)網(wǎng)絡(luò)的分類性能最優(yōu),應(yīng)用最廣泛[9]。在體育動作分類過程中,BP神經(jīng)網(wǎng)絡(luò)的初始閾值和連接權(quán)值影響識別率,當(dāng)前主要根據(jù)經(jīng)驗(yàn)設(shè)置初始閾值和連接,難以獲得最優(yōu)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
為了獲得更加理想的體育動作識別結(jié)果,提出粒子群優(yōu)化神經(jīng)網(wǎng)絡(luò)的體育動作識別模型(PSO?BPNN),并通過具體實(shí)驗(yàn)測試體育動作識別結(jié)果的優(yōu)劣。
1 PSO?BPNN的體育動作識別模型
1.1 工作思路
PSO?BPNN的體育動作識別思路為:通過傅里葉變換獲得體育動作的特征,采用核主成分分析(KPCA)選擇重要特征;然后采用粒子群優(yōu)化算法選擇BP神經(jīng)網(wǎng)絡(luò)的初始閾值和連接權(quán)值,并對選擇重要特征進(jìn)行學(xué)習(xí),建立體育動作識別的分類器,具體如圖1所示。
1.2 體育動作檢測
在體育動作識別過程中,首先要檢測出運(yùn)動員的動作,結(jié)合運(yùn)動員的動作特點(diǎn),采用幀間差分法實(shí)現(xiàn)動作檢測,并對檢測結(jié)果進(jìn)行膨脹、腐蝕輪廓強(qiáng)化等處理,具體如下:
1.5.2 粒子群優(yōu)化算法
要獲得性能優(yōu)異的體育動作識別分類器,確定合理的BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,采用粒子群優(yōu)化(PSO)算法解決初始權(quán)值和閾值確定問題,以獲得更優(yōu)的體育動作識別效果。
(2) 采用KPCA對體育動作的原始特征進(jìn)行處理,選擇對識別結(jié)果有重要貢獻(xiàn)的特征。
(3) 根據(jù)選擇特征對體育動作訓(xùn)練集和測試樣本進(jìn)行簡化。
(4) 將簡化后的訓(xùn)練樣本集輸入到BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí),并通過粒子群優(yōu)化算法確定BP神經(jīng)網(wǎng)絡(luò)的閾值和連接權(quán)值。
(5) 根據(jù)最優(yōu)閾值和連接權(quán)值建立BP神經(jīng)網(wǎng)絡(luò)的體育動作識別分類器。
(6) 將簡化后的測試樣本集輸入到已建立的體育動作識別分類器中進(jìn)行測試,并輸出識別結(jié)果。
2 實(shí)驗(yàn)結(jié)果與分析
為了檢驗(yàn)PSO?BPNN的體育動作識別性能,在4核 2.75 GHz Intel CPU,8 GB RAM,Win7 OS的個(gè)人計(jì)算機(jī)上采用VC++編程實(shí)現(xiàn)識別模型。選擇10個(gè)運(yùn)動員,他們演示各種簡單體育動作,共得到600個(gè)數(shù)據(jù),隨機(jī)選擇400個(gè)數(shù)據(jù)構(gòu)建訓(xùn)練集,其余數(shù)據(jù)構(gòu)建測試集,基本動作如圖3所示。對比體育動作識別模型為:KPCA選擇特征,BPNN的初始閾值和連接值隨機(jī)確定(KPCA?BPNN);全部原始體育動作特征,粒子群算法優(yōu)化BPNN的初始閾值和連接值(BPNN),采用體育動作識別率和平均一個(gè)動作的識別時(shí)間(s)作為性能評價(jià)指標(biāo)。
采用訓(xùn)練樣本構(gòu)建體育動作識別模型,然后采用測試樣本進(jìn)行測試,它們的識別率如圖4所示,從圖4可以得到如下結(jié)論:
(1) 相對于KPCA?BPNN,PSO?BPNN的體育動作識別率更高,有效降低了體育動作的誤識率,這表明KPCA?BPNN采用隨機(jī)方式確定BPNN的初始閾值和連接值,無法構(gòu)建結(jié)構(gòu)最優(yōu)的BP神經(jīng)網(wǎng)絡(luò),這樣體育動作分類器沒有達(dá)到最優(yōu),難以獲得理想的體育動作識別結(jié)果,從而驗(yàn)證了PSO算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的有效性。
(2) 相對于BPNN,PSO?BPNN提高了體育動作的識別率,這表明體育動作原始特征中有一些重復(fù)特征和無用特征,它們會對體育分類器構(gòu)建產(chǎn)生不利影響,這樣體育動作的識別結(jié)果有待改善,而PSO?BPNN采用KPCA選擇一些重要特征,同時(shí)解決了特征選擇和分類器參數(shù)優(yōu)化問題,使體育動作的識別結(jié)果更加可靠。
經(jīng)常要進(jìn)行體育視頻動作的在線識別,因此采用測試實(shí)驗(yàn)分析體育動作的識別速度,PSO?BPNN與其他模型的體育動作平均識別時(shí)間如表1所示。從表1的體育動作平均識別時(shí)間可知,PSO?BPNN的體育動作平均識別時(shí)間要少于KPCA?BPNN以及BPNN,這是因?yàn)镻SO?BPNN采用KPCA選擇重要特征,降低了體育動作分類器的輸入維數(shù),加快了體育動作識別的建模速度,同時(shí)采用PSO算法確定BP神經(jīng)網(wǎng)絡(luò)的閾值和連接權(quán)值,加快了BP神經(jīng)網(wǎng)絡(luò)的收斂速度,提高了體育動作的識別效率,更好的滿足了實(shí)際應(yīng)用要求。
3 結(jié) 語
針對當(dāng)前體育動作識別建模中的分類器參數(shù)優(yōu)化問題,提出PSO?BPNN的體育動作識別模型,采用測試實(shí)驗(yàn)驗(yàn)證了其有效性,結(jié)果表明,PSO?BPNN找到了體育動作識別的重要特征子集,PSO算法可以確定BPNN的最佳閾值和連接權(quán)值,獲得了比其他體育動作識別模型更高的識別率,執(zhí)行時(shí)間縮短,加快了體育動作識別速度,可以為體育教學(xué)、訓(xùn)練提供有價(jià)值的參考信息。
參考文獻(xiàn)
[1] 周巧云,于仕琪.運(yùn)動體育動作分析[J].先進(jìn)技術(shù)研究通報(bào),2009,3(5):47?51.
[2] 阮濤濤,姚明海,瞿心昱,等.基于視覺的人體運(yùn)動分析綜述[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2010,20(2):245?253.
[3] CHEN L, HOEY J, NUGENT C D, et al. Sensor?based activity recognition [J]. IEEE transactions on applications and reviews, 2012, 42(6): 790?808.
[4] 黎洪松,李達(dá).人體運(yùn)動分析研究的若干新進(jìn)展[J].模式識別與人工智能,2009,22(1): 70?78.
[5] 苗雪蘭.體育動作量化分析智能系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].體育科學(xué),2000,20(3):85?87.
[6] 張毅,張爍,羅元,等.基于Kinect深度圖像信息的手勢軌跡識別及應(yīng)用[J].計(jì)算機(jī)應(yīng)用研究,2012,29(9):3547?3550.
[7] 曹雛清,李瑞峰,趙立軍,等.基于深度圖像技術(shù)的手勢識別方法[J].計(jì)算機(jī)工程,2012,38(8):16?18.
[8] 劉寅,滕曉龍,劉重慶.復(fù)雜背景下基于傅里葉描述子的手勢識別[J].計(jì)算機(jī)仿真,2005,22(12):158?161.
[9] 苗雪蘭.基于模糊神經(jīng)網(wǎng)絡(luò)理論的體育動作模式識別方法[J].計(jì)算機(jī)工程與應(yīng)用,2006(6):155?157.
[10] 王蕭.基于KPCA的探地雷達(dá)自適應(yīng)雜波抑制算法研究[J].現(xiàn)代電子技術(shù),2014,37(11):31?33.
[11] 張玲,王玲,吳桐.基于改進(jìn)的粒子群算法優(yōu)化反向傳播神經(jīng)網(wǎng)絡(luò)的熱舒適度預(yù)測模型[J].計(jì)算機(jī)應(yīng)用,2014,34(3):775?779.
深度神經(jīng)網(wǎng)絡(luò)綜述范文3
關(guān)鍵詞:數(shù)據(jù)挖掘;體育訓(xùn)練;決策樹ID3
中圖分類號:TP311文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2012)22-5492-04
Application Review and Analysis of Data Mining Techniques in Sport Training
XU Jian-min, OU Mu-hua, XIONG Jin-zhi
(Computer College, Dongguan University of Technology, Dongguan 523808, China)
Abstract:With the continuous development of sports, most sports are using IT to access and accumulate. Faced with a huge database and fierce competition in the game, the data mining technology in the field of sports will become a trend. This study focuses mainly on the implementation of the various algorithms based on the data mining, which investigates the algorithm based on decision tree classification applied to tennis, the algorithm based on BP neural network, and the FP-tree algorithm based on association rules. Finally, on the basis of the above method, the study analyzes the direction of improvement to and possible drawbacks of the decision-making ID3 algorithm, and provides a way of research of data mining which will be applied to sports.
Key words: data mining; sports training; decision tree ID3
目前體育數(shù)據(jù)信息的分析通常采用常規(guī)統(tǒng)計(jì)方法:抽樣理論、假設(shè)檢驗(yàn)、決策理論、估計(jì)理論、時(shí)間序列等[1],大多數(shù)統(tǒng)計(jì)分析技術(shù)都要求完善的數(shù)學(xué)理論和嚴(yán)謹(jǐn)?shù)氖褂眉记桑瑢κ褂谜咭蠛芨撸掖蠖鄬儆诔闃友芯浚嬖诓煌潭鹊膩G失信息現(xiàn)象。此外,傳統(tǒng)統(tǒng)計(jì)方法很難挖掘出數(shù)據(jù)資料的潛在規(guī)律。隨著近年來體育領(lǐng)域數(shù)據(jù)增多,各種指標(biāo)的體質(zhì)監(jiān)測數(shù)據(jù),各種各類體育競技比賽數(shù)據(jù)等越來越多,形成海量數(shù)據(jù)[2]。與此同時(shí),計(jì)算機(jī)應(yīng)用技術(shù)在存儲、模擬分析數(shù)據(jù)方面有著很明顯的發(fā)展?jié)摿ΑS谑牵绾卧诤A繑?shù)據(jù)中尋找各種因素間的相互關(guān)系、發(fā)現(xiàn)它們之間的變化規(guī)律,進(jìn)而對數(shù)據(jù)深入分析就成為了計(jì)算機(jī)的重要發(fā)展方向之一。因此,數(shù)據(jù)挖掘技術(shù)的研究和應(yīng)用成為體育科學(xué)研究中不可或缺的內(nèi)容之一。
該文首先介紹數(shù)據(jù)挖掘的定義和基本方法,其次綜述數(shù)據(jù)挖掘技術(shù)在國內(nèi)外體育訓(xùn)練的應(yīng)用情況,最后在此基礎(chǔ)上經(jīng)過對方法和研究方向的分析,提出未來數(shù)據(jù)挖掘技術(shù)在體育訓(xùn)練上的研究方向。
1數(shù)據(jù)挖掘的基本方法
數(shù)據(jù)挖掘作為一門跨學(xué)科的應(yīng)用技術(shù),它涵蓋了統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、人工智能、模糊數(shù)學(xué)等諸多科學(xué)領(lǐng)域,形成了根據(jù)具體任務(wù)而進(jìn)行數(shù)據(jù)分析以及知識萃取的方法體系。同樣,對于相同的問題也可以根據(jù)不同的應(yīng)用領(lǐng)域特點(diǎn)選擇不同的算法。比如,處理描述性挖掘任務(wù)有數(shù)據(jù)特征化和數(shù)據(jù)區(qū)分等概念抽象和數(shù)據(jù)匯總概要處理;預(yù)測性挖掘任務(wù)因目標(biāo)變量屬性的不同有分類和預(yù)測方法。
數(shù)據(jù)挖掘的方法主要有:
1)分類:按照分析對象的屬性分門別類加以定義,建立類組。
2)回歸:是使用一系列的現(xiàn)有數(shù)值來預(yù)測一個(gè)連續(xù)數(shù)值的可能值。
3)預(yù)測:根據(jù)對象屬性的過去觀察值來估計(jì)該屬性未來的值。
4)聚類:是將一組數(shù)據(jù)按照相似性和差異性分為幾個(gè)類別,其目的是使得屬于同一個(gè)類別的數(shù)據(jù)間的相似性盡可能大,不同類別中的數(shù)據(jù)間的相似性盡可能小。
5)關(guān)聯(lián):是要找出在某一事件同時(shí)出現(xiàn)的事件。主要是要找出:如果甲因素出現(xiàn)在某一事件的一部分,則乙因素也出現(xiàn)在該事件中的機(jī)率有多大。
數(shù)據(jù)挖掘常用的技術(shù)主要有決策樹、遺傳算法、聚類分析、神經(jīng)網(wǎng)絡(luò)技術(shù)、關(guān)聯(lián)規(guī)則等[3-4]。
1)決策樹
一種用樹枝狀展現(xiàn)數(shù)據(jù)受各變量的影響情況的分析預(yù)測模型,根據(jù)對目標(biāo)變量產(chǎn)生效應(yīng)的不同而制定分類規(guī)則,它是建立在信息論基礎(chǔ)之上,對數(shù)據(jù)進(jìn)行分類的一種方法。它首先通過一批已知的訓(xùn)練數(shù)據(jù)建立一棵決策樹,然后采用建好的決策樹對數(shù)據(jù)進(jìn)行預(yù)測。決策樹的建立過程是數(shù)據(jù)規(guī)則的生成過程,因此這種方法實(shí)現(xiàn)了數(shù)據(jù)規(guī)則的可視化,其輸出結(jié)果容易理解,精確度較好,效率較高,因而較常用。常用的方法有分類及回歸樹法、卡方自動交互探測法等[3]。
2)遺傳算法
一種新的最佳化空間搜索方法,它應(yīng)用算法的適應(yīng)函數(shù)來決定搜索的方向,運(yùn)用一些擬生物化的人工運(yùn)算過程進(jìn)行一代又一代的周而復(fù)始的演化,求得一個(gè)最佳結(jié)果。特點(diǎn)是具有強(qiáng)固形與求值空間的獨(dú)立性。強(qiáng)固形使問題的限制條件降到最低,并大幅度提高系統(tǒng)的容錯(cuò)能力;而求值空間的獨(dú)立性則使遺傳算法的設(shè)計(jì)單一化,且適用于多種不同性質(zhì)、領(lǐng)域的問題。將遺傳算法運(yùn)用于數(shù)據(jù)挖掘,可以開采出與眾不同的信息,是別的算法所不能替代的。
3)聚類分析
聚類分析是將數(shù)據(jù)對象分成類或簇的過程,使同一簇中的對象之間具有很高的相似度,而不同簇中的對象高度相異。一個(gè)好的聚類方法會最大化類內(nèi)的相似性,最小化類間的相似性。主要聚類方法有:劃分算法、層次算法、基于密度的方法、基于網(wǎng)格的方法、基于模型的方法。
4)神經(jīng)網(wǎng)絡(luò)技術(shù)
一種模仿人腦思考結(jié)構(gòu)的數(shù)據(jù)分析模式,由輸入變量或數(shù)值中自我學(xué)習(xí)并根據(jù)學(xué)習(xí)經(jīng)驗(yàn)所得的知識不斷調(diào)整參數(shù),以期得到資料的模式。是建立在自學(xué)習(xí)的數(shù)學(xué)模型基礎(chǔ)之上,它可以對大量復(fù)雜的數(shù)據(jù)進(jìn)行分析,并能完成對人腦或計(jì)算機(jī)來說極為復(fù)雜的模式抽取及趨勢分析。神經(jīng)網(wǎng)絡(luò)的處理過程主要是通過網(wǎng)絡(luò)的學(xué)習(xí)功能找到一個(gè)恰當(dāng)?shù)倪B接加權(quán)值來得到最佳結(jié)果。比較典型的學(xué)習(xí)方法是回溯法。通過將輸出結(jié)果同一些已知值進(jìn)行一系列比較,加權(quán)值不斷調(diào)整,得到一個(gè)新的輸出值,再經(jīng)過不斷的學(xué)習(xí)過程,最后該神經(jīng)網(wǎng)絡(luò)得到一個(gè)穩(wěn)定的結(jié)果。
5)關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則挖掘就是從大量的數(shù)據(jù)中挖掘出有價(jià)值描述數(shù)據(jù)項(xiàng)之間相互聯(lián)系的有關(guān)知識。關(guān)聯(lián)規(guī)則主要應(yīng)用在商業(yè)數(shù)據(jù)庫中:商品分類設(shè)計(jì)、降價(jià)經(jīng)銷分析、生產(chǎn)安排、貨架擺放策略等。關(guān)聯(lián)規(guī)則主要反映了一個(gè)事物與其他事物之間的相互依存性和關(guān)聯(lián)性。給定一個(gè)事務(wù)集D,挖掘關(guān)聯(lián)規(guī)則的問題就變成如何產(chǎn)生支持度和可信度分別大于用戶給定的最小支持度和最小可信度的關(guān)聯(lián)規(guī)則問題。
2數(shù)據(jù)挖掘在體育領(lǐng)域中的應(yīng)用
2.1數(shù)據(jù)挖掘國內(nèi)外研究情況
1)數(shù)據(jù)挖掘在體育訓(xùn)練國內(nèi)研究的情況
查閱中國期刊中文數(shù)據(jù)庫,碩士博士論文中,涉及到體育數(shù)據(jù)挖掘的體育科研論文內(nèi)容主要有:體育教學(xué)、學(xué)生體質(zhì)調(diào)研、運(yùn)動訓(xùn)練監(jiān)控、臨場比賽優(yōu)化、體育信息管理等的數(shù)據(jù)挖掘研究以及優(yōu)化數(shù)據(jù)挖掘工具在體育領(lǐng)域的應(yīng)用研究。
楊雙燕、趙水寧比較全面地介紹了數(shù)據(jù)挖掘技術(shù)在學(xué)生體質(zhì)調(diào)研、體育產(chǎn)業(yè)、競技體育、體育決策管理中的應(yīng)用方向[5]。高洪歌通過對優(yōu)秀運(yùn)動員參加的國際比賽中的各項(xiàng)技戰(zhàn)術(shù)參數(shù),然后運(yùn)用關(guān)聯(lián)規(guī)則、聚類分析和基于馬爾代夫過程的數(shù)據(jù)挖掘算法,揭示了隱含于數(shù)據(jù)中的很多信息[6]。孟憲明、凌培亮從視野和步長等方面對人工魚群算法進(jìn)行改進(jìn),并提出基于該算法的乒乓球技戰(zhàn)術(shù)分類規(guī)則數(shù)據(jù)挖掘模型,分析頂級乒乓球運(yùn)動員比賽實(shí)例,結(jié)果表明與乒乓球技戰(zhàn)術(shù)關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘相比,該模型在挖掘質(zhì)量和挖掘效果上有較大優(yōu)勢[7]。龔明波,鐘平中通過對通過球隊(duì)進(jìn)球、射門、射門命中率、角球等11項(xiàng)攻防技術(shù)指標(biāo)進(jìn)行主成分分析的基礎(chǔ)上,確定球隊(duì)技戰(zhàn)術(shù)能力聚類的綜合指標(biāo),形成聚類樣本。在此基礎(chǔ)上,引入模擬人類視覺系統(tǒng)的尺度空間理論,提出了基于尺度層次空間聚類的球隊(duì)技戰(zhàn)術(shù)分類方法[8]。陳健、姚頌平以CBA聯(lián)賽為背景運(yùn)用關(guān)聯(lián)規(guī)則得出核心運(yùn)動員的得分與球隊(duì)獲勝的關(guān)聯(lián)度,核心運(yùn)動員的上場時(shí)間和關(guān)聯(lián)度等[9]。
2)數(shù)據(jù)挖掘在國外體育領(lǐng)域中的應(yīng)用現(xiàn)狀
在新世紀(jì)初美國NBA的教練運(yùn)用IBM公司提供的DM工具Advanced Scout能在比賽中輔助教練員林場決定隊(duì)員替換方案,取得了很好地效果。此后,NBA球隊(duì)從各方面廣泛使用該系統(tǒng)來優(yōu)化他們的戰(zhàn)術(shù)組合。
美國國家曲棍球聯(lián)盟與IBM建立了一個(gè)合資公司,推出了電子實(shí)時(shí)比賽計(jì)分和統(tǒng)計(jì)系統(tǒng)NHL-ICE.該軟件可以讓教練、播音員、記者及球迷共同利用NHL各類數(shù)據(jù),使用NHL-ICE挖掘各自所需的信息。
意大利運(yùn)用數(shù)據(jù)挖掘技術(shù)開發(fā)了Data Volley軟件系統(tǒng),實(shí)現(xiàn)了排球比賽的技戰(zhàn)術(shù)統(tǒng)計(jì)分析。
2.2決策樹算法的應(yīng)用
決策樹是一種典型的分類方法,首先對數(shù)據(jù)進(jìn)行處理,利用歸納算法生成可讀的規(guī)則和決策樹,然后使用決策對新數(shù)據(jù)進(jìn)行分析。本質(zhì)上決策樹是通過一系列規(guī)則對數(shù)據(jù)進(jìn)行分類的過程。分類(Classification)任務(wù)就是通過學(xué)習(xí)獲得一個(gè)目標(biāo)函數(shù)(Target Function),將每個(gè)屬性集x映射到一個(gè)預(yù)先定義好的類標(biāo)號y。分類任務(wù)的輸入數(shù)據(jù)是紀(jì)錄的集合,每條記錄也稱為實(shí)例或者樣例。
決策樹算法最具影響和最為典型的算法的主要是ID3算法。ID3算法的基本思想:以信息熵為度量,用于決策樹節(jié)點(diǎn)的屬性選擇,每次優(yōu)先選取信息量最多的屬性,亦即能使熵值變?yōu)樽钚〉膶傩裕詷?gòu)造一顆熵值下降最快的決策樹,到葉子節(jié)點(diǎn)處的熵值為0。此時(shí),每個(gè)葉子節(jié)點(diǎn)對應(yīng)的實(shí)例集中的實(shí)例屬于同一類[10]。
2.3神經(jīng)元網(wǎng)絡(luò)的應(yīng)用
BP算法的基本思想是:學(xué)習(xí)過程分為兩個(gè)部分:信號正向傳播和誤差的反向回傳。信號從正向傳播時(shí),輸入數(shù)據(jù)從輸入層進(jìn)入,經(jīng)過各級隱層網(wǎng)絡(luò)依次逐層處理,傳遞到輸出層,如果輸出層輸出的結(jié)果和期望不相符或者差距很大,那么將誤差值當(dāng)做調(diào)整的信號一次各層向著相反的方向傳回來,通過作用神經(jīng)元之間的連接權(quán)矩陣,使誤差減小。經(jīng)過不斷的學(xué)習(xí),最后使得誤差減小到可以接受的范圍以內(nèi)。具體的算法步驟如下:
1)從訓(xùn)練數(shù)據(jù)集中取出某一樣本數(shù)據(jù),將信息錄入到神經(jīng)網(wǎng)絡(luò)中的輸入端。
2)根據(jù)各個(gè)節(jié)點(diǎn)間的連接情況正向逐層的處理后,可以得到神經(jīng)網(wǎng)絡(luò)的輸出數(shù)據(jù)。
3)計(jì)算網(wǎng)絡(luò)輸出的數(shù)據(jù)值與期望輸出的數(shù)據(jù)值的誤差。
4)把誤差逐層按照相反的方向傳回到之前各層網(wǎng)絡(luò),并且按照一定的原則將誤差信號的值作用到連接的權(quán)值上,使整個(gè)神經(jīng)網(wǎng)絡(luò)的連接權(quán)值誤差越來越小。
5)將數(shù)據(jù)集輸入—輸出樣本逐一重復(fù)以上步驟,直到整個(gè)樣本集的誤差減小到可以接受的范圍。
目前國內(nèi)有學(xué)者將BP神經(jīng)網(wǎng)絡(luò)技術(shù)應(yīng)用到研究體育生化指標(biāo)對競技的影響[12]。他們采用采用BP神經(jīng)網(wǎng)絡(luò),輸入的神經(jīng)元個(gè)數(shù)為4個(gè),隱含層5個(gè)神經(jīng)元,輸出1個(gè)神經(jīng)元。經(jīng)研究得到的結(jié)論是:
1)BP神經(jīng)網(wǎng)絡(luò)精確度比較高,預(yù)測結(jié)果清晰地預(yù)測了運(yùn)動員競技能力和比較科學(xué)的預(yù)測了運(yùn)動員的未來發(fā)展趨勢。
2)在體育訓(xùn)練中,運(yùn)用BP神經(jīng)網(wǎng)絡(luò)模型對運(yùn)動員生化指標(biāo)數(shù)據(jù)可以預(yù)測運(yùn)動員競技成績并且對指導(dǎo)教練員選拔運(yùn)動員有一定的科學(xué)幫助。
2.4關(guān)聯(lián)規(guī)則
數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識。若兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián).關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)[13]。
設(shè)I={i1,i2,…,im}是項(xiàng)的集合。關(guān)聯(lián)規(guī)則:形如A => B的蘊(yùn)涵式,其中A?I , B?I ,并且A∩B =?。支持度:P(AUB),即A和B這兩個(gè)項(xiàng)集在事務(wù)集D中同時(shí)出現(xiàn)的概率.置信度:P(B I A),即在出現(xiàn)項(xiàng)集A的事務(wù)集D中,項(xiàng)集B也同時(shí)出現(xiàn)的概率.如果一條關(guān)聯(lián)規(guī)則同時(shí)滿足最小支持度閾值和最小置信度閾值,那么就認(rèn)為它是有趣的,并稱為強(qiáng)關(guān)聯(lián)規(guī)則。給定一個(gè)事務(wù)集D,挖掘關(guān)聯(lián)規(guī)則問題就是產(chǎn)生支持度和可信度分別大于用戶給定的最小支持度和最小可信度的關(guān)聯(lián)規(guī)則[14]。
3分析
3.1各種常用方法的適用范圍及不足
基于數(shù)據(jù)挖掘決策樹分類方法即ID3方法,比較簡單明了,它構(gòu)建樹的步驟簡單,在屬性不多的情況下人為就可建立,實(shí)用性非常強(qiáng)。
基于數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則方法的乒乓球技戰(zhàn)術(shù)分析系統(tǒng)可以根據(jù)乒乓球比賽的實(shí)戰(zhàn)數(shù)據(jù)結(jié)果進(jìn)行統(tǒng)計(jì)分析,應(yīng)用關(guān)聯(lián)規(guī)則中的FP-growth算法,深入挖掘選手A和選手B在各項(xiàng)技術(shù)的比拼,切磋過程中的弱項(xiàng)和強(qiáng)項(xiàng),也就是選手A與選手B進(jìn)行比賽時(shí)哪些技戰(zhàn)術(shù)會讓自己得分,運(yùn)用哪些技戰(zhàn)術(shù)會使自己失分。不僅有利于自身選手在體育訓(xùn)練中加強(qiáng)自己的薄弱環(huán)節(jié),并且在自己水平有限的情況下和某個(gè)個(gè)體選手對決時(shí)可以充分發(fā)揮自己的強(qiáng)項(xiàng),盡量避免使自己失分的弱項(xiàng),這樣可以把握形勢的主動權(quán),取得更好的成績。所以數(shù)據(jù)挖掘在體育訓(xùn)練方面的應(yīng)用可以挖掘眾多體育信息中潛在的規(guī)律,使體育訓(xùn)練和比賽朝著理性化和精確化的道路發(fā)展,故數(shù)據(jù)挖掘在體育方面產(chǎn)生的影響是舉足輕重的。
將乒乓球比賽技戰(zhàn)術(shù)分析做成一個(gè)實(shí)用、有效的軟件,廣泛的被各個(gè)乒乓球隊(duì)使用,作為為教練做出正確的分析和決策提供一個(gè)參考,使教練的意見和訓(xùn)練更加的客觀,使體育比賽更加的科學(xué)精準(zhǔn)[11-12]。
不過這種方法有一定的不足:
1)比如如果只錄入一場比賽,那么數(shù)據(jù)的說服力和準(zhǔn)確度都會下降。并且在這種不完全數(shù)據(jù)的統(tǒng)計(jì)中技術(shù)水平往往也和現(xiàn)場情況選手的壓力、體能情況和發(fā)揮息息相關(guān)。
2)就是FP-tree關(guān)聯(lián)規(guī)則本身具有一定的誤差。源于它是以支持度-置信度為基礎(chǔ)的關(guān)聯(lián)規(guī)則挖掘方法,在理論上缺乏嚴(yán)格的理論證明和基礎(chǔ)。在閾值參數(shù)設(shè)定缺乏客觀標(biāo)準(zhǔn)時(shí)就將其直接應(yīng)用到客戶細(xì)分中,可能會產(chǎn)生一些誤導(dǎo)。
基于關(guān)聯(lián)規(guī)則本身的局限,我們有必要開發(fā)更好的算法,克服這些不足,在發(fā)現(xiàn)規(guī)則的同時(shí)需要更多的數(shù)據(jù),更深層次的聯(lián)系才行。
3.2對基于決策樹ID3算法的思考
決策樹ID3算法通過學(xué)習(xí)建立一棵決策樹。在生成決策樹的時(shí)候,通常采用信息增益方法來確定生成每個(gè)節(jié)點(diǎn)時(shí)所應(yīng)選擇的合適屬性,也就是通過選擇具有最高信息增益的屬性作為測試是否合適做當(dāng)前屬性的方法。目的是為了將劃分后的獲得的訓(xùn)練樣本進(jìn)行分類所需要信息最小。也就是利用該屬性進(jìn)行信息劃分會使產(chǎn)生的各樣本子集中不同類別混合程度降低。因此決策樹采用這種規(guī)則能夠有效減少對象分類所需要的劃分次數(shù)。
理想的決策樹有三種:1)葉子結(jié)點(diǎn)數(shù)最少;2)葉子節(jié)點(diǎn)深度最小;3)葉子結(jié)點(diǎn)數(shù)最少且葉子節(jié)點(diǎn)深度最小。但是這種最優(yōu)的決策樹是NP難題。因此,決策樹優(yōu)化問題是很難解決的。不過可以盡量通過結(jié)合實(shí)際情況優(yōu)化算法使數(shù)據(jù)挖掘的分類更有效[13]。決策樹ID3算法在網(wǎng)球的例子中尚可正確執(zhí)行和得出可行的結(jié)論。但是ID3算法有一些不足:1)用戶信息的計(jì)算比較依賴于特征取值的數(shù)目較多的屬性,這樣不太合理。
2)ID3算法在建樹時(shí),每個(gè)結(jié)點(diǎn)僅含有一個(gè)屬性,是一種單元的算法,屬性特征間的相關(guān)性強(qiáng)調(diào)的不夠充分,無法體現(xiàn)出屬性間相互聯(lián)系的特點(diǎn)。
3)ID3對噪聲較為敏感。
4)當(dāng)數(shù)據(jù)樣本集增加時(shí),ID3的決策樹會隨之變化。
4結(jié)論
該文首先是對國內(nèi)體育訓(xùn)練中數(shù)據(jù)挖掘技術(shù)的應(yīng)用狀況進(jìn)行綜述,然后對決策樹的應(yīng)用,BP神經(jīng)網(wǎng)絡(luò)技術(shù)在研究體育生化指標(biāo)對競技的影響的應(yīng)用以及FP-Tree算法在乒乓球比賽技術(shù)分析中的應(yīng)用進(jìn)行分析,最后對ID3算法和FP-Tree算法提出自己的見解:雖然做成最優(yōu)的決策樹是一個(gè)難題,但是我們可以根據(jù)自己的經(jīng)驗(yàn)和實(shí)際情況靈活的運(yùn)用算法,即可在實(shí)際應(yīng)用中取得更好的效果,比如訓(xùn)練人員可以根據(jù)天氣等情況判定每日是否適合戶外訓(xùn)練或比賽;另外,運(yùn)用關(guān)聯(lián)分析數(shù)據(jù)挖掘技術(shù)可以實(shí)現(xiàn)乒乓球比賽中技術(shù)運(yùn)用更加合理、精確;它可以實(shí)現(xiàn)對實(shí)戰(zhàn)中選手自身的技術(shù)弱項(xiàng)和強(qiáng)項(xiàng)的挖掘,以及運(yùn)用哪些技術(shù)可以得分或失分,為比賽中技術(shù)運(yùn)用提供了科學(xué)的依據(jù)。
參考文獻(xiàn):
[1]遲殿委,周興斌.數(shù)據(jù)挖掘的體育訓(xùn)練決策支持系統(tǒng)[J].微型計(jì)算機(jī),2009(25):190-192.
[2]郝麗,劉樂平.數(shù)據(jù)挖掘(Data Mining)在體育統(tǒng)計(jì)中的應(yīng)用[J].華東理工學(xué)院學(xué)報(bào),2004,6(5): 92-95.
[3]胡斐.數(shù)據(jù)挖掘在體育領(lǐng)域中的應(yīng)用研究綜述[J].科技創(chuàng)新導(dǎo)報(bào),2010(27):211-212.
[4]朱明.數(shù)據(jù)挖掘[M].2版.合肥:中國科學(xué)技術(shù)大學(xué)出版社,2008.
[5]楊雙燕,趙水寧.體育數(shù)據(jù)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究[J].浙江體育科學(xué),2003,2(30): 49-51.
[6]高洪歌,趙會群.關(guān)聯(lián)規(guī)則挖掘在乒乓球比賽技戰(zhàn)術(shù)分析中的應(yīng)用[J].北方工業(yè)大學(xué)學(xué)報(bào),2003,18(1): 15-20.
[7]孟憲明,凌培亮.基于人工魚群算法的乒乓球數(shù)據(jù)挖掘[J].計(jì)算機(jī)工程,2010,36(5): 28-31.
[8]龔明波,鐘平.尺度空間層次聚類在足球球隊(duì)技、戰(zhàn)術(shù)能力分類中的應(yīng)用研究[J].體育科學(xué),2005,25(1):87-90.
[9]陳健,姚頌平.關(guān)聯(lián)分析在籃球技術(shù)統(tǒng)計(jì)數(shù)據(jù)分析中的應(yīng)用[J].上海體育學(xué)院學(xué)報(bào), 2009, 33(5):91-94.
[10]欒麗華,吉根林.決策樹分類技術(shù)研究[J].計(jì)算機(jī)工程,2004,5(9):95-96.
[11]高洪敏.數(shù)據(jù)挖掘技術(shù)在乒乓球比賽技戰(zhàn)術(shù)分析中的應(yīng)用研究[D].北京,北方工業(yè)大學(xué),2006.
[12]趙會群,孫晶,花勇民,等.數(shù)據(jù)挖掘技術(shù)在體育比賽技戰(zhàn)術(shù)分析中的應(yīng)用研究[J].北京體育大學(xué)學(xué)報(bào),2008,31(5):712-715.
深度神經(jīng)網(wǎng)絡(luò)綜述范文4
【關(guān)鍵詞】電力系統(tǒng);故障診斷;研究現(xiàn)狀;發(fā)展趨勢
中圖分類號:F407文獻(xiàn)標(biāo)識碼: A 文章編號:
引言
電力系統(tǒng)故障診斷是近年來十分活躍的研究課題之一。主要包括系統(tǒng)故障診斷和元件故障診斷兩個(gè)方向,系統(tǒng)級故障診斷是指通過分析電網(wǎng)中各級各類保護(hù)裝置產(chǎn)生的報(bào)警信息、斷路器的狀態(tài)變位信息以及電壓電流等電氣量測量的特征,根據(jù)保護(hù)、斷路器動作的邏輯和運(yùn)行人員的經(jīng)驗(yàn)來推斷可能的故障元件和故障類型的過程。
1國內(nèi)外研究發(fā)展?fàn)顩r
1.1 基于專家系統(tǒng)的診斷方法
專家系統(tǒng)(expert System)利用專家推理方法的計(jì)算機(jī)模型來解決問題,已獲得日益廣泛的應(yīng)用。目前,專家系統(tǒng)用于電力系統(tǒng)故障診斷是比較成功的。根據(jù)故障診斷的知識表示和所用推理策略的不同,專家系統(tǒng)主要有兩類:
(1)基于啟發(fā)式規(guī)則推理的系統(tǒng)。此類系統(tǒng)把保護(hù)、斷路器的動作邏輯以及運(yùn)行人員的診斷經(jīng)驗(yàn)用規(guī)則表示出來,形成故障診斷專家系統(tǒng)的知識庫,采用數(shù)據(jù)驅(qū)動的正向推理將所獲得的征兆與知識庫中的規(guī)則進(jìn)行匹配,進(jìn)而獲得故障診斷的結(jié)論。現(xiàn)在大多數(shù)故障診斷屬于這一類。
(2)結(jié)合正、反推理的系統(tǒng)。此類系統(tǒng)結(jié)合了正反向混合推理方法,根據(jù)斷路器和繼電保護(hù)與被保護(hù)設(shè)備之間的邏輯關(guān)系建立推理規(guī)則,同時(shí)通過反向推理,有效地縮小可能故障的范圍,以動作的繼電保護(hù)與故障假設(shè)的符合程度計(jì)算可信度。文獻(xiàn)[1]介紹了基于事例推理(CBR)和基于規(guī)則推理(RBR)的混合推理的故障診斷專家系統(tǒng)。由于采用了混合推理,提高了故障診斷專家系統(tǒng)的適應(yīng)性與自學(xué)習(xí)能力。
基于專家系統(tǒng)的診斷方法的主要特點(diǎn)是可以方便地把保護(hù)、斷路器的動作邏輯以及運(yùn)行人員的診斷經(jīng)驗(yàn)用規(guī)則表示出來,并允許在知識庫中增加、刪除或修改一些規(guī)則,以確保診斷系統(tǒng)的實(shí)時(shí)性和有效性,同時(shí)還能夠給出符合人類語言習(xí)慣的結(jié)論,并具有相應(yīng)的解釋能力等,比較適合中小型電力系統(tǒng)和變電站的故障診斷。該方法在實(shí)際應(yīng)用中仍然存在如下主要缺陷:①建立知識庫及驗(yàn)證其完備性比較困難;②容錯(cuò)能力較差,缺乏有效的方法識別錯(cuò)誤信息;③大型專家系統(tǒng)的知識庫的維護(hù)難度很大;④專家系統(tǒng)在復(fù)雜故障診斷任務(wù)中會出現(xiàn)組合爆炸和推理速度慢的問題。這些缺陷使得專家系統(tǒng)難以滿足大規(guī)模電力系統(tǒng)在線故障診斷的需要,目前主要應(yīng)用于離線故障分析。
1.2基于人工神經(jīng)網(wǎng)絡(luò)的診斷方法
與專家系統(tǒng)相比,基于人工神經(jīng)網(wǎng)絡(luò)(ANN—artifieial neural network)的故障診斷方法具有魯棒性好、容錯(cuò)能力強(qiáng)和學(xué)習(xí)能力強(qiáng)等特點(diǎn)。
目前應(yīng)用于電力系統(tǒng)故障診斷的ANN有:基于BP(baekpropagation)算法的前向神經(jīng)網(wǎng)絡(luò)和基于徑向基函數(shù)的神經(jīng)網(wǎng)絡(luò)等。文獻(xiàn)[1]給出了典型的故障診斷神經(jīng)網(wǎng)絡(luò)BP模型,其實(shí)現(xiàn)方法是:以電力系統(tǒng)繼電保護(hù)信息作為ANN的輸人,以可能發(fā)生的故障作為其輸出,選擇適當(dāng)?shù)臉颖炯?xùn)練ANN。整個(gè)訓(xùn)練過程為:首先根據(jù)網(wǎng)絡(luò)當(dāng)前的內(nèi)部表達(dá),對輸人樣本進(jìn)行前向計(jì)算;然后比較網(wǎng)絡(luò)的輸出與期望輸出之間的誤差,若誤差滿足條件,則訓(xùn)練結(jié)束,否則,將誤差信號按原有的通路反向傳播,逐層調(diào)整權(quán)值和闌值,如此反復(fù),直至達(dá)到誤差精度要求。文獻(xiàn)[2]將大型輸電網(wǎng)絡(luò)分區(qū),對各個(gè)區(qū)域分別建立基于BP算法的故障診斷網(wǎng)絡(luò),然后綜合獲得最終的故障診斷結(jié)果。
基于ANN的診斷方法的主要特點(diǎn)是避免了專家系統(tǒng)故障診斷所面臨的知識庫構(gòu)造等難題,不需要推理機(jī)的構(gòu)造。由于用于ANN訓(xùn)練的完備樣本集獲取困難,目前該方法只比較適合中小型電力系統(tǒng)的故障診斷。ANN方法在故障診斷應(yīng)用中存在的問題主要是:①其性能取決于樣本是否完備,而大型的電力系統(tǒng)的完備樣本集獲取非常困難;②與符號數(shù)據(jù)庫交互的功能較弱;③不擅長處理啟發(fā)性的知識;④不知如何確保ANN訓(xùn)練時(shí)收斂的快速性和避免陷人局部最小;⑤缺乏解釋自身行為和輸出結(jié)果的能力。以上缺點(diǎn)限制了ANN故障診斷方法在線應(yīng)用于大型電力系統(tǒng)。如何設(shè)計(jì)適用于大型電力系統(tǒng)的故障診斷系統(tǒng),仍然是一個(gè)有待進(jìn)一步研究的問題。
1.3 基于粗糙集理論的診斷方法
粗糙集理論(roughSettheory)是波蘭Z.Pawlak教授于1982年提出的一種處理不完整性和不確定性問題的新型數(shù)學(xué)工具。粗糙集理論的主要思想:在保持分類能力不變的前提下,通過知識約簡,導(dǎo)出問題的決策或分類規(guī)則。它無需提供問題所需處理的數(shù)據(jù)集合之外的任何先驗(yàn)信息,能有效地分析和處理不精確、不一致、不完整等各種不完備數(shù)據(jù),從中發(fā)現(xiàn)隱含知識,揭示潛在規(guī)律。鑒于粗糙集理論的優(yōu)越性,已經(jīng)有不少研究人員把它引人到故障診斷系統(tǒng)中。
文獻(xiàn)[3][4]把粗糙集理論應(yīng)用于電力系統(tǒng)故障診斷和警報(bào)處理,嘗試應(yīng)用粗糙集理論來處理因保護(hù)裝置和斷路器誤動作、信號傳輸誤碼而造成的錯(cuò)誤或不完整警報(bào)信號,提出的方法考慮各種可能發(fā)生的故障情況,建立決策表(類似于ANN故障診斷的訓(xùn)練樣本集),然后實(shí)現(xiàn)決策表的自動化簡和約簡的搜索,刪除多余屬性后抽取出診斷規(guī)則,揭示警報(bào)信息內(nèi)在冗余性。
文獻(xiàn)[5]提出了基于粗糙集理論與二元邏輯運(yùn)算相結(jié)合的屬性約簡算法以及改進(jìn)的值約簡算法,并將其應(yīng)用于由斷路器和保護(hù)作為條件屬性、故障區(qū)域作為決策屬性的診斷決策表的約簡過程中,利用決策表的約簡形成綜合混合知識模型。文獻(xiàn)[5]提出和構(gòu)造了四類不同的粗糙集與神經(jīng)網(wǎng)絡(luò)(NN)組合的故障診斷模型,給出了粗糙集與NN在四類模型中實(shí)現(xiàn)不同的互補(bǔ)性、關(guān)聯(lián)關(guān)系、應(yīng)用機(jī)理和原則及相應(yīng)的局限性。
2 電力系統(tǒng)故障診斷發(fā)展趨勢
隨著電網(wǎng)建設(shè)的發(fā)展、計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)以及數(shù)學(xué)和智能科學(xué)理論的發(fā)展,不斷有新的電網(wǎng)故障診斷方法出現(xiàn),從電力系統(tǒng)故障診斷理論與方法研究和應(yīng)用的深度、廣度可以清晰地看到,其研究仍停留在理論和模型的探索階段,基本上沒有非常成功的成型實(shí)用系統(tǒng),實(shí)用化方面一直未有太大的發(fā)展。由于以前技術(shù)和設(shè)施的原因,導(dǎo)致信息資源比較有限,從發(fā)表的文獻(xiàn)來看,電網(wǎng)故障診斷系統(tǒng)大多依托于調(diào)度端或變電站內(nèi),分別利用調(diào)度SCADA系統(tǒng)的實(shí)時(shí)信息或站內(nèi)綜合百動化系統(tǒng)收集的信息來實(shí)現(xiàn);隨著系統(tǒng)、計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的發(fā)展,以及故障錄波專用網(wǎng)絡(luò)的建設(shè),后來又發(fā)展了基于故障錄波信息的故障診斷系統(tǒng)。此系統(tǒng)的建設(shè),使諸多的信息孤島納入系統(tǒng)中,對故障后所有相關(guān)的故障信息,例如保護(hù)裝置信息、錄波器信息、雷電定位信息、監(jiān)控裝置信息等,進(jìn)行采集、傳輸、存儲和處理,為電網(wǎng)故障處理提供了信息支持。這些寶貴的信息為新的電網(wǎng)故障診斷方法提供了基礎(chǔ),大大拓展了電網(wǎng)故障診斷的研究方向。因此,在電網(wǎng)故障診斷理論的實(shí)用化過程中,必須充分重視信息的收集與整理工作,包括用于故障診斷的數(shù)據(jù)倉庫的構(gòu)建、故障綜合信息的預(yù)處理和診斷知識的提取等。
3結(jié)束語
電力系統(tǒng)故障診斷是關(guān)系到電力系統(tǒng)安全穩(wěn)定運(yùn)行的重要問題,國內(nèi)外從20世紀(jì)80年代起已經(jīng)進(jìn)行了大量的研究工作,提出了多種故障診斷技術(shù)和方法,但實(shí)際系統(tǒng)中該問題并未很好地解決。隨著電力系統(tǒng)規(guī)模日趨龐大,結(jié)構(gòu)更加復(fù)雜,對電力系統(tǒng)故障診斷提出了更高的要求。本文綜述了電力系統(tǒng)故障智能診斷的研究方法,評述了這些方法中需要改進(jìn)之處,進(jìn)一步指出了該領(lǐng)域的一些主要發(fā)展趨勢。它們對構(gòu)建電力系統(tǒng)故障診斷智能輔助決策系統(tǒng)具有重要的指導(dǎo)意義,對保證電力系統(tǒng)的安全運(yùn)行、減少事故的經(jīng)濟(jì)損失具有重要的理論和現(xiàn)實(shí)意義。
參考文獻(xiàn)
[1]杜一,張沛超,郁惟墉.基于事例和規(guī)則棍合推理的變電站故障診斷系統(tǒng)[J].電網(wǎng)技術(shù),2004,28(l).
[2]YANGH,CHANGW,HUANGC.power system Distributed On line Fault Seetion EstimationUsingDeeisionTreeBasedNeuralNetsApproaeh.IEEETransonPowerDelivery,1995,10(1).
[3]張琦,韓禎祥,文福拴一種基于粗糙集理論的電力系統(tǒng)故障診斷和警報(bào)處理新方法[J].中國電力,1998,31(4).
深度神經(jīng)網(wǎng)絡(luò)綜述范文5
在不平衡電壓下PWM整流器的無電流傳感器控制策略研究
非平衡電橋數(shù)字溫度計(jì)的設(shè)計(jì)
英國皇家學(xué)會舉辦非洲科學(xué)發(fā)展研討會
回線源瞬變電磁法探測深度的影響因素探討
厭氧粘接劑在螺栓連接中的應(yīng)用研究
定量熒光技術(shù)在錄井油氣中的應(yīng)用
液體容積式流量計(jì)容量示值誤差的測量結(jié)果不確定度
GPSRTK實(shí)時(shí)動態(tài)測量技術(shù)的特點(diǎn)與應(yīng)用淺談
電力配網(wǎng)線損管理系統(tǒng)的研究與開發(fā)
加拿大企業(yè)研制出新型太陽能飛艇
基于PLC的液壓實(shí)驗(yàn)臺監(jiān)控系統(tǒng)的研制及開發(fā)
Premiere利用Cool3D搭橋?qū)崿F(xiàn)煙花制作
歐洲議會聯(lián)盟力促可再生能源的加速發(fā)展
淺析反滲透海水淡化裝置高壓泵變頻控制系統(tǒng)的應(yīng)用研究
IBM開發(fā)高性能計(jì)算系統(tǒng)云技術(shù)與工程服務(wù)
淺談計(jì)算機(jī)網(wǎng)絡(luò)信息和網(wǎng)絡(luò)安全防護(hù)策略
計(jì)算機(jī)數(shù)據(jù)庫在信息管理中的應(yīng)用
高職校園網(wǎng)組建設(shè)計(jì)與實(shí)現(xiàn)
中低壓配電網(wǎng)絡(luò)自適應(yīng)電流保護(hù)的研究
視頻流應(yīng)用層組播系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
基于OracleRowID實(shí)現(xiàn)批量數(shù)據(jù)的分頁下載
使用PHP動態(tài)生成SVG圖形
VLAN在嵌入式Linux以太網(wǎng)交換機(jī)中的劃分與實(shí)現(xiàn)
Linux下管道通信的實(shí)現(xiàn)
下一代網(wǎng)絡(luò)(NGN)綜述
Cygnal_C8051F020與80C51單片機(jī)的區(qū)別
物聯(lián)網(wǎng)技術(shù)在動產(chǎn)質(zhì)押動態(tài)監(jiān)管系統(tǒng)中的應(yīng)用
基于PROFIBUS-DP現(xiàn)場總線的制造業(yè)企業(yè)能源監(jiān)控系統(tǒng)設(shè)計(jì)——以某機(jī)車車輛制造企業(yè)為例
一種基于免疫的入侵檢測系統(tǒng)框架
個(gè)性化網(wǎng)絡(luò)信息檢索方法與技巧探討
蓄電池化成電源的設(shè)計(jì)與實(shí)現(xiàn)
混沌與混沌電路設(shè)計(jì)方法的可行性研究
一種用于PPT翻頁控制的無線遙控收發(fā)電路
微機(jī)五防系統(tǒng)在220kV普光變電站的應(yīng)用
變電站綜合自動化系統(tǒng)發(fā)展趨勢探討
電力數(shù)據(jù)的采集與無線傳輸
關(guān)于輸配電線路安全運(yùn)行的措施探析
淺析直流電動機(jī)的勵磁保護(hù)
國內(nèi)核電反應(yīng)堆微型精密控制網(wǎng)測量方法介紹
基于數(shù)字證書的單點(diǎn)登錄技術(shù)研究及應(yīng)用
德國第一個(gè)海上風(fēng)力發(fā)電場實(shí)現(xiàn)并網(wǎng)發(fā)電
CMOS電荷泵鎖相環(huán)中電荷泵的研究與設(shè)計(jì)
NS2中隨機(jī)早期檢測算法的優(yōu)化設(shè)計(jì)和實(shí)現(xiàn)
PWM控制技術(shù)及其在調(diào)平控制器中的應(yīng)用
BP神經(jīng)網(wǎng)絡(luò)在WSN數(shù)據(jù)融合中的應(yīng)用
基于MarcXchange查詢處理的優(yōu)化
太陽能制冷空調(diào)進(jìn)入試用階段
從“番茄花園事件”談中國軟件業(yè)知識產(chǎn)權(quán)戰(zhàn)略
計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境下的自主學(xué)習(xí)策略及模式
基于GPRS/CDMA通信的山洪災(zāi)害預(yù)警系統(tǒng)的設(shè)計(jì)
IBM擬用DNA開發(fā)下一代芯片
基于組織機(jī)構(gòu)代碼數(shù)據(jù)庫信息共享的質(zhì)監(jiān)業(yè)務(wù)信息平臺建設(shè)
淺談Excel軟件在產(chǎn)品原材料消耗計(jì)算中的應(yīng)用
美研發(fā)出新型醫(yī)用黏合劑
鉆井平臺電網(wǎng)中高次諧波的危害及抑制措施
酒精裝置的自控設(shè)計(jì)
LPG發(fā)動機(jī)技術(shù)發(fā)展展望
深度神經(jīng)網(wǎng)絡(luò)綜述范文6
關(guān)鍵詞: 語音識別; 識別原理; 聲學(xué)建模方法; 多維模式識別系統(tǒng)
中圖分類號: TN912.3?34 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2013)13?0043?03
Summary of speech recognition technology and its application
YU Lin?lin
(Naval Aviation Military Representative Office Stationed in Beijing, Beijing 100041, China)
Abstract: As a key technology of human?computer interface in information technology, speech recognition has great research significance and broad application value. the development history of speech recognition technology is introduced, the basic knowledge of speech recognition is expounded, such as concept, basic principle, the acoustic modeling approach. The application of speech recognition technology in various fields are briefly introduced.
Keywords: speech recognition; recognition principle; acoustic modeling approach; multi?dimension pattern recognition system
0 引 言
語言是人類相互交流最常用、最有效、最重要和最方便的通信形式,語音是語言的聲學(xué)表現(xiàn),與機(jī)器進(jìn)行語音交流是人類一直以來的夢想。隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,語音識別技術(shù)也取得突破性的成就,人與機(jī)器用自然語言進(jìn)行對話的夢想逐步接近實(shí)現(xiàn)。語音識別技術(shù)的應(yīng)用范圍極為廣泛,不僅涉及到日常生活的方方面面,在軍事領(lǐng)域也發(fā)揮著極其重要的作用。它是信息社會朝著智能化和自動化發(fā)展的關(guān)鍵技術(shù),使人們對信息的處理和獲取更加便捷,從而提高人們的工作效率。
1 語音識別技術(shù)的發(fā)展
語音識別技術(shù)起始于20世紀(jì)50年代。這一時(shí)期,語音識別的研究主要集中在對元音、輔音、數(shù)字以及孤立詞的識別。
20世紀(jì)60年代,語音識別研究取得實(shí)質(zhì)性進(jìn)展。線性預(yù)測分析和動態(tài)規(guī)劃的提出較好地解決了語音信號模型的產(chǎn)生和語音信號不等長兩個(gè)問題,并通過語音信號的線性預(yù)測編碼,有效地解決了語音信號的特征提取。
20世紀(jì)70年代,語音識別技術(shù)取得突破性進(jìn)展。基于動態(tài)規(guī)劃的動態(tài)時(shí)間規(guī)整(Dynamic Time Warping, DTW)技術(shù)基本成熟,特別提出了矢量量化(Vector Quantization,VQ)和隱馬爾可夫模型(Hidden Markov Model,HMM)理論[1]。
20世紀(jì)80年代,語音識別任務(wù)開始從孤立詞、連接詞的識別轉(zhuǎn)向大詞匯量、非特定人、連續(xù)語音的識別,識別算法也從傳統(tǒng)的基于標(biāo)準(zhǔn)模板匹配的方法轉(zhuǎn)向基于統(tǒng)計(jì)模型的方法。在聲學(xué)模型方面,由于HMM能夠很好的描述語音時(shí)變性和平穩(wěn)性,開始被廣泛應(yīng)用于大詞匯量連續(xù)語音識別(Large Vocabulary Continous Speech Recognition, LVCSR)的聲學(xué)建模[2?3];在語言模型方面,以N元文法為代表的統(tǒng)計(jì)語言模型開始廣泛應(yīng)用于語音識別系統(tǒng)[4]。在這一階段,基于HMM/VQ、HMM/高斯混合模型、HMM/人工神經(jīng)網(wǎng)絡(luò)的語音建模方法開始廣泛應(yīng)用于LVCSR系統(tǒng),語音識別技術(shù)取得新突破。
20世紀(jì)90年代以后,伴隨著語音識別系統(tǒng)走向?qū)嵱没Z音識別在細(xì)化模型的設(shè)計(jì)、參數(shù)提取和優(yōu)化、系統(tǒng)的自適應(yīng)方面取得較大進(jìn)展[5]。同時(shí),人們更多地關(guān)注話者自適應(yīng)、聽覺模型、快速搜索識別算法以及進(jìn)一步的語言模型的研究等課題[6]。此外,語音識別技術(shù)開始與其他領(lǐng)域相關(guān)技術(shù)進(jìn)行結(jié)合,以提高識別的準(zhǔn)確率,便于實(shí)現(xiàn)語音識別技術(shù)的產(chǎn)品化。
2 語音識別基礎(chǔ)
2.1 語音識別概念
語音識別是將人類的聲音信號轉(zhuǎn)化為文字或者指令的過程[7]。語音識別以語音為研究對象,它是語音信號處理的一個(gè)重要研究方向,是模式識別的一個(gè)分支。語音識別的研究涉及微機(jī)技術(shù)、人工智能、數(shù)字信號處理、模式識別、聲學(xué)、語言學(xué)和認(rèn)知科學(xué)等許多學(xué)科領(lǐng)域,是一個(gè)多學(xué)科綜合性研究領(lǐng)域[8]。
根據(jù)在不同限制條件下的研究任務(wù),產(chǎn)生了不同的研究領(lǐng)域。這些領(lǐng)域包括:根據(jù)對說話人說話方式的要求,可分為孤立字(詞)、連接詞和連續(xù)語音識別系統(tǒng);根據(jù)對說話人的依賴程度,可分為特定人和非特定人語音識別系統(tǒng);根據(jù)詞匯量的大小,可分為小詞匯量、中等詞匯量、大詞匯量以及無限詞匯量語音識別系統(tǒng)。
2.2 語音識別基本原理
從語音識別模型的角度講,主流的語音識別系統(tǒng)理論是建立在統(tǒng)計(jì)模式識別基礎(chǔ)之上的。語音識別的目標(biāo)是利用語音學(xué)與語言學(xué)信息,把輸入的語音特征向量序列[X=x1,x2,…,xT]轉(zhuǎn)化成詞序列[W=w1,w2,…,wN]并輸出。基于最大后驗(yàn)概率的語音識別模型如下式所示:
[W=argmaxW{P(W|X)}=argmaxWP(W|X)P(W)P(X)=argmaxW{P(X|W)P(W)}=argmaxW{logP(X|W)+λlogP(W)}]
上式表明,要尋找的最可能的詞序列[W],應(yīng)該使[P(X|W)]與[P(W)]的乘積達(dá)到最大。其中,[P(X|W)]是特征矢量序列[X]在給定[W]條件下的條件概率,由聲學(xué)模型決定。[P(W)]是[W]獨(dú)立于語音特征矢量的先驗(yàn)概率,由語言模型決定。由于將概率取對數(shù)不影響[W]的選取,第四個(gè)等式成立。[logP(X|W)]與[logP(W)]分別表示聲學(xué)得分與語言得分,且分別通過聲學(xué)模型與語言模型計(jì)算得到。[λ]是平衡聲學(xué)模型與語言模型的權(quán)重。從語音識別系統(tǒng)構(gòu)成的角度講,一個(gè)完整的語音識別系統(tǒng)包括特征提取、聲學(xué)模型、語言模型、搜索算法等模塊。語音識別系統(tǒng)本質(zhì)上是一種多維模式識別系統(tǒng),對于不同的語音識別系統(tǒng),人們所采用的具體識別方法及技術(shù)不同,但其基本原理都是相同的,即將采集到的語音信號送到特征提取模塊處理,將所得到的語音特征參數(shù)送入模型庫模塊,由聲音模式匹配模塊根據(jù)模型庫對該段語音進(jìn)行識別,最后得出識別結(jié)果[9]。
語音識別系統(tǒng)基本原理框圖如圖1所示,其中:預(yù)處理模塊濾除原始語音信號中的次要信息及背景噪音等,包括抗混疊濾波、預(yù)加重、模/數(shù)轉(zhuǎn)換、自動增益控制等處理過程,將語音信號數(shù)字化;特征提取模塊對語音的聲學(xué)參數(shù)進(jìn)行分析后提取出語音特征參數(shù),形成特征矢量序列。語音識別系統(tǒng)常用的特征參數(shù)有短時(shí)平均幅度、短時(shí)平均能量、線性預(yù)測編碼系數(shù)、短時(shí)頻譜等。特征提取和選擇是構(gòu)建系統(tǒng)的關(guān)鍵,對識別效果極為重要。
圖1 語音識別基本原理框圖
由于語音信號本質(zhì)上屬于非平穩(wěn)信號,目前對語音信號的分析是建立在短時(shí)平穩(wěn)性假設(shè)之上的。在對語音信號作短時(shí)平穩(wěn)假設(shè)后,通過對語音信號進(jìn)行加窗,實(shí)現(xiàn)短時(shí)語音片段上的特征提取。這些短時(shí)片段被稱為幀,以幀為單位的特征序列構(gòu)成語音識別系統(tǒng)的輸入。由于梅爾倒譜系數(shù)及感知線性預(yù)測系數(shù)能夠從人耳聽覺特性的角度準(zhǔn)確刻畫語音信號,已經(jīng)成為目前主流的語音特征。為補(bǔ)償幀間獨(dú)立性假設(shè),人們在使用梅爾倒譜系數(shù)及感知線性預(yù)測系數(shù)時(shí),通常加上它們的一階、二階差分,以引入信號特征的動態(tài)特征。
聲學(xué)模型是語音識別系統(tǒng)中最為重要的部分之一。聲學(xué)建模涉及建模單元選取、模型狀態(tài)聚類、模型參數(shù)估計(jì)等很多方面。在目前的LVCSR系統(tǒng)中,普遍采用上下文相關(guān)的模型作為基本建模單元,以刻畫連續(xù)語音的協(xié)同發(fā)音現(xiàn)象。在考慮了語境的影響后,聲學(xué)模型的數(shù)量急劇增加,LVCSR系統(tǒng)通常采用狀態(tài)聚類的方法壓縮聲學(xué)參數(shù)的數(shù)量,以簡化模型的訓(xùn)練。在訓(xùn)練過程中,系統(tǒng)對若干次訓(xùn)練語音進(jìn)行預(yù)處理,并通過特征提取得到特征矢量序列,然后由特征建模模塊建立訓(xùn)練語音的參考模式庫。
搜索是在指定的空間當(dāng)中,按照一定的優(yōu)化準(zhǔn)則,尋找最優(yōu)詞序列的過程。搜索的本質(zhì)是問題求解,廣泛應(yīng)用于語音識別、機(jī)器翻譯等人工智能和模式識別的各個(gè)領(lǐng)域。它通過利用已掌握的知識(聲學(xué)知識、語音學(xué)知識、詞典知識、語言模型知識等),在狀態(tài)(從高層至底層依次為詞、聲學(xué)模型、HMM狀態(tài))空間中找到最優(yōu)的狀態(tài)序列。最終的詞序列是對輸入的語音信號在一定準(zhǔn)則下的一個(gè)最優(yōu)描述。在識別階段,將輸入語音的特征矢量參數(shù)同訓(xùn)練得到的參考模板庫中的模式進(jìn)行相似性度量比較,將相似度最高的模式所屬的類別作為識別中間候選結(jié)果輸出。為了提高識別的正確率,在后處理模塊中對上述得到的候選識別結(jié)果繼續(xù)處理,包括通過Lattice重打分融合更高元的語言模型、通過置信度度量得到識別結(jié)果的可靠程度等。最終通過增加約束,得到更可靠的識別結(jié)果。
2.3 聲學(xué)建模方法
常用的聲學(xué)建模方法包含以下三種:基于模式匹配的動態(tài)時(shí)間規(guī)整法(DTW);隱馬爾可夫模型法(HMM);基于人工神經(jīng)網(wǎng)絡(luò)識別法(ANN)等。
DTW 是較早的一種模式匹配的方法。它基于動態(tài)規(guī)劃的思想,解決孤立詞語音識別中的語音信號特征參數(shù)序列比較時(shí)長度不一的模板匹配問題。在實(shí)際應(yīng)用中,DTW通過計(jì)算已預(yù)處理和分幀的語音信號與參考模板之間的相似度,再按照某種距離測度計(jì)算出模板間的相似度并選擇最佳路徑。
HMM是對語音信號的時(shí)間序列結(jié)構(gòu)所建立的統(tǒng)計(jì)模型,是在馬爾可夫鏈的基礎(chǔ)上發(fā)展起來的,它是一種基于參數(shù)模型的統(tǒng)計(jì)識別方法。HMM可模仿人的言語過程,可視作一個(gè)雙重隨機(jī)過程:一個(gè)是用具有有限狀態(tài)數(shù)的馬爾可夫鏈來模擬語音信號統(tǒng)計(jì)特性變化的隱含的隨機(jī)過程,另一個(gè)是與馬爾可夫鏈的每一個(gè)狀態(tài)相關(guān)聯(lián)的觀測序列的隨機(jī)過程[10]。
ANN以數(shù)學(xué)模型模擬神經(jīng)元活動,將人工神經(jīng)網(wǎng)絡(luò)中大量神經(jīng)元并行分布運(yùn)算的原理、高效的學(xué)習(xí)算法以及對人的認(rèn)知系統(tǒng)的模仿能力充分運(yùn)用到語音識別領(lǐng)域,并結(jié)合神經(jīng)網(wǎng)絡(luò)和隱含馬爾可夫模型的識別算法,克服了ANN在描述語音信號時(shí)間動態(tài)特性方面的缺點(diǎn),進(jìn)一步提高了語音識別的魯棒性和準(zhǔn)確率。其中成功的方法就是在混合模型中用ANN替代高斯混合模型估計(jì)音素或狀態(tài)的后驗(yàn)概率。2011年,微軟以深度神經(jīng)網(wǎng)絡(luò)替代多層感知機(jī)形成的混合模型系統(tǒng)大大提高了語音識別的準(zhǔn)確率。
3 語音識別的應(yīng)用
語音識別技術(shù)有著非常廣泛的應(yīng)用領(lǐng)域和市場前景。在語音輸入控制系統(tǒng)中,它使得人們可以甩掉鍵盤,通過識別語音中的要求、請求、命令或詢問來作出正確的響應(yīng),這樣既可以克服人工鍵盤輸入速度慢,極易出差錯(cuò)的缺點(diǎn),又有利于縮短系統(tǒng)的反應(yīng)時(shí)間,使人機(jī)交流變得簡便易行,比如用于聲控語音撥號系統(tǒng)、聲控智能玩具、智能家電等領(lǐng)域。在智能對話查詢系統(tǒng)中,人們通過語音命令,可以方便地從遠(yuǎn)端的數(shù)據(jù)庫系統(tǒng)中查詢與提取有關(guān)信息,享受自然、友好的數(shù)據(jù)庫檢索服務(wù),例如信息網(wǎng)絡(luò)查詢、醫(yī)療服務(wù)、銀行服務(wù)等。語音識別技術(shù)還可以應(yīng)用于自動口語翻譯,即通過將口語識別技術(shù)、機(jī)器翻譯技術(shù)、語音合成技術(shù)等相結(jié)合,可將一種語言的語音輸入翻譯為另一種語言的語音輸出,實(shí)現(xiàn)跨語言交流[11]。
語音識別技術(shù)在軍事斗爭領(lǐng)域里也有著極為重要的應(yīng)用價(jià)值和極其廣闊的應(yīng)用空間。一些語音識別技術(shù)就是著眼于軍事活動而研發(fā),并在軍事領(lǐng)域首先應(yīng)用、首獲成效的,軍事應(yīng)用對語音識別系統(tǒng)的識別精度、響應(yīng)時(shí)間、惡劣環(huán)境下的頑健性都提出了更高的要求。目前,語音識別技術(shù)已在軍事指揮和控制自動化方面得以應(yīng)用。比如,將語音識別技術(shù)應(yīng)用于航空飛行控制,可快速提高作戰(zhàn)效率和減輕飛行員的工作負(fù)擔(dān),飛行員利用語音輸入來代替?zhèn)鹘y(tǒng)的手動操作和控制各種開關(guān)和設(shè)備,以及重新改編或排列顯示器上的顯示信息等,可使飛行員把時(shí)間和精力集中于對攻擊目標(biāo)的判斷和完成其他操作上來,以便更快獲得信息來發(fā)揮戰(zhàn)術(shù)優(yōu)勢。
4 結(jié) 語
語音識別的研究工作對于信息化社會的發(fā)展,人們生活水平的提高等方面有著深遠(yuǎn)的意義。隨著計(jì)算機(jī)信息技術(shù)的不斷發(fā)展,語音識別技術(shù)將取得更多重大突破,語音識別系統(tǒng)的研究將會更加深入,有著更加廣闊的發(fā)展空間。
參考文獻(xiàn)
[1] 馬志欣,王宏,李鑫.語音識別技術(shù)綜述[J].昌吉學(xué)院學(xué)報(bào),2006(3):93?97.
[2] RABINER L R, JUANG B H. An introduction to hidden Markov models [J]. IEEE ASSP Magazine, 1986, 3(1): 4?16.
[3] GALES M, YOUNG S. The application of hidden Markov models in speech recognition [J]. Foundations and Trends in Signal Processing, 2008, 1(3): 195?304.
[4] JELINEK F. Continuous speech recognition by statistical methods [J]. Proceedings of the IEEE, 1976, 64(4): 532?556.
[5] 倪崇嘉,劉文舉,徐波.漢語大詞匯量連續(xù)語音識別系統(tǒng)研究進(jìn)展[J].中文信息學(xué)報(bào),2009,23(1):112?123.
[6] 顧亞強(qiáng).非特定人語音識別關(guān)鍵技術(shù)研究[D].長沙:國防科學(xué)技術(shù)大學(xué),2009.
[7] 中華人民共和國國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局.GB/T21023?2007 中文語音識別系統(tǒng)通用技術(shù)規(guī)范[S].北京:中國標(biāo)準(zhǔn)出版社,2007.
[8] 王文慧.基于ARM的嵌入式語音識別系統(tǒng)研究[D].天津:天津大學(xué),2008.
[9] 何湘智.語音識別的研究與發(fā)展[J].計(jì)算機(jī)與現(xiàn)代化,2002(3):3?6.