前言:中文期刊網(wǎng)精心挑選了生物統(tǒng)計學(xué)數(shù)據(jù)分析范文供你參考和學(xué)習(xí),希望我們的參考范文能激發(fā)你的文章創(chuàng)作靈感,歡迎閱讀。
生物統(tǒng)計學(xué)數(shù)據(jù)分析范文1
【論文摘要】所謂統(tǒng)計思想,就是在統(tǒng)計實際工作、統(tǒng)計學(xué)理論的應(yīng)用研究中,必須遵循的基本理念和指導(dǎo)思想。統(tǒng)計思想主要包括均值思想、變異思想、估計思想、相關(guān)思想、擬合思想、檢驗思想等思想。文章通過對統(tǒng)計思想的闡釋,提出關(guān)于統(tǒng)計思想認(rèn)識的三點思考。
【論文關(guān)鍵詞】統(tǒng)計學(xué);統(tǒng)計思想;認(rèn)識
1關(guān)于統(tǒng)計學(xué)
統(tǒng)計學(xué)是一門實質(zhì)性的社會科學(xué),既研究社會生活的客觀規(guī)律,也研究統(tǒng)計方法。統(tǒng)計學(xué)是繼承和發(fā)展基礎(chǔ)統(tǒng)計的理論成果,堅持統(tǒng)計學(xué)的社會科學(xué)性質(zhì),使統(tǒng)計理論研究更接近統(tǒng)計工作實際,在國家和社會得到廣泛發(fā)展。
2統(tǒng)計學(xué)中的幾種統(tǒng)計思想
2.1統(tǒng)計思想的形成
統(tǒng)計思想不是天然形成的,需要經(jīng)歷統(tǒng)計觀念、統(tǒng)計意識、統(tǒng)計理念等階段。統(tǒng)計思想是根據(jù)人類社會需求的變化而開展各種統(tǒng)計實踐、統(tǒng)計理論研究與概括,才能逐步形成系統(tǒng)的統(tǒng)計思想。
2.2比較常用的幾種統(tǒng)計思想
所謂統(tǒng)計思想,就是統(tǒng)計實際工作、統(tǒng)計學(xué)理論及應(yīng)用研究中必須遵循的基本理念和指導(dǎo)思想。統(tǒng)計思想主要包括:均值思想、變異思想、估計思想、相關(guān)思想、擬合思想、檢驗思想。現(xiàn)分述如下:
2.2.1均值思想
均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統(tǒng)計學(xué)理論,是統(tǒng)計學(xué)的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發(fā)展趨勢,避免個別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。
2.2.2變異思想
統(tǒng)計研究同類現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計方法就是要認(rèn)識事物數(shù)量方面的差異。統(tǒng)計學(xué)反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。
2.2.3估計思想
估計以樣本推測總體,是對同類事物的由此及彼式的認(rèn)識方法。使用估計方法有一個預(yù)設(shè):樣本與總體具有相同的性質(zhì)。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴(yán)謹(jǐn)?shù)谋匾襟E。
2.2.4相關(guān)思想
事物是普遍聯(lián)系的,在變化中,經(jīng)常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個別事務(wù)所組成,這些個別事物是相互關(guān)聯(lián)的,而我們所研究的事物總體又是在同質(zhì)性的基礎(chǔ)上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關(guān)聯(lián)的。
2.2.5擬合思想
擬合是對不同類型事物之間關(guān)系之表象的抽象。任何一個單一的關(guān)系必須依賴其他關(guān)系而存在,所有實際事物的關(guān)系都表現(xiàn)得非常復(fù)雜,這種方法就是對規(guī)律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達(dá)的是“事物和關(guān)系的變化過程在數(shù)量上所體現(xiàn)的模式和基于此而預(yù)示的可能性”。
2.2.6檢驗思想
統(tǒng)計方法總是歸納性的,其結(jié)論永遠(yuǎn)帶有一定的或然性,基于局部特征和規(guī)律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數(shù)量特征的假設(shè)是否可信。
2.3統(tǒng)計思想的特點
作為一門應(yīng)用統(tǒng)計學(xué),它從數(shù)理統(tǒng)計學(xué)派汲取新的營養(yǎng),并且越來越廣泛的應(yīng)用數(shù)學(xué)方法,聯(lián)系也越來越密切,但在統(tǒng)計思想的體現(xiàn)上與通用學(xué)派相比,還有著自己的特別之處。其基本特點能從以下四個方面體現(xiàn)出:(1)統(tǒng)計思想強調(diào)方法性與應(yīng)用性的統(tǒng)一;(2)統(tǒng)計思想強調(diào)科學(xué)性與藝術(shù)性的統(tǒng)一;(3)統(tǒng)計思想強調(diào)客觀性與主觀性的統(tǒng)一;(4)統(tǒng)計思想強調(diào)定性分析與定量分析的統(tǒng)一。
3對統(tǒng)計思想的一些思考
3.1要更正當(dāng)前存在的一些不正確的思想認(rèn)識
英國著名生物學(xué)家、統(tǒng)計學(xué)家高爾頓曾經(jīng)說過:“統(tǒng)計學(xué)具有處理復(fù)雜問題的非凡能力,當(dāng)科學(xué)的探索者在前進的過程中荊棘載途時,唯有統(tǒng)計學(xué)可以幫助他們打開一條通道”。但事實并非這么簡單,因為我們所面臨的現(xiàn)實問題可能要比想象的復(fù)雜得多。此外,有些人認(rèn)為方法越復(fù)雜越科學(xué),在實際的分析研究中,喜歡簡單問題復(fù)雜化,似乎這樣才能顯示其科學(xué)含量。其實,真正的科學(xué)是使復(fù)雜的問題簡單化而不是追求復(fù)雜化。與此相關(guān)聯(lián)的是,有些人認(rèn)為只有推斷統(tǒng)計才是科學(xué),描述統(tǒng)計不是科學(xué),并延伸擴大到只有數(shù)理統(tǒng)計是科學(xué)、社會經(jīng)濟統(tǒng)計不是科學(xué)這樣的認(rèn)識。這種認(rèn)識是極其錯誤的,至少是對社會經(jīng)濟統(tǒng)計的無知。比利時數(shù)學(xué)家凱特勒不僅研究概率論,并且注重于把統(tǒng)計學(xué)應(yīng)用于人類事物,試圖把統(tǒng)計學(xué)創(chuàng)建成改良社會的一種工具。經(jīng)濟學(xué)和人口統(tǒng)計學(xué)中的某些近代概念,如GNP、人口增長率等等,均是凱特勒及其弟子們的遺產(chǎn)。
3.2要不斷拓展統(tǒng)計思維方式
統(tǒng)計學(xué)是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測到的數(shù)據(jù)信息(尤其是不完全甚至劣質(zhì)的信息)去產(chǎn)生新的知識或去驗證一個假設(shè),即以所掌握的數(shù)據(jù)信息為依據(jù),歸納得出具有一般特征的結(jié)論。歸納推理是要在數(shù)據(jù)信息的基礎(chǔ)上透過偶然性去發(fā)現(xiàn)必然性。演繹推理是對統(tǒng)計認(rèn)識能力的深化,尤其是在根據(jù)必然性去研究和認(rèn)識偶然性方面,具有很大的作用。
3.3深化對數(shù)據(jù)分析的認(rèn)識
任何統(tǒng)計研究都離不開數(shù)據(jù)分析。因為這是得到統(tǒng)計研究結(jié)論的必要環(huán)節(jié)。雖然統(tǒng)計分析的形式隨時代的推移而變化著,但是“從數(shù)據(jù)中提取一切信息”或者“歸納和揭示”作為統(tǒng)計分析的目的卻一直沒有改變。對統(tǒng)計數(shù)據(jù)分析的原因有以下三個方面:一是基于同樣的數(shù)據(jù)會得出不同、甚至相反的分析結(jié)論;二是我們所面對的分析數(shù)據(jù)有時是缺損的或存在不真實性;三是我們所面對的分析數(shù)據(jù)有時則又是海量的,讓人無從下手。雖然統(tǒng)計數(shù)據(jù)分析已經(jīng)經(jīng)歷了描述性數(shù)據(jù)分析(DDA)、推斷性數(shù)據(jù)分析(IDA)和探索性數(shù)據(jù)分析(EDA)等階段,分析的方法技術(shù)已經(jīng)有了質(zhì)的飛躍,但與人類不斷提高的要求相比,存在的問題似乎也越來越多。所以,我們必須深化對數(shù)據(jù)分析的認(rèn)識,圍繞“準(zhǔn)確解答特定問題并且從數(shù)據(jù)中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續(xù)開展數(shù)據(jù)分析方法技術(shù)的研究。
參考文獻:
[1]陳福貴.統(tǒng)計思想雛議[J]北京統(tǒng)計,2004,(05).
[2]龐有貴.統(tǒng)計工作及統(tǒng)計思想[J]科技情報開發(fā)與經(jīng)濟,2004,(03).
生物統(tǒng)計學(xué)數(shù)據(jù)分析范文2
【
1關(guān)于統(tǒng)計學(xué)
統(tǒng)計學(xué)是一門實質(zhì)性的社會科學(xué),既研究社會生活的客觀規(guī)律,也研究統(tǒng)計方法。統(tǒng)計學(xué)是繼承和發(fā)展基礎(chǔ)統(tǒng)計的理論成果,堅持統(tǒng)計學(xué)的社會科學(xué)性質(zhì),使統(tǒng)計理論研究更接近統(tǒng)計工作實際,在國家和社會得到廣泛發(fā)展。
2統(tǒng)計學(xué)中的幾種統(tǒng)計思想
2.1統(tǒng)計思想的形成
統(tǒng)計思想不是天然形成的,需要經(jīng)歷統(tǒng)計觀念、統(tǒng)計意識、統(tǒng)計理念等階段。統(tǒng)計思想是根據(jù)人類社會需求的變化而開展各種統(tǒng)計實踐、統(tǒng)計理論研究與概括,才能逐步形成系統(tǒng)的統(tǒng)計思想。
2.2比較常用的幾種統(tǒng)計思想
所謂統(tǒng)計思想,就是統(tǒng)計實際工作、統(tǒng)計學(xué)理論及應(yīng)用研究中必須遵循的基本理念和指導(dǎo)思想。統(tǒng)計思想主要包括:均值思想、變異思想、估計思想、相關(guān)思想、擬合思想、檢驗思想。現(xiàn)分述如下:
2.2.1均值思想
均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統(tǒng)計學(xué)理論,是統(tǒng)計學(xué)的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發(fā)展趨勢,避免個別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。
2.2.2變異思想
統(tǒng)計研究同類現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計方法就是要認(rèn)識事物數(shù)量方面的差異。統(tǒng)計學(xué)反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。
2.2.3估計思想
估計以樣本推測總體,是對同類事物的由此及彼式的認(rèn)識方法。使用估計方法有一個預(yù)設(shè):樣本與總體具有相同的性質(zhì)。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴(yán)謹(jǐn)?shù)谋匾襟E。
2.2.4相關(guān)思想
事物是普遍聯(lián)系的,在變化中,經(jīng)常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個別事務(wù)所組成,這些個別事物是相互關(guān)聯(lián)的,而我們所研究的事物總體又是在同質(zhì)性的基礎(chǔ)上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關(guān)聯(lián)的。
2.2.5擬合思想
擬合是對不同類型事物之間關(guān)系之表象的抽象。任何一個單一的關(guān)系必須依賴其他關(guān)系而存在,所有實際事物的關(guān)系都表現(xiàn)得非常復(fù)雜,這種方法就是對規(guī)律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達(dá)的是“事物和關(guān)系的變化過程在數(shù)量上所體現(xiàn)的模式和基于此而預(yù)示的可能性”。
2.2.6檢驗思想
統(tǒng)計方法總是歸納性的,其結(jié)論永遠(yuǎn)帶有一定的或然性,基于局部特征和規(guī)律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數(shù)量特征的假設(shè)是否可信。
2.3統(tǒng)計思想的特點
作為一門應(yīng)用統(tǒng)計學(xué),它從數(shù)理統(tǒng)計學(xué)派汲取新的營養(yǎng),并且越來越廣泛的應(yīng)用數(shù)學(xué)方法,聯(lián)系也越來越密切,但在統(tǒng)計思想的體現(xiàn)上與通用學(xué)派相比,還有著自己的特別之處。其基本特點能從以下四個方面體現(xiàn)出:(1)統(tǒng)計思想強調(diào)方法性與應(yīng)用性的統(tǒng)一;(2)統(tǒng)計思想強調(diào)科學(xué)性與藝術(shù)性的統(tǒng)一;(3)統(tǒng)計思想強調(diào)客觀性與主觀性的統(tǒng)一;(4)統(tǒng)計思想強調(diào)定性分析與定量分析的統(tǒng)一。
3對統(tǒng)計思想的一些思考
3.1要更正當(dāng)前存在的一些不正確的思想認(rèn)識
英國著名生物學(xué)家、統(tǒng)計學(xué)家高爾頓曾經(jīng)說過:“統(tǒng)計學(xué)具有處理復(fù)雜問題的非凡能力,當(dāng)科學(xué)的探索者在前進的過程中荊棘載途時,唯有統(tǒng)計學(xué)可以幫助他們打開一條通道”。但事實并非這么簡單,因為我們所面臨的現(xiàn)實問題可能要比想象的復(fù)雜得多。此外,有些人認(rèn)為方法越復(fù)雜越科學(xué),在實際的分析研究中,喜歡簡單問題復(fù)雜化,似乎這樣才能顯示其科學(xué)含量。其實,真正的科學(xué)是使復(fù)雜的問題簡單化而不是追求復(fù)雜化。與此相關(guān)聯(lián)的是,有些人認(rèn)為只有推斷統(tǒng)計才是科學(xué),描述統(tǒng)計不是科學(xué),并延伸擴大到只有數(shù)理統(tǒng)計是科學(xué)、社會經(jīng)濟統(tǒng)計不是科學(xué)這樣的認(rèn)識。這種認(rèn)識是極其錯誤的,至少是對社會經(jīng)濟統(tǒng)計的無知。比利時數(shù)學(xué)家凱特勒不僅研究概率論,并且注重于把統(tǒng)計學(xué)應(yīng)用于人類事物,試圖把統(tǒng)計學(xué)創(chuàng)建成改良社會的一種工具。經(jīng)濟學(xué)和人口統(tǒng)計學(xué)中的某些近代概念,如GNP、人口增長率等等,均是凱特勒及其弟子們的遺產(chǎn)。
3.2要不斷拓展統(tǒng)計思維方式
統(tǒng)計學(xué)是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測到的數(shù)據(jù)信息(尤其是不完全甚至劣質(zhì)的信息)去產(chǎn)生新的知識或去驗證一個假設(shè),即以所掌握的數(shù)據(jù)信息為依據(jù),歸納得出具有一般特征的結(jié)論。歸納推理是要在數(shù)據(jù)信息的基礎(chǔ)上透過偶然性去發(fā)現(xiàn)必然性。演繹推理是對統(tǒng)計認(rèn)識能力的深化,尤其是在根據(jù)必然性去研究和認(rèn)識偶然性方面,具有很大的作用。
3.3深化對數(shù)據(jù)分析的認(rèn)識
任何統(tǒng)計研究都離不開數(shù)據(jù)分析。因為這是得到統(tǒng)計研究結(jié)論的必要環(huán)節(jié)。雖然統(tǒng)計分析的形式隨時代的推移而變化著,但是“從數(shù)據(jù)中提取一切信息”或者“歸納和揭示”作為統(tǒng)計分析的目的卻一直沒有改變。對統(tǒng)計數(shù)據(jù)分析的原因有以下三個方面:一是基于同樣的數(shù)據(jù)會得出不同、甚至相反的分析結(jié)論;二是我們所面對的分析數(shù)據(jù)有時是缺損的或存在不真實性;三是我們所面對的分析數(shù)據(jù)有時則又是海量的,讓人無從下手。雖然統(tǒng)計數(shù)據(jù)分析已經(jīng)經(jīng)歷了描述性數(shù)據(jù)分析(DDA)、推斷性數(shù)據(jù)分析(IDA)和探索性數(shù)據(jù)分析(EDA)等階段,分析的方法技術(shù)已經(jīng)有了質(zhì)的飛躍,但與人類不斷提高的要求相比,存在的問題似乎也越來越多。所以,我們必須深化對數(shù)據(jù)分析的認(rèn)識,圍繞“準(zhǔn)確解答特定問題并且從數(shù)據(jù)中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續(xù)開展數(shù)據(jù)分析方法技術(shù)的研究。
論文摘要】所謂統(tǒng)計思想,就是在統(tǒng)計實際工作、統(tǒng)計學(xué)理論的應(yīng)用研究中,必須遵循的基本理念和指導(dǎo)思想。統(tǒng)計思想主要包括均值思想、變異思想、估計思想、相關(guān)思想、擬合思想、檢驗思想等思想。文章通過對統(tǒng)計思想的闡釋,提出關(guān)于統(tǒng)計思想認(rèn)識的三點思考。
參考文獻:
[1]陳福貴.統(tǒng)計思想雛議[J]北京統(tǒng)計,2004,(05).
[2]龐有貴.統(tǒng)計工作及統(tǒng)計思想[J]科技情報開發(fā)與經(jīng)濟,2004,(03).
生物統(tǒng)計學(xué)數(shù)據(jù)分析范文3
一、統(tǒng)計學(xué)中的幾種常見統(tǒng)計思想
統(tǒng)計思想主要包括:均值思想、變異思想、估計思想、相關(guān)思想、擬合思想、檢驗思想等。統(tǒng)計思想不是天然形成的,需要經(jīng)歷統(tǒng)計觀念、統(tǒng)計意識、統(tǒng)計理念等階段。統(tǒng)計思想是根據(jù)人類社會需求的變化而開展各種統(tǒng)計實踐、統(tǒng)計理論研究與概括,才能逐步形成系統(tǒng)的統(tǒng)計思想。作為一門應(yīng)用統(tǒng)計學(xué),它從數(shù)理統(tǒng)計學(xué)派汲取新的營養(yǎng),并且越來越廣泛的應(yīng)用數(shù)學(xué)方法,聯(lián)系也越來越密切,但在統(tǒng)計思想的體現(xiàn)上與通用學(xué)派相比,還有著自己的特別之處。其基本特點:(1)統(tǒng)計思想強調(diào)方法性與應(yīng)用性的統(tǒng)一;(2)統(tǒng)計思想強調(diào)科學(xué)性與藝術(shù)性的統(tǒng)一;(3)統(tǒng)計思想強調(diào)客觀性與主觀性的統(tǒng)一;(4)統(tǒng)計思想強調(diào)定性分析與定量分析的統(tǒng)一。
1.均值思想。均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統(tǒng)計學(xué)理論,是統(tǒng)計學(xué)的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發(fā)展趨勢,避免個別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。
2.變異思想。統(tǒng)計研究同類現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計方法就是要認(rèn)識事物數(shù)量方面的差異。統(tǒng)計學(xué)反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。
3.估計思想。估計以樣本推測總體,是對同類事物的由此及彼式的認(rèn)識方法。使用估計方法有一個預(yù)設(shè):樣本與總體具有相同的性質(zhì)。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴(yán)謹(jǐn)?shù)谋匾襟E。
4.相關(guān)思想。事物是普遍聯(lián)系的,在變化中,經(jīng)常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個別事務(wù)所組成,這些個別事物是相互關(guān)聯(lián)的,而我們所研究的事物總體又是在同質(zhì)性的基礎(chǔ)上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關(guān)聯(lián)的。
5.擬合思想。擬合是對不同類型事物之間關(guān)系之表象的抽象。任何一個單一的關(guān)系必須依賴其他關(guān)系而存在,所有實際事物的關(guān)系都表現(xiàn)得非常復(fù)雜,這種方法就是對規(guī)律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達(dá)的是“事物和關(guān)系的變化過程在數(shù)量上所體現(xiàn)的模式和基于此而預(yù)示的可能性”。
6.檢驗思想。統(tǒng)計方法總是歸納性的,其結(jié)論永遠(yuǎn)帶有一定的或然性,基于局部特征和規(guī)律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數(shù)量特征的假設(shè)是否可信。
二、對統(tǒng)計思想的若干思考
1.要改變當(dāng)前存在的一些不正確的思想認(rèn)識。英國著名生物學(xué)家、統(tǒng)計學(xué)家高爾頓曾經(jīng)說過:“統(tǒng)計學(xué)具有處理復(fù)雜問題的非凡能力,當(dāng)科學(xué)的探索者在前進的過程中荊棘載途時,唯有統(tǒng)計學(xué)可以幫助他們打開一條通道”。但事實并非這么簡單,因為我們所面臨的現(xiàn)實問題可能要比想象的復(fù)雜得多。此外,有些人認(rèn)為方法越復(fù)雜,越科學(xué)。在實際的分析研究中,喜歡簡單問題復(fù)雜化,似乎這樣才能顯示其科學(xué)含量。其實,真正的科學(xué)是使復(fù)雜的問題簡單化而不是追求復(fù)雜化。與此相關(guān)聯(lián)的是,有些人認(rèn)為只有推斷統(tǒng)計才是科學(xué),描述統(tǒng)計不是科學(xué),并延伸擴大到只有數(shù)理統(tǒng)計是科學(xué)、社會經(jīng)濟統(tǒng)計不是科學(xué)這樣的認(rèn)識。這種認(rèn)識是極其錯誤的,至少是對社會經(jīng)濟統(tǒng)計的無知。比利時數(shù)學(xué)家凱特勒不僅研究概率論,并且注重于把統(tǒng)計學(xué)應(yīng)用于人類事物,試圖把統(tǒng)計學(xué)創(chuàng)建成改良社會的一種工具。經(jīng)濟學(xué)和人口統(tǒng)計學(xué)中的某些近代概念,如GNP、人口增長率等等,均是凱特勒及其弟子們的遺產(chǎn)。
生物統(tǒng)計學(xué)數(shù)據(jù)分析范文4
關(guān)鍵詞 Excel;生物統(tǒng)計學(xué);方差分析;單因素
中圖分類號 O212.1 文獻標(biāo)識碼 A 文章編號 1007-5739(2017)02-0271-02
生物統(tǒng)計學(xué)是對數(shù)據(jù)資料進行收集、整理、分析、解釋的科學(xué)[1],在生物統(tǒng)計學(xué)教材中不僅提供了如何通過合理的試驗設(shè)計獲得理想的數(shù)據(jù)資料,還提供各種數(shù)據(jù)資料的分析方法,是所有高等學(xué)校本科生的必修課。生物統(tǒng)計學(xué)也是畜牧、獸醫(yī)、農(nóng)學(xué)、林學(xué)、微生物、醫(yī)學(xué)等生命科學(xué)領(lǐng)域中不可缺少的統(tǒng)計工具,越來越多的數(shù)據(jù)分析離不開生物統(tǒng)計學(xué)的原理與方法。隨著計算機技術(shù)的發(fā)展,已有更多的軟件被應(yīng)用于生物統(tǒng)計學(xué),如SPSS[2-4]、Excel[5]、SAS[6]等,但是不同的統(tǒng)計軟件具有著不同的統(tǒng)計特點,如Excel統(tǒng)計功能雖然簡單,但是操作方便,分析出來的結(jié)果更為直觀,更適合生物統(tǒng)計學(xué)的初學(xué)者。生物統(tǒng)計學(xué)公式比較多,理論相對深奧,高等學(xué)校本科生對這門課程學(xué)習(xí)興趣相對不高。因此,本文主要介紹如何利用Excel對單因素方差進行分析,以案例的形式詳細(xì)闡述其分析過程,希望能通過本文的應(yīng)用與探討來提高學(xué)生對生物統(tǒng)計學(xué)的學(xué)習(xí)興趣,并增強學(xué)生分析數(shù)據(jù)的能力。
1 分析工具庫的安裝
Excel一般不直接裝配“分析工具庫”這一模塊,需要在Excel的基礎(chǔ)上自行安裝。安裝步驟:Excel的工具加載宏分析工具庫確定。
2 單因素方差分析
單因素的方差分析一般適用于單因素試驗設(shè)計的數(shù)據(jù)分析,而且是因素水平需要>2時才可以運用此分析模塊,例如比較分析3種飼料對仔豬日增重的影響則可以采用單因素方差分析。如果同樣是單因素試驗設(shè)計,但是因素水平是2的話,則可以采用t檢驗?zāi)K進行分析。
2.1 數(shù)據(jù)資料的建立
例:在同樣飼養(yǎng)管理下,3個品種豬(A1、A2、A3)的增重如表1所示,試對3個品種增重差異是否顯著進行檢驗[1]。數(shù)據(jù)資料建立如表1,以行的形式建立稻藎每行就是1個因素水平。
2.2 單因素方差分析過程
在Excel中:工具數(shù)據(jù)分析單因素方差分析,點擊“確定”進行分析。輸入?yún)^(qū)域:選擇原始數(shù)據(jù);分組方式:逐行(如果數(shù)據(jù)是以列的形式構(gòu)建的,則逐列);標(biāo)志位于第1列,指的是在建立數(shù)據(jù)的時候在數(shù)據(jù)第1列有數(shù)據(jù)的變量名,而且在輸入?yún)^(qū)域選擇的時候?qū)⒆兞棵策x上,這時可以勾選“標(biāo)志位于第一列”,否則就不選擇此項。?琢(顯著水平):0.05(或者0.01);輸出選項:輸出區(qū)域處選一空白處,單擊“確定”按鈕(圖1)。
2.3 結(jié)果分析
結(jié)果部分見表2、3,表2中對數(shù)據(jù)進行了描述統(tǒng)計量的分析,只是簡單地列出了3個豬品種的樣本大小(6)、平均數(shù)、方差、總和等信息。從此結(jié)果可以初步看出,第3組(A3)的豬增重均值最小,但是數(shù)據(jù)資料的變異程度比較大(方差大),而第1組(A1)的豬增重均值是最大,第2組(A2)的數(shù)據(jù)資料的變異程度最小(方差小)。
方差分析的最終結(jié)果見表3,圖針對所有數(shù)據(jù)資料的變異來源分為組間(處理:在此例中為不同品種)和組內(nèi)(隨機誤差),分別列出了平方和(SS)、自由度(df)、均方(MS)、F值(F)、相伴概率(顯著性概率,P),F(xiàn)的臨界值(分位數(shù),F(xiàn)crit)。根據(jù)表3的結(jié)果可以有2種方法判斷結(jié)果,其一是直接根據(jù)顯著性概率來判斷,在本例中利用小概率不可能性原理,P=0.062 348>0.05(小概率),因此不同品種豬的增重差異不顯著;也可以根據(jù)F值來判斷,F(xiàn)=3.358 039
從表2、3可以看出,雖然不同品種豬的增重從均值上來看略微有些區(qū)別,但是經(jīng)過方差分析,結(jié)果為3個品種豬的增重差異不顯著,或者說沒有顯著差異,這也是生物統(tǒng)計學(xué)的精髓。
3 討論
在單因素方差分析中Excel數(shù)據(jù)資料的建立是十分方便的,基本按照因素水平以行或列建立數(shù)據(jù)資料即可,而SPSS統(tǒng)計軟件的數(shù)據(jù)建立[7]需要將同一因素的所有水平建立在同一列里,相對復(fù)雜一些。Excel在結(jié)果輸出時候則給出了相伴概率P和F值這2種結(jié)果,可以以2種方式對結(jié)果進行分析,而SPSS只是以相伴概率P為依據(jù)來判定結(jié)果相對單一[7]。可以看出,利用Excel進行單因素的方差分析雖然從數(shù)據(jù)的建立、分析過程、結(jié)果分析等方面來看,操作相對比較方便,適合初學(xué)者;但是也有不足之處,當(dāng)方差分析結(jié)果是差異顯著(或極顯著)時,不能夠?qū)?shù)據(jù)資料進行進一步的多重比較。
4 參考文獻
[1] 張勤.生物統(tǒng)計學(xué)[M].北京:中國農(nóng)業(yè)大學(xué)出版社,2009.
[2] 白俊艷,賈小平,張小輝,等.生物統(tǒng)計學(xué)課程改革與實踐[J].畜牧與飼料科學(xué),2013,34(10):57-58.
[3] 白俊艷,武曉紅,張小輝,等.生物統(tǒng)計附試驗設(shè)計課程考核方式的改革與實踐[J].安徽農(nóng)業(yè)科學(xué),2015,43(5):369-370.
[4] 秦立金.SPSS統(tǒng)計軟件在生物統(tǒng)計課程中的探索研究[J].赤峰學(xué)院學(xué)報(自然科學(xué)版),2014,30(3):198-199.
[5] 韋若勛.生物統(tǒng)計學(xué)上機實驗課中Excel互動教學(xué)方式的應(yīng)用[J].高等教育,2013(8):185-186.
生物統(tǒng)計學(xué)數(shù)據(jù)分析范文5
關(guān)鍵詞:生物統(tǒng)計學(xué);教學(xué)方式;實踐教學(xué)
中圖分類號:G642.41 文獻標(biāo)志碼:A 文章編號:1674-9324(2014)48-0145-03
生物統(tǒng)計學(xué)是數(shù)理統(tǒng)計在生物學(xué)中的應(yīng)用,它是用數(shù)理統(tǒng)計的原理、方法來分析解釋生物學(xué)中各種現(xiàn)象和實驗調(diào)查資料的一門科學(xué)。生物統(tǒng)計學(xué)是本科生專業(yè)必修課,對提高學(xué)生的科研能力和綜合素質(zhì)有重要意義。生物統(tǒng)計學(xué),不僅提供設(shè)計科學(xué)試驗和收集數(shù)據(jù)的方法,而且也提供整理和分析數(shù)據(jù)、得出科學(xué)結(jié)論的方法。同時,生物統(tǒng)計學(xué)也是一門理論性和實踐性較強的課程,課程內(nèi)容廣、概念多、公式多;加上學(xué)生缺乏背景知識,對該課程認(rèn)識不夠,使這門課程有教師難教,學(xué)生難學(xué)、難記、難用的“四難”課程之稱[1,2]。從2012年開始,我校生物統(tǒng)計學(xué)教研組針對課程特點,重新確立了教學(xué)目標(biāo)和教學(xué)計劃,改進教學(xué)方式,增加學(xué)生上機操作訓(xùn)練,使學(xué)生由傳統(tǒng)的學(xué)習(xí)統(tǒng)計基礎(chǔ)知識向掌握具體數(shù)據(jù)處理和分析方法的目標(biāo)上轉(zhuǎn)變,將過去以筆試為主的考試方式轉(zhuǎn)變?yōu)榛A(chǔ)知識測試和統(tǒng)計分析方法應(yīng)用相結(jié)合的考核制度,從源頭上使教學(xué)模式向注重人才培養(yǎng)和提高學(xué)生科研素質(zhì)上轉(zhuǎn)變。經(jīng)過教研組全體教師的努力,生物統(tǒng)計學(xué)的教學(xué)質(zhì)量和教學(xué)水平得到了大幅提升。筆者根據(jù)兩年來的生物統(tǒng)計學(xué)教學(xué)工作的實踐,結(jié)合課程特點,對生物統(tǒng)計學(xué)課程教學(xué)方法的探索和實踐作如下總結(jié)。
一、確立教學(xué)目標(biāo)、調(diào)整教學(xué)計劃
2012年前,我校生物統(tǒng)計學(xué),主要由數(shù)學(xué)專業(yè)的老師進行講授,教學(xué)內(nèi)容以數(shù)理統(tǒng)計為主。學(xué)生學(xué)習(xí)本課程后,仍然無法將統(tǒng)計學(xué)這一工具應(yīng)用于生物學(xué)的相關(guān)領(lǐng)域。針對這一情況,學(xué)院領(lǐng)導(dǎo)研究決定生物統(tǒng)計學(xué)這門課程由學(xué)院相關(guān)專業(yè)的教師授課,教研組接到通知后進行了研究部署。筆者在確立人才培養(yǎng)目標(biāo)時,首先將生物統(tǒng)計學(xué)課程定義為工具課。在確保這一基礎(chǔ)后,筆者根據(jù)我校本科生培養(yǎng)目標(biāo),將生物統(tǒng)計學(xué)的目標(biāo)明確為:以一線教師和科研工作中最常用的統(tǒng)計分析方法為內(nèi)容,要求學(xué)生了解現(xiàn)代科學(xué)研究的基本方法、統(tǒng)計學(xué)基本概念和主要參數(shù)的意義;理解生物學(xué)實驗設(shè)計方法和常用統(tǒng)計模型的應(yīng)用條件;掌握實驗設(shè)計和統(tǒng)計分析方法,掌握EXCEL和STATISTICA軟件操作方法,能夠獨立進行生物學(xué)試驗結(jié)果的統(tǒng)計分析,并具有綜合運用所學(xué)知識分析問題和解決問題的能力。
根據(jù)上述教學(xué)目標(biāo),筆者選擇合適的課程教材,制定教學(xué)計劃,將生物統(tǒng)計學(xué)的課程重心放在讓學(xué)生了解統(tǒng)計學(xué)的一般原理和方法、掌握實驗設(shè)計和數(shù)據(jù)分析的原理、掌握統(tǒng)計軟件處理和分析數(shù)據(jù)的方法上。
二、優(yōu)化教學(xué)內(nèi)容,突出課程重點
教學(xué)內(nèi)容貫穿整個教學(xué)過程,是人才培養(yǎng)的主要落腳點。生物統(tǒng)計學(xué)的教學(xué)內(nèi)容非常龐雜,筆者根據(jù)教學(xué)目標(biāo)和教學(xué)計劃,將生物統(tǒng)計學(xué)課程進行了梳理,主要以一線教師和科研工作者最常用到的統(tǒng)計學(xué)知識為基礎(chǔ)。教學(xué)內(nèi)容,主要包括數(shù)據(jù)和數(shù)據(jù)類型、總體和樣本、數(shù)據(jù)的描述性統(tǒng)計、概率和分布、統(tǒng)計推斷、t檢驗、方差分析、數(shù)據(jù)轉(zhuǎn)換、多重比較、相關(guān)和回歸、因子分析、非參數(shù)檢驗、實驗設(shè)計等。教學(xué)的重點,是讓學(xué)生理解各種統(tǒng)計方法的使用條件和基本原理,通過在計算機上運行EXCEL和STATISTICA軟件,結(jié)合生物學(xué)實例掌握各類統(tǒng)計模型和檢驗方法的具體操作步驟,得出統(tǒng)計檢驗結(jié)果,并根據(jù)實驗數(shù)據(jù)運用已掌握的生物學(xué)原理解釋實驗數(shù)據(jù)所產(chǎn)生的科學(xué)意義。此外,我們在教學(xué)過程中,會將近年來生物學(xué)方面有重要意義的一些統(tǒng)計學(xué)方法和原理做簡單的普及,如將系統(tǒng)發(fā)生關(guān)系納入形態(tài)數(shù)據(jù)中,檢驗形態(tài)特征進化的譜系依賴性;利用不同地理種群的生活史特征和形態(tài)特征計算物種的表型分化,結(jié)合遺傳分化數(shù)據(jù)分析物種分化的原因等。我們通過這樣的方式,在學(xué)生心中埋下進一步學(xué)習(xí)統(tǒng)計學(xué)的種子,為他們以后的科研和學(xué)習(xí)提供幫助。從教學(xué)內(nèi)容上,筆者將以往所注重的統(tǒng)計原理介紹和統(tǒng)計模型推導(dǎo)的部分轉(zhuǎn)變?yōu)樽寣W(xué)生理解統(tǒng)計模型的原理和應(yīng)用條件,內(nèi)容上側(cè)重于讓學(xué)生掌握統(tǒng)計分析方法的應(yīng)用。因此,筆者在授課過程中,上機實習(xí)的學(xué)習(xí)時間約占整個課時的50%。根據(jù)人才培養(yǎng)目標(biāo),生物統(tǒng)計學(xué)課程重點要求學(xué)生掌握實驗數(shù)據(jù)分析處理的一般方法,并利用EXCEL和STATISTICA軟件綜合分析數(shù)據(jù)并得出科學(xué)結(jié)論。教學(xué)過程中,筆者注重生物學(xué)實例教學(xué),利用已發(fā)表文章的數(shù)據(jù)為訓(xùn)練內(nèi)容,將課程所涉及的各類統(tǒng)計模型貫穿于實例教學(xué)中,使學(xué)生在學(xué)習(xí)理論知識的同時,將所學(xué)方法應(yīng)用于實際科研項目中,激發(fā)學(xué)生學(xué)習(xí)的積極性和主動性。
三、“以學(xué)生為本”,優(yōu)化教學(xué)方式
現(xiàn)代教學(xué)觀念認(rèn)為,課程是學(xué)生的發(fā)展,課程是教師與學(xué)生之間的契約[3]。這里體現(xiàn)了一種“以學(xué)生為本”的教學(xué)理念,傳統(tǒng)教學(xué)較多地體現(xiàn)在對教師和教材的關(guān)注上,而“以學(xué)生為本”的教學(xué)思想,則更多地關(guān)注在課程教學(xué)活動過程中學(xué)生的參與和知識的獲得,關(guān)注在課程教學(xué)過程中為學(xué)生創(chuàng)造出充滿生機的學(xué)習(xí)、研究氛圍,為學(xué)生提供張揚個性、充分發(fā)展的環(huán)境[4]。在“以學(xué)生為本”的教學(xué)思想指導(dǎo)下,針對生物統(tǒng)計學(xué)理論性較強,內(nèi)容枯燥、乏味等特點,筆者在教學(xué)過程中,以多媒體教學(xué)為主,輔以傳統(tǒng)的板書教學(xué)。教學(xué)過程,筆者為學(xué)生提供大量的實驗數(shù)據(jù),啟發(fā)和引導(dǎo)學(xué)生主動挖掘數(shù)據(jù),通過小組討論等形式探究數(shù)據(jù)處理方式,應(yīng)用已學(xué)習(xí)的統(tǒng)計模型分析實驗數(shù)據(jù)并得出科學(xué)結(jié)論。
在教學(xué)過程中,將傳統(tǒng)的教師講授模式轉(zhuǎn)變?yōu)榻處熤v授和實例教學(xué)相結(jié)合的模式,筆者將上課的地點安排在計算機機房進行,每次上課根據(jù)教學(xué)內(nèi)容的不同設(shè)置1~2課時的實例教學(xué)。從應(yīng)用統(tǒng)計方法解決實際科研問題的角度組織課堂教學(xué),以小組的形式就某個實際問題展開討論,教師的角色定位成課程組織者,充分調(diào)動學(xué)生學(xué)習(xí)的積極性和主動性。例如,我們在講解t檢驗時,前1個課時,我們通過多媒體教學(xué)結(jié)合板書的形式講解t檢驗的應(yīng)用條件和計算原理;其余2個課時,我們提供一定的生物學(xué)實驗和中學(xué)生考試成績相關(guān)的數(shù)據(jù),以小組討論的方式要求學(xué)生對數(shù)據(jù)進行統(tǒng)計檢驗并得出科學(xué)結(jié)論。在學(xué)習(xí)相關(guān)與回歸時,我們要求學(xué)生將生物化學(xué)實驗和生態(tài)學(xué)實驗的數(shù)據(jù)拿到生物統(tǒng)計學(xué)上進行統(tǒng)計檢驗,如分子量和電泳遷移距離的實驗數(shù)據(jù),可以用來檢驗蛋白質(zhì)分子量和電泳遷移距離的相關(guān)性,并預(yù)測已知遷移距離的蛋白質(zhì)分子的分子量;通過卡方檢驗驗證果蠅雜交結(jié)果是否符合實驗預(yù)期等。我們通過對自己實驗數(shù)據(jù)的統(tǒng)計檢驗,讓學(xué)生深刻體會到學(xué)習(xí)生物統(tǒng)計學(xué)的重要性,從而激發(fā)學(xué)習(xí)的主動性,變被動接受為主動學(xué)習(xí)和探究。
四、“學(xué)以致用”,加強實踐教學(xué)
實踐教學(xué)是高校實現(xiàn)人才培養(yǎng)目標(biāo)的重要環(huán)節(jié),是高校生物專業(yè)教育教學(xué)體系的重要組成部分,是培養(yǎng)學(xué)生專業(yè)技能及實踐技能的重要途徑。它對提高學(xué)生的綜合素質(zhì),培養(yǎng)學(xué)生的創(chuàng)新能力,造就學(xué)生成為具有社會競爭力和國際競爭力的高素質(zhì)人才具有特殊作用[5,6]。因此,筆者根據(jù)大學(xué)生人才培養(yǎng)目標(biāo),將生物統(tǒng)計學(xué)的教學(xué)內(nèi)容融入到學(xué)生實踐教學(xué)中。在教學(xué)過程中,我們將整個班級按照每6個人一個小組進行分組,在教授不同的教學(xué)內(nèi)容時,給每組同學(xué)收集一定的數(shù)據(jù),采用研究型教學(xué)的方式讓學(xué)生根據(jù)已有的知識對數(shù)據(jù)進行分析和整理,并得出相應(yīng)的統(tǒng)計結(jié)果。我們通過研究型教學(xué)的方式,可以使學(xué)生積極參與到教學(xué)和科研實踐中,對提高學(xué)生利用生物統(tǒng)計學(xué)的原理解決實際生物學(xué)問題有積極的推動作用。
此外,筆者利用動物、植物和微生物野外實習(xí)和大學(xué)生創(chuàng)新訓(xùn)練等實踐教學(xué)活動引導(dǎo)學(xué)生將所學(xué)的統(tǒng)計學(xué)知識應(yīng)用到實際科研訓(xùn)練中。教師根據(jù)已學(xué)過的統(tǒng)計學(xué)原理組織和指導(dǎo)學(xué)生在開展野外調(diào)查和創(chuàng)新訓(xùn)練前,針對性地查閱文獻、設(shè)計實驗方案,學(xué)生在實習(xí)過程中根據(jù)已確定的實驗方案進行數(shù)據(jù)的收集和采樣工作,完成野外實踐活動并獲得相應(yīng)實驗數(shù)據(jù)后,對數(shù)據(jù)進行統(tǒng)計分析得出科學(xué)結(jié)論。我們通過完整的實驗設(shè)計、獲得數(shù)據(jù)、分析數(shù)據(jù)和得出結(jié)論等過程,使學(xué)生更好地掌握生物統(tǒng)計學(xué)這門工具課,提高學(xué)生的科研創(chuàng)新能力和綜合素質(zhì)。
五、注重實效,改革考核形式
考試是教育教學(xué)工作的重要環(huán)節(jié),正確理解和掌握考試的目的對促進學(xué)生學(xué)習(xí)和改進教學(xué)工作、提高教學(xué)質(zhì)量有重要意義。在以往的教學(xué)過程中,考試以筆試為主,考試內(nèi)容主要偏重于概率論和統(tǒng)計學(xué)的原理和基本概念等,期末考試的成績決定了這門課的最終成績。在這種考試指揮棒的作用下,學(xué)生往往是平時松、考前緊,考后不復(fù)習(xí)。這種考試方式不能全面考查學(xué)生對各種統(tǒng)計分析方法的掌握和應(yīng)用情況,同時也不利于學(xué)生形成良好的學(xué)習(xí)習(xí)慣,學(xué)習(xí)課程后也不能將具體的統(tǒng)計學(xué)方法應(yīng)用到今后的科研或教學(xué)實踐中。為了扭轉(zhuǎn)這種局面,對學(xué)生進行準(zhǔn)確、客觀、公正地評定學(xué)習(xí)成績和能力的改革勢在必行。筆者根據(jù)人才培養(yǎng)目標(biāo),將課程最終考核成績分為以下三個部分:平時成績(占總成績的40%,主要由出勤和課后作業(yè)成績組成)、期末筆試成績(占總成績的24%,主要是生物統(tǒng)計學(xué)一些重要的概念和統(tǒng)計原理)和實驗數(shù)據(jù)分析(占總成績的36%,根據(jù)給定的實驗數(shù)據(jù),利用EXCEL和STATISTICA軟件選擇正確的統(tǒng)計分析方法,得出可靠的實驗結(jié)論)。
在教研組實施上述教學(xué)改革后,我院學(xué)生應(yīng)用統(tǒng)計學(xué)處理和解決科學(xué)問題的能力有了明顯提高。在大學(xué)生科研訓(xùn)練中,我們要求學(xué)生不斷地把統(tǒng)計的方法應(yīng)用到解決實際科學(xué)問題上,使他們形成了一個不斷鞏固統(tǒng)計學(xué)方法和學(xué)習(xí)新的統(tǒng)計學(xué)知識的良性循環(huán)中,對統(tǒng)計學(xué)的學(xué)習(xí)有了更進一步的提高。總之,我們通過對教學(xué)內(nèi)容、教學(xué)模式、教學(xué)方法和考核形式的一系列改革,可以有效地將學(xué)生從機械地學(xué)習(xí)生物統(tǒng)計學(xué)的理論知識向利用統(tǒng)計學(xué)的原理解決實際生物教學(xué)和科研的實際問題上轉(zhuǎn)變,讓學(xué)生能夠在理解統(tǒng)計學(xué)理論的基礎(chǔ)上,正確選擇和熟練運用統(tǒng)計方法解決實際問題。作為專業(yè)教師,我們也會在今后的教學(xué)中,仍需要不斷學(xué)習(xí)統(tǒng)計理論,探索教學(xué)規(guī)律,完善教育體系,提高課程教學(xué)質(zhì)量,為培養(yǎng)具有較強社會適應(yīng)能力和競爭能力的高素質(zhì)應(yīng)用型人才而努力。
參考文獻:
[1]鄒永梅.《生物統(tǒng)計學(xué)》課程建設(shè)的探索[J].江蘇教育學(xué)院學(xué)報,2012,28(5):51-52.
[2]王春強,馬巍,王洪才.高校《生物統(tǒng)計附實驗設(shè)計》課程現(xiàn)狀分析[J].中國校外教育,2012,(11):102.
[3]葛岳靜.關(guān)于精品課程建設(shè)的幾點看法(精品課程建設(shè)專家談)[J].中國大學(xué)教學(xué),2003,(4):4-6.
[4]郭祥群,阮源萍,楊利民,黎朝.以學(xué)生主體的教學(xué)優(yōu)化模式探析[J].廈門大學(xué)學(xué)報,2004,增刊:1-4.
[5]洪梅.深化實踐教學(xué)改革,構(gòu)建合理實踐教學(xué)體系[J].科技信息,2008,(12):201.
生物統(tǒng)計學(xué)數(shù)據(jù)分析范文6
關(guān)鍵詞:數(shù)據(jù)挖掘;神經(jīng)元;方法;應(yīng)用;發(fā)展
中圖分類號:TP311.13 文獻標(biāo)識碼:A 文章編號:1007-9599 (2012) 12-0000-02
一、引言
伴隨信息技術(shù)的迅猛發(fā)展,數(shù)據(jù)庫規(guī)模與應(yīng)用的不斷擴大,大量數(shù)據(jù)隨之產(chǎn)生。新增的數(shù)據(jù)包含了重要的信息,人們希望更好地利用這些數(shù)據(jù),并通過進行更高層次的數(shù)據(jù)分析,為決策者提供更寬廣的視野。
現(xiàn)今,很多領(lǐng)域已建立了相應(yīng)的數(shù)據(jù)倉庫。但人們無法辨別隱藏在海量數(shù)據(jù)中有價信息,傳統(tǒng)的查詢方式無法滿足信息挖掘的需求。因此,伴隨著數(shù)據(jù)倉庫技術(shù)不斷發(fā)展并逐漸完善的一種從海量信息中提取有價潛在信息的嶄新數(shù)據(jù)分析技術(shù)------數(shù)據(jù)挖掘(Data Mining)技術(shù)應(yīng)運而生。
二、數(shù)據(jù)挖掘概念
數(shù)據(jù)挖掘技術(shù)從1990年左右開始,發(fā)展速度很快,數(shù)據(jù)挖掘技術(shù)的產(chǎn)生和不斷發(fā)展可使得人們對當(dāng)今世界的海量數(shù)據(jù)中隱藏著人們所需要的商業(yè)和科學(xué)信息等重要信息進行挖掘。數(shù)據(jù)挖掘運用到交叉學(xué)科,涉及到,包括Database、AI、Machine Learning、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks)、統(tǒng)計學(xué)(statistics)、模式識別(Pattern Recognition)、信息檢索(Information Retrieval)和數(shù)據(jù)庫可視化等,因此數(shù)據(jù)庫目前還沒有明確的定義。通常普遍認(rèn)可的數(shù)據(jù)挖掘定義是:從數(shù)據(jù)庫中抽取隱含的、以前未知的、有潛在應(yīng)用價值的模型或規(guī)則等有用知識的復(fù)雜過程,是一類深層次的數(shù)據(jù)分析方法。
三、數(shù)據(jù)挖掘方法
由于數(shù)據(jù)挖掘技術(shù)研究融合了不同學(xué)科技術(shù),在研究方法上表現(xiàn)為多樣性。從統(tǒng)計學(xué)角度上劃分,數(shù)據(jù)挖掘技術(shù)模型有:線形/非線形分析、回歸/邏輯回歸分析、單/多變量分析、時間序列/最近序列分析和聚類分析等方法。通過運用這些技術(shù)可以檢索出異常形式數(shù)據(jù),最后,利用多種統(tǒng)計和數(shù)學(xué)模型對上述數(shù)據(jù)進行解釋,發(fā)掘出隱藏在海量數(shù)據(jù)后的規(guī)律和知識。
(一)數(shù)據(jù)挖掘統(tǒng)計
統(tǒng)計學(xué)為數(shù)據(jù)挖掘技術(shù)提供了判別方法與分析方法,經(jīng)常會用到的有貝葉斯推理(Bayesian reasoning; Bayesian inference)、回歸分析(Regression analysis)、方差分析(Analysis of Variance,簡稱ANOVA)等分析技術(shù)、貝葉斯推理是在估計與假設(shè)統(tǒng)計歸納基礎(chǔ)上發(fā)展的全新推理方法。貝葉斯推理在與傳統(tǒng)統(tǒng)計歸納推理方法相比較,所得出的結(jié)論不僅根據(jù)當(dāng)前觀察得到的樣本信息,還將根據(jù)推理者過去相關(guān)的經(jīng)驗和知識來處理數(shù)據(jù)挖掘中遇到的分類問題;回歸分析是通過輸入變量和輸出變量來確定變量之間的因果關(guān)系,通過建立回歸模型,根據(jù)實測數(shù)據(jù)求解模型的各參數(shù),若能很好的擬合,則可根據(jù)自變量進一步預(yù)測。統(tǒng)計方法中的方差分析是通過分析研究中估計回歸直線的性能和自變量對最終回歸的貢獻大小,從而確定可控因素對研究結(jié)果影響力的大小。
(二)聚類分析(Cluster analysis )
聚類分析(Cluster analysis)是將一組研究對象分為相對同質(zhì)的群組(clusters)的統(tǒng)計分析技術(shù)。 同組內(nèi)的樣本具有較高相似度,常用技術(shù)有分裂/凝聚算法,劃分/增量聚類。聚類方法適用于研究群組內(nèi)的關(guān)系,并對群組結(jié)構(gòu)做出相應(yīng)評價。同時,聚類分析為了更容易地使某個對象從其他對象中分離出來的方法用于檢測孤立點。聚類分析已被應(yīng)用于經(jīng)濟分析(Economic analysis)、模式識別(Pattern Recognition)、圖像處理(image processing)等多種領(lǐng)域。
(三)機器學(xué)習(xí)(Machine Learning)
機器學(xué)習(xí)方法經(jīng)過多年的研究已相對完善,通過建立人類的認(rèn)識模型、模仿人類的學(xué)習(xí)方法從海量數(shù)據(jù)中提取信息與知識,在很多領(lǐng)域已取得了一些較滿意的成果。因此利用目前比較成熟的機器學(xué)習(xí)方法可以提供數(shù)據(jù)挖掘效率。
(四)數(shù)據(jù)匯總
數(shù)據(jù)庫中的數(shù)據(jù)和對象經(jīng)常包含原始概念層上的詳細(xì)信息,將數(shù)據(jù)集通過數(shù)據(jù)立方體和面向?qū)ο蟮臍w納方法由低概念層抽象到高概念層,并對數(shù)據(jù)歸納為更高概念層次信息的數(shù)據(jù)挖掘技術(shù)。
(五)人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks)
神經(jīng)網(wǎng)絡(luò)是一種模范動物神經(jīng)網(wǎng)絡(luò)行為特征,進行分布式并行信息處理的算法數(shù)學(xué)模型。近年來在解決數(shù)據(jù)挖掘中遇到的問題越來越受到人們的關(guān)注,源于人工神經(jīng)網(wǎng)絡(luò)具有良好的自組織自適應(yīng)性、并行處理、分布式存儲和高容錯等特性,并通過調(diào)整內(nèi)部大量節(jié)點之間相互連接的關(guān)系,達(dá)到處理信息的目的。
(六)遺傳算法(Genetic Algorithm)
遺傳算法(Genetic Algorithm)是模擬達(dá)爾文生物進化論的自然選擇和遺傳學(xué)機理的生物進化過程的計算模型,是一種通過模擬自然進化過程搜索最優(yōu)解的方法,是一種受生物進化啟發(fā)的學(xué)習(xí)方法,通過變異和重組當(dāng)前己知的最好假設(shè)來生成后續(xù)的假設(shè)。遺傳算法可直接對結(jié)構(gòu)對象進行操作,不存在求導(dǎo)和函數(shù)連續(xù)性的限定,能自動獲取和指導(dǎo)優(yōu)化的搜索空間,自適應(yīng)地調(diào)整搜索方向。遺傳算法已被人們廣泛地應(yīng)用于多種學(xué)科領(lǐng)域。
(七)粗糙集
粗糙集是一種刻劃不完整性和不確定性的數(shù)學(xué)工具,能有效地分析不精確,不一致(inconsistent)、不完整(incomplete) 等各種不完備的信息,還可以對數(shù)據(jù)進行分析和推理,從中發(fā)現(xiàn)隱含的知識,揭示潛在的規(guī)律。粗糙集理論應(yīng)用于數(shù)據(jù)挖掘中的分類、發(fā)現(xiàn)不準(zhǔn)確數(shù)據(jù)或噪聲數(shù)據(jù)內(nèi)在的結(jié)構(gòu)聯(lián)系。
四、數(shù)據(jù)挖掘技術(shù)發(fā)展趨勢
當(dāng)前,數(shù)據(jù)挖掘技術(shù)不斷創(chuàng)新與發(fā)展,數(shù)據(jù)挖掘技術(shù)開發(fā)研究人員、系統(tǒng)應(yīng)用人員所面對的主要問題:高效、有效的數(shù)據(jù)挖掘方法和相應(yīng)系統(tǒng)的開發(fā);交互和集成的數(shù)據(jù)挖掘環(huán)境的建立以及在實際應(yīng)用中解決大型問題。
五、小結(jié)
數(shù)據(jù)挖掘技術(shù)涉及到多種學(xué)科技術(shù),如:數(shù)據(jù)庫技術(shù)、統(tǒng)計學(xué)、機器學(xué)習(xí)、高性能計算、模式識別、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)可視化、信息檢索及空間數(shù)據(jù)分析等。因此,數(shù)據(jù)挖掘是非常有前景的研究領(lǐng)域,隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展,它將會廣泛而深入地應(yīng)用到人類社會的各個領(lǐng)域。
參考文獻:
[1]羅可,蔡碧野.數(shù)據(jù)挖掘及其發(fā)展研究[J].計算機工程與應(yīng)用,2002
[2]趙丹群.數(shù)據(jù)挖掘:原理、方法及其應(yīng)用[J].現(xiàn)代圖書情報技術(shù),2000
[3]劉毅勇.情報分析智能輔助決策方法及其軍事應(yīng)用[M].北京:國防大學(xué)出版社,2001
[4]唐曉萍.數(shù)據(jù)挖掘技術(shù)及其在指揮控制系統(tǒng)中的應(yīng)用[J].火力與指揮控制,2002
[5]Alex Berson,Stephen J.Smith,Data Warehousing,Data Mining,&OLAP[M], McCraw-Hill Book Co,1997
[6]吳修霆.SAS數(shù)據(jù)挖掘技術(shù)的實現(xiàn)[J].微電腦世界,2000, Vol.14:pp44-45
[7] INDERPAL BHANDARI, EDWARD COLET, JENNIFER PARKER, ZACHARYPINES, RAJIV PRATAP, KRISHNAKMAR RAMANUJAM. Advanced Scout: Data Mining and Knowledge Discovery in NBA Data. Data Mining and Knowledge Discovery,1997,1:121~125