1.計量資料的統計方法
分析計量資料的統計分析方法可分為參數檢驗法和非參數檢驗法。
參數檢驗法主要為t檢驗和方差分析(ANOVN,即F檢驗)等,兩組間均數比較時(shí)常用t檢驗和u檢驗,兩組以上均數比較時(shí)常用方差分析;非參數檢驗法主要包括秩和檢驗等。t檢驗可分為單組設計資料的t檢驗、配對設計資料的t檢驗和成組設計資料的t檢驗;當兩個(gè)小樣本比較時(shí)要求兩總體分布為正態(tài)分布且方差齊性,若不能滿(mǎn)足以上要求,宜用t 檢驗或非參數方法(秩和檢驗)。方差分析可用于兩個(gè)以上樣本均數的比較,應用該方法時(shí),要求各個(gè)樣本是相互獨立的隨機樣本,各樣本來(lái)自正態(tài)總體且各處理組總體方差齊性。根據設計類(lèi)型不同,方差分析中又包含了多種不同的方法。對于定量資料,應根據所采用的設計類(lèi)型、資料所具備的條件和分析目的,選用合適的統計分析方法,不應盲目套用t檢驗和單因素方差分析。
2.計數資料的統計方法
計數資料的統計方法主要針對四格表和R*C表利用檢驗進(jìn)行分析。 四格表資料:組間比較用
檢驗或u檢驗,若不能滿(mǎn)足 檢驗:當計數資料呈配對設計時(shí),獲得的四格表為配對四格表,其用到的檢驗公式和校正公式可參考書(shū)籍。 R*C表可以分為雙向無(wú)序,單向有序、雙向有序屬性相同和雙向有序屬性不同四類(lèi),不同類(lèi)的行列表根據其研究目的,其選擇的方法也不一樣。
3.等級資料的統計方法
等級資料(有序變量)是對性質(zhì)和類(lèi)別的等級進(jìn)行分組,再清點(diǎn)每組觀(guān)察單位個(gè)數所得到的資料。在臨床醫學(xué)資料中,常遇到一些定性指標,如臨床療效的評價(jià)、疾病的臨床分期、病癥嚴重程度的臨床分級等,對這些指標常采用分成若干個(gè)等級然后分類(lèi)計數的辦法來(lái)解決它的量化問(wèn)題,這樣的資料統計上稱(chēng)為等級資料。
統計方法是指有關(guān)收集、整理、分析和解釋統計數據,并對其所反映的問(wèn)題作出一定結論的方法。統計方法是一種從微觀(guān)結構上來(lái)研究物質(zhì)的宏觀(guān)性質(zhì)及其規律的獨特的方法。
定義1
所謂統計方法是指用多次測量值采用一定方法計算出的標準不確定度。不同于A(yíng)類(lèi)的其它方法計算者稱(chēng)為B類(lèi)標準不確定度或稱(chēng)為標準不確定度的B類(lèi)計算法(typeBevaluation)。
定義2
在平均離子模型的基礎上,發(fā)展了一個(gè)計算離子組態(tài)概率分布的有效方法,稱(chēng)為統計方法。
源自: 激光等離子體非平衡X射線(xiàn)發(fā)射譜理論研究《物理學(xué)報》1995年 裴文兵,常鐵強,張鈞
定義3
統計方法是指在不知道紋理基元或尚未監測出基元的情況下進(jìn)行紋理分析,主要描述紋理基元或局部模式隨機和空間統計特征,如灰度共生矩陣法、隨機場(chǎng)模型法等。
源自: 利用紋理分析方法提取TM圖像信息《遙感學(xué)報》2004年 姜青香,劉慧平
定義4
分子物理學(xué)就是用統計方法來(lái)研究的。大量個(gè)別的偶然事件存在著(zhù)一定的規律,表現了這些事件的整體的本質(zhì)和必然的聯(lián)系。這種規律是客觀(guān)存在的,統計的方法則是揭示這種規律的必要手段。統計方法只能適合于大量事件,研究的事件越多,得到的統計結果也越準確
1.墓于粗糙集( Rough Set)理論的約簡(jiǎn)方法 粗糙集理論是一種研究不精確、不確定性知識的數學(xué)工具。
目前受到了KDD的廣泛重視,利用粗糙集理論對數據進(jìn)行處理是一種十分有效的精簡(jiǎn)數據維數的方法。我們所處理的數據一般存在信息的含糊性(Vagueness)問(wèn)題。
含糊性有三種:術(shù)語(yǔ)的模糊性,如高矮;數據的不確定性,如噪聲引起的;知識自身的不確定性,如規則的前后件間的依賴(lài)關(guān)系并不是完全可靠的。在KDD中,對不確定數據和噪聲干擾的處理是粗糙集方法的 2.基于概念樹(shù)的數據濃縮方法 在數據庫中,許多屬性都是可以進(jìn)行數據歸類(lèi),各屬性值和概念依據抽象程度不同可以構成一個(gè)層次結構,概念的這種層次結構通常稱(chēng)為概念樹(shù)。
概念樹(shù)一般由領(lǐng)域專(zhuān)家提供,它將各個(gè)層次的概念按一般到特殊的順序排列。 3.信息論思想和普化知識發(fā)現 特征知識和分類(lèi)知識是普化知識的兩種主要形式,其算法基本上可以分為兩類(lèi):數據立方方法和面向屬性歸納方法。
普通的基于面向屬性歸納方法在歸納屬性的選擇上有一定的盲目性,在歸納過(guò)程中,當供選擇的可歸納屬性有多個(gè)時(shí),通常是隨機選取一個(gè)進(jìn)行歸納。事實(shí)上,不同的屬性歸納次序獲得的結果知識可能是不同的,根據信息論最大墑的概念,應該選用一個(gè)信息丟失最小的歸納次序。
4.基于統計分析的屬性選取方法 我們可以采用統計分析中的一些算法來(lái)進(jìn)行特征屬性的選取,比如主成分分析、逐步回歸分析、公共因素模型分析等。這些方法的共同特征是,用少量的特征元組去描述高維的原始知識基。
5.遺傳算法〔GA, Genetic Algo}thrn}) 遺傳算法是一種基于生物進(jìn)化論和分子遺傳學(xué)的全局隨機搜索算法。遺傳算法的基本思想是:將問(wèn)題的可能解按某種形式進(jìn)行編碼,形成染色體。
隨機選取N個(gè)染色體構成初始種群。再根據預定的評價(jià)函數對每個(gè)染色體計算適應值。
選擇適應值高的染色體進(jìn)行復制,通過(guò)遺傳運算(選擇、交叉、變異)來(lái)產(chǎn)生一群新的更適應環(huán)境的染色體,形成新的種群。這樣一代一代不斷繁殖進(jìn)化,最后收斂到一個(gè)最適合環(huán)境的個(gè)體上,從而求得問(wèn)題的最優(yōu)解。
遺傳算法應用的關(guān)鍵是適應度函數的建立和染色體的描述。在實(shí)際應用中,通常將它和神經(jīng)網(wǎng)絡(luò )方法綜合使用。
通過(guò)遺傳算法來(lái)搜尋出更重要的變量組合。
統計數據的具體搜集方法有:
訪(fǎng)問(wèn)調查。訪(fǎng)問(wèn)調查又稱(chēng)派員調查,它是調查者與被調查者通過(guò)面對面地交談從而得到所需資料的調查方法。訪(fǎng)問(wèn)調查的方式有標準式訪(fǎng)問(wèn)和非標準式訪(fǎng)問(wèn)兩種。前者是按一個(gè)事先設計好的訪(fǎng)問(wèn)結構,如固定格式的標準化問(wèn)卷,有順序地依次提問(wèn),并由受訪(fǎng)者做出回答。非標準式訪(fǎng)問(wèn)則事先不做統一的問(wèn)卷或表格,也沒(méi)有統一的提問(wèn)順序,有的只是一個(gè)題目或提綱,由調查人員和受訪(fǎng)者自由交談,以獲得所需的資料。
郵寄調查。它是通過(guò)郵寄或宣傳媒體等方式將調查表或調查問(wèn)卷送至被調查者手中,由被調查者填寫(xiě),然后將調查表寄回或投放到指定收集點(diǎn)的一種調查方法。
電話(huà)調查。電話(huà)調查是調查人員利用電話(huà)同受訪(fǎng)者進(jìn)行語(yǔ)言交流,從而獲得信息的一種調查方式。電話(huà)調查具有時(shí)效快、費用低等特點(diǎn)。
電腦輔助調查。它也稱(chēng)電腦輔助電話(huà)調查系統(computer-assisted telephone interviewing system,cati)。該系統使電話(huà)調查更加便利和快捷,也使調查的質(zhì)量大大提高了。
座談會(huì )。它也稱(chēng)為集體訪(fǎng)談法,它是將一組被調查者集中在調查現場(chǎng),讓他們對調查的主題(如一種產(chǎn)品、一項服務(wù)或其他話(huà)題)發(fā)表意見(jiàn),從而獲取調查資料的方法。
個(gè)別深度訪(fǎng)問(wèn)。它是一種一次只有一名受訪(fǎng)者參加的特殊的定性研究。“深訪(fǎng)”是一種無(wú)結構的個(gè)人訪(fǎng)問(wèn),調查人員運用大量的追問(wèn)技巧,盡可能讓受訪(fǎng)者自由發(fā)揮,表達他的想法和感受。
觀(guān)察法。它是指就調查對象的行動(dòng)和意識,調查人員邊觀(guān)察邊記錄以收集信息的方法。
實(shí)驗法。它是一種特殊的觀(guān)察調查方法,它是在所設定的特殊實(shí)驗場(chǎng)所、特殊狀態(tài)下,對調查對象進(jìn)行實(shí)驗以取得所需資料的一種調查方法。
其中前六種方法屬于詢(xún)問(wèn)調查,后兩種方法屬于觀(guān)察與實(shí)驗的方法。
統計整理的內容通常包括:
1、根據研究任務(wù)的要求,選擇應整理的指標,并根據分析的需要確定具體的分組;
2、對統計資料進(jìn)行匯總、計算;
3、通過(guò)統計表描述匯總的結果。在統計整理中,抓住最基本的、最能說(shuō)明問(wèn)題本質(zhì)特征的統計分組和統計指標對統計資料進(jìn)行加工整理,這是進(jìn)行統計整理必須遵循的原則。
統計整理:
統計整理即“統計資料整理”,就是根據研究的目的和任務(wù)的要求,對統計調查所搜集到的原始資料進(jìn)行科學(xué)的加工整理,使之條理化、系統化,把反映總體單位的大量原始資料,轉化為反映總體的基本統計指標,統計工作的這一過(guò)程,叫統計資料的整理。廣義地說(shuō),統計整理也包括對次級資料進(jìn)行的再加工。
描述統計是指對采集的數據進(jìn)行登記、審核、整理、歸類(lèi),在此基礎上進(jìn)一步計算出各種能反映總體數量特征的綜合指標,并用圖表的形式表示經(jīng)過(guò)歸納分析而得到的各種有用的統計信息。
推斷統計是在對樣本數據進(jìn)行描述的基礎上,利用一定的方法根據樣本數據去估計或檢驗總體的數量特征。推斷統計是現代統計學(xué)的主要內容。
回歸分析:確定兩種或兩種以上變數間相互依賴(lài)的定量關(guān)系的一種統計分析方法 方差分析:用于兩個(gè)及兩個(gè)以上樣本均數差別的顯著(zhù)性檢驗,通過(guò)分析研究中不同來(lái)源的變異對總變異的貢獻大小,從而確定可控因素對研究結果影響力的大小。 相關(guān)分析:是研究現象之間是否存在某種依存關(guān)系,并對具體有依存關(guān)系的現象探討其相關(guān)方向以及相關(guān)程度,是研究隨機變量之間的相關(guān)關(guān)系的一種統計方法。
相關(guān)分析與回歸分析在實(shí)際應用中有密切關(guān)系。然而在回歸分析中,所關(guān)心的是一個(gè)隨機變量Y對另一個(gè)(或一組)隨機變量X的依賴(lài)關(guān)系的函數形式。
而在相關(guān)分析中 ,所討論的變量的地位一樣,分析側重于隨機變量之間的種種相關(guān)特征。 判別分析:是按照一定的判別準則,建立一個(gè)或多個(gè)判別函數,用研究對象的大量資料確定判別函數中的待定系數,并計算判別指標,在氣候分類(lèi)、農業(yè)區劃、土地類(lèi)型劃分中有著(zhù)廣泛的應用。
聚類(lèi)分析:通過(guò)數據建模簡(jiǎn)化數據的一種方法,聚類(lèi)分析在電子商務(wù)中網(wǎng)站建設數據挖掘中也是很重要的一個(gè)方面,通過(guò)分組聚類(lèi)出具有相似瀏覽行為的客戶(hù),并分析客戶(hù)的共同特征,可以更好的幫助電子商務(wù)的用戶(hù)了解自己的客戶(hù),向客戶(hù)提供更合適的服務(wù)。 因子分析:基本目的就是用少數幾個(gè)因子去描述許多指標或因素之間的聯(lián)系,即將相關(guān)比較密切的幾個(gè)變量歸在同一類(lèi)中,每一類(lèi)變量就成為一個(gè)因子(之所以稱(chēng)其為因子,是因為它是不可觀(guān)測的,即不是具體的變量),以較少的幾個(gè)因子反映原資料的大部分信息。
運用這種研究技術(shù),可以方便地找出影響消費者購買(mǎi)、消費以及滿(mǎn)意度的主要因素是哪些,以及它們的影響力(權重)運用這種研究技術(shù),還可以為市場(chǎng)細分做前期分析。 描述統計是通過(guò)圖表或數學(xué)方法,對數據資料進(jìn)行整理、分析,并對數據的分布狀態(tài)、數字特征和隨機變量之間關(guān)系進(jìn)行估計和描述的方法。
描述統計分為集中趨勢分析和離中趨勢分析和相關(guān)分析三大部分。常見(jiàn)統計分析法:t檢驗,F檢驗 方差分析。
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權,根據《信息網(wǎng)絡(luò )傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個(gè)月內通知我們,我們會(huì )及時(shí)刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習?shū)B(niǎo). 頁(yè)面生成時(shí)間:2.705秒