(一)通過(guò)提供信息的單位背景來(lái)辨別
一般來(lái)說(shuō),擁有強大專(zhuān)業(yè)技術(shù)力量的單位提供的該專(zhuān)業(yè)方面的信息和數據比較可靠。
(二)通過(guò)分析信息產(chǎn)生的過(guò)程來(lái)進(jìn)行判別
(1)一般地,普查的數據比抽查的數據更全面準確。
(2)長(cháng)期監測的數據比短期監測的數據準確,監測面大的數據比監測面小的數據代表性大,勘探密度大的數據比勘探密度小的數據準確性大,科學(xué)實(shí)驗和利用仿真模擬計算的數據比一般推理的數據準確。
(三)用不同方法、不同渠道取得的數據進(jìn)行驗證
如衛星圖片、航測數據用實(shí)測數據進(jìn)行驗證;市場(chǎng)需求容量用行業(yè)協(xié)會(huì )、主要企業(yè)、國家統計局的數據進(jìn)行對比。
(四)對比計算不同時(shí)期、不同來(lái)源的數據差異,并進(jìn)行適當修正
同樣一個(gè)對象的數據,在不同國家、不同歷史時(shí)期,由于包含的范圍不同,計算的標準和口徑可能有所不同,造成數據之間有很大的差異。 如要對比分析這些數據,必須弄清統計口徑,否則就會(huì )出錯。
(五)通過(guò)專(zhuān)家集體討論辨別信息的準確性和可靠性
對于不同渠道得到的信息,可能存在因角度不同、口徑不一、方法各異等而不一致,甚至相互矛盾。這時(shí),可以采取專(zhuān)家集體討論,弄清差異和矛盾的原因,并去偽存真,達成共識。
數據分析有極廣泛的應用范圍,這是一個(gè)掃盲貼。
典型的數據分析可能包含以下三個(gè)步:[list]1、探索性數據分析,當數據剛取得時(shí),可能雜亂無(wú)章,看不出規律,通過(guò)作圖、造表、用各種形式的方程擬合,計算某些特征量等手段探索規律性的可能形式,即往什么方向和用何種方式去尋找和揭示隱含在數據中的規律性。2、模型選定分析,在探索性分析的基礎上提出一類(lèi)或幾類(lèi)可能的模型,然后通過(guò)進(jìn)一步的分析從中挑選一定的模型。
3、推斷分析,通常使用數理統計方法對所定模型或估計的可靠程度和精確程度作出推斷。數據分析過(guò)程實(shí)施數據分析過(guò)程的主要活動(dòng)由識別信息需求、收集數據、分析數據、評價(jià)并改進(jìn)數據分析的有效性組成。
一、識別信息需求識別信息需求是確保數據分析過(guò)程有效性的首要條件,可以為收集數據、分析數據提供清晰的目標。識別信息需求是管理者的職責管理者應根據決策和過(guò)程控制的需求,提出對信息的需求。
就過(guò)程控制而言,管理者應識別需求要利用那些信息支持評審過(guò)程輸入、過(guò)程輸出、資源配置的合理性、過(guò)程活動(dòng)的優(yōu)化方案和過(guò)程異常變異的發(fā)現。二、收集數據有目的的收集數據,是確保數據分析過(guò)程有效的基礎。
組織需要對收集數據的內容、渠道、方法進(jìn)行策劃。策劃時(shí)應考慮:[list]①將識別的需求轉化為具體的要求,如評價(jià)供方時(shí),需要收集的數據可能包括其過(guò)程能力、測量系統不確定度等相關(guān)數據;②明確由誰(shuí)在何時(shí)何處,通過(guò)何種渠道和方法收集數據;③記錄表應便于使用;④采取有效措施,防止數據丟失和虛假數據對系統的干擾。
三、分析數據分析數據是將收集的數據通過(guò)加工、整理和分析、使其轉化為信息,通常用方法有:[list]老七種工具,即排列圖、因果圖、分層法、調查表、散步圖、直方圖、控制圖;新七種工具,即關(guān)聯(lián)圖、系統圖、矩陣圖、KJ法、計劃評審技術(shù)、PDPC法、矩陣數據圖;四、數據分析過(guò)程的改進(jìn)數據分析是質(zhì)量管理體系的基礎。組織的管理者應在適當時(shí),通過(guò)對以下問(wèn)題的分析,評估其有效性:[list]①提供決策的信息是否充分、可信,是否存在因信息不足、失準、滯后而導致決策失誤的問(wèn)題;②信息對持續改進(jìn)質(zhì)量管理體系、過(guò)程、產(chǎn)品所發(fā)揮的作用是否與期望值一致,是否在產(chǎn)品實(shí)現過(guò)程中有效運用數據分析;③收集數據的目的是否明確,收集的數據是否真實(shí)和充分,信息渠道是否暢通;④數據分析方法是否合理,是否將風(fēng)險控制在可接受的范圍;⑤數據分析所需資源是否得到保障。
一、數據分析思維
首先學(xué)會(huì )做基礎數據分析并不難,掌握一些必要的知識就能很快上手,學(xué)習數據分析的路徑如下共三部曲:數據類(lèi)型的識別、研究方法的選擇、結果分析。
(1) 數據類(lèi)型的識別
數據類(lèi)型是一切研究的基石,也是數據研究思維的最基本且最關(guān)鍵的思維。確認數據的真實(shí)準確性后,即完成數據清理后,可對數據類(lèi)型進(jìn)行區分,一切數據均可分為兩種類(lèi)型,包括定性數據和定量數據。
· 定量:數字有比較意義,比如數字越大代表滿(mǎn)意度越高,量表為典型定量數據
· 定類(lèi):數字無(wú)比較意義,比如性別,1代表男,2代表女
(2)研究方法的選擇
數據類(lèi)型確認后,此時(shí)即可理解數據分析方法的選擇。像SPSSAU在設計時(shí),區分數據類(lèi)型的同時(shí),還區分X和Y。比如性別和是否吸煙的關(guān)系,X是性別,Y為是否吸煙。X和Y均為定類(lèi)數據。此時(shí)則應該選擇“交叉卡方”分析。
第一步即選對研究方法,即數據類(lèi)型的識別。
第二步即結合研究目的進(jìn)行分析,常見(jiàn)的研究目的包括:數據基本描述、影響關(guān)系研究、差異關(guān)系研究及其它關(guān)系。
請點(diǎn)擊輸入圖片描述
(3)分析結果
分析基礎比較薄弱,可使用SPSSAU進(jìn)行分析,系統會(huì )自動(dòng)生成指標解讀報告。
請點(diǎn)擊輸入圖片描述
二、分析思路模板
研究框架是分析的核心,一般可分為非量表和量表問(wèn)卷,然后再對照著(zhù)框架進(jìn)行分析即可。
量表類(lèi)問(wèn)卷最大的特點(diǎn)是:非常多的量表題,而且量表題對應著(zhù)‘變量’或者‘維度’。便于研究‘變量’間的關(guān)系情況。以及可以使用信度、效度、因子分析等方法。
非量表題其最大的特點(diǎn)為大部分為單選題、多選題或者排序填空題等,但很少 有出現量表題(是量表題是指類(lèi)似答項為“非常不同意”,“比較不同意”,“中立”,“比較同意”和 “非常同意”之類(lèi)的問(wèn)題)更多是使用基本頻數分析和交叉分析等,同時(shí)使用圖形和表格進(jìn)行多樣化展示。
利用數據挖掘進(jìn)行數據分析常用的方法主要有分類(lèi)、回歸分析、聚類(lèi)、關(guān)聯(lián)規則、特征、變化和偏差分析、Web頁(yè)挖掘等, 它們分別從不同的角度對數據進(jìn)行挖掘。
①分類(lèi)。分類(lèi)是找出數據庫中一組數據對象的共同特點(diǎn)并按照分類(lèi)模式將其劃分為不同的類(lèi),其目的是通過(guò)分類(lèi)模型,將數據庫中的數據項映射到某個(gè)給定的類(lèi)別。它可以應用到客戶(hù)的分類(lèi)、客戶(hù)的屬性和特征分析、客戶(hù)滿(mǎn)意度分析、客戶(hù)的購買(mǎi)趨勢預測等,如一個(gè)汽車(chē)零售商將客戶(hù)按照對汽車(chē)的喜好劃分成不同的類(lèi),這樣營(yíng)銷(xiāo)人員就可以將新型汽車(chē)的廣告手冊直接郵寄到有這種喜好的客戶(hù)手中,從而大大增加了商業(yè)機會(huì )。
②回歸分析。回歸分析方法反映的是事務(wù)數據庫中屬性值在時(shí)間上的特征,產(chǎn)生一個(gè)將數據項映射到一個(gè)實(shí)值預測變量的函數,發(fā)現變量或屬性間的依賴(lài)關(guān)系,其主要研究問(wèn)題包括數據序列的趨勢特征、數據序列的預測以及數據間的相關(guān)關(guān)系等。它可以應用到市場(chǎng)營(yíng)銷(xiāo)的各個(gè)方面,如客戶(hù)尋求、保持和預防客戶(hù)流失活動(dòng)、產(chǎn)品生命周期分析、銷(xiāo)售趨勢預測及有針對性的促銷(xiāo)活動(dòng)等。
③聚類(lèi)。聚類(lèi)分析是把一組數據按照相似性和差異性分為幾個(gè)類(lèi)別,其目的是使得屬于同一類(lèi)別的數據間的相似性盡可能大,不同類(lèi)別中的數據間的相似性盡可能小。它可以應用到客戶(hù)群體的分類(lèi)、客戶(hù)背景分析、客戶(hù)購買(mǎi)趨勢預測、市場(chǎng)的細分等。
④關(guān)聯(lián)規則。關(guān)聯(lián)規則是描述數據庫中數據項之間所存在的關(guān)系的規則,即根據一個(gè)事務(wù)中某些項的出現可導出另一些項在同一事務(wù)中也出現,即隱藏在數據間的關(guān)聯(lián)或相互關(guān)系。在客戶(hù)關(guān)系管理中,通過(guò)對企業(yè)的客戶(hù)數據庫里的大量數據進(jìn)行挖掘,可以從大量的記錄中發(fā)現有趣的關(guān)聯(lián)關(guān)系,找出影響市場(chǎng)營(yíng)銷(xiāo)效果的關(guān)鍵因素,為產(chǎn)品定位、定價(jià)與定制客戶(hù)群,客戶(hù)尋求、細分與保持,市場(chǎng)營(yíng)銷(xiāo)與推銷(xiāo),營(yíng)銷(xiāo)風(fēng)險評估和詐騙預測等決策支持提供參考依據。
⑤特征。特征分析是從數據庫中的一組數據中提取出關(guān)于這些數據的特征式,這些特征式表達了該數據集的總體特征。如營(yíng)銷(xiāo)人員通過(guò)對客戶(hù)流失因素的特征提取,可以得到導致客戶(hù)流失的一系列原因和主要特征,利用這些特征可以有效地預防客戶(hù)的流失。
⑥變化和偏差分析。偏差包括很大一類(lèi)潛在有趣的知識,如分類(lèi)中的反常實(shí)例,模式的例外,觀(guān)察結果對期望的偏差等,其目的是尋找觀(guān)察結果與參照量之間有意義的差別。在企業(yè)危機管理及其預警中,管理者更感興趣的是那些意外規則。意外規則的挖掘可以應用到各種異常信息的發(fā)現、分析、識別、評價(jià)和預警等方面。
⑦Web頁(yè)挖掘。隨著(zhù)Internet的迅速發(fā)展及Web 的全球普及, 使得Web上的信息量無(wú)比豐富,通過(guò)對Web的挖掘,可以利用Web 的海量數據進(jìn)行分析,收集政治、經(jīng)濟、政策、科技、金融、各種市場(chǎng)、競爭對手、供求信息、客戶(hù)等有關(guān)的信息,集中精力分析和處理那些對企業(yè)有重大或潛在重大影響的外部環(huán)境信息和內部經(jīng)營(yíng)信息,并根據分析結果找出企業(yè)管理過(guò)程中出現的各種問(wèn)題和可能引起危機的先兆,對這些信息進(jìn)行分析和處理,以便識別、分析、評價(jià)和管理危機。
總的分兩種:
1 列表法
將實(shí)驗數據按一定規律用列表方式表達出來(lái)是記錄和處理實(shí)驗數據最常用的方法。表格的設計要求對應關(guān)系清楚、簡(jiǎn)單明了、有利于發(fā)現相關(guān)量之間的物理關(guān)系;此外還要求在標題欄中注明物理量名稱(chēng)、符號、數量級和單位等;根據需要還可以列出除原始數據以外的計算欄目和統計欄目等。最后還要求寫(xiě)明表格名稱(chēng)、主要測量?jì)x器的型號、量程和準確度等級、有關(guān)環(huán)境條件參數如溫度、濕度等。
2 作圖法
作圖法可以最醒目地表達物理量間的變化關(guān)系。從圖線(xiàn)上還可以簡(jiǎn)便求出實(shí)驗需要的某些結果(如直線(xiàn)的斜率和截距值等),讀出沒(méi)有進(jìn)行觀(guān)測的對應點(diǎn)(內插法),或在一定條件下從圖線(xiàn)的延伸部分讀到測量范圍以外的對應點(diǎn)(外推法)。此外,還可以把某些復雜的函數關(guān)系,通過(guò)一定的變換用直線(xiàn)圖表示出來(lái)。例如半導體熱敏電阻的電阻與溫度關(guān)系為,取對數后得到,若用半對數坐標紙,以lgR為縱軸,以1/T為橫軸畫(huà)圖,則為一條直線(xiàn)。
極差
說(shuō)明數據的波動(dòng)幅度。
平均差 符合條件
定義:在一組數據x1,x2,…,xn中各數據與它們的平均數的差的絕對值的平均數即這組數據的“平均差”。平均差越大,數據離散程度越高。
方差
定義:在一組數據x1,x2,…,xn中,各數據與它們的平均數差的平方,它們的平均數,即為這組數據的方差。
一組數據方差的算數平方根即為這組數據的標準差。
方差和標準差越小 說(shuō)明數據離散程度越低
據我所知,應該沒(méi)有了
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權,根據《信息網(wǎng)絡(luò )傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個(gè)月內通知我們,我們會(huì )及時(shí)刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習?shū)B(niǎo). 頁(yè)面生成時(shí)間:3.918秒