課程目錄

1、 統計的含義 

(1) 統計工作:即統計實踐,是指很據科學的方法從事統計設計、收集、整理、分析研

究和提供各種統計資料和統計咨詢意見的活動的總稱。其成果是統計資料(原始調查資料和加工處理后的系統資料); 

(2) 統計資料:即統計工作過程中所獲得的各種有關數字資料以及與之相關的其他資料

的總稱。通常以統計表、統計圖和統計報告的形式變現,用以反映社會經濟現象的規(guī)模、水平、速度、結構和比例關系等信息的數字和文字資料; 

(3) 統計科學:即統計理論,是指統計工作實踐的理論概括和科學總結。 

2、 統計學 

統計學:是一門搜集、整理、分析數據方法的科學,其目的是探索數據的內在數量規(guī)律性,以達到對客觀事物的科學認識。

3、 統計學的研究對象 

統計學研究的對象是:社會經濟現象總體的數量特征和數量關系。 

其根本特征:在質與量的辯證統一中,研究大量社會經濟現象總體的數量方面,反映社會現象發(fā)展變化的規(guī)律性在具體時間、地點和條件下的數量表現,揭示事物的本質、相互聯系、變動規(guī)律和發(fā)展趨勢。 

4、 統計學研究特點 

數量性、總體性、具體性、社會性 

5、 統計工作的過程及基本職能 

統計工作的過程:統計設計、統計調查、統計整理、統計分析(定性—定量—定性:循環(huán)往復) ;

統計設計:指根據統計研究對象的特點和研究的目的、任務,對統計工作的各個方面和各個環(huán)節(jié)的通盤考慮和安排,是統計認識過程的第一個階段,即定性認識的階段; 

統計調查:指根據統計研究對象和目的要求,依據統計設計的內容、指標和指標體系的要求,有計劃、有目的、有組織的收集原始資料的工作過程,即由定性到定量認識的階段;

統計整理:指根據統計研究的目的,將統計調查得到的原始資料和通過各種方法得到的次級資料進行科學的分類和匯總,使其條理化、系統化的工作過程,即為統計分析準備在一定程度上可以反映總體特征的統計資料; 

統計分析:指在統計整理的基礎上,根據研究的目的和任務,應用各種科學的統計方法,從靜態(tài)和動態(tài)兩個方面對研究對象的數量方面進行計算、分析研究,認識和揭示所研究對象的本質和規(guī)律性,做出科學的結論,進而提出建議和可預測性的意見的工作過程,即從定量到定性深入認識的階段。

定量資料與定性資料的區(qū)分

定量資料:從“量”的角度出發(fā),進行數量的分析、比較,最終結果也用“數量”表示,例如:血壓、年齡。

定性資料:從“是什么”,“屬于什么”的角度出發(fā),對事物的性質進行分析,例如:性別、血型。

定量資料可以轉化為定性資料:例如設定年齡界限X,≥X為A組,<X為B組,那么A組和B組對應的樣本量則為定性資料。

圖一、成組設計定量資料差異性分析

圖解分析:“Y”,yes,代表滿足;“N”,no,代表不滿足。對于兩組定量資料進行差異性分析,同時滿足正態(tài)性和方差齊性的情況下,方可使用t檢驗。滿足正態(tài)性,不滿足方差齊性,使用t^'檢驗或者Wilcoxon秩和檢驗。既不滿足正態(tài)性,又不滿足方差齊性,則只能使用Wilcoxon秩和檢驗。

圖二、單因素多組設計定量資料差異性分析

圖解分析:“Y”,yes,代表滿足;“N”,no,代表不滿足。對于多組定量資料進行差異性分析,同時滿足正態(tài)性和方差齊性的情況下,方可使用方差分析。滿足正態(tài)性,不滿足方差齊性,使用Welch方差分析或者Kruskal Wallis秩和檢驗。既不滿足正態(tài)性,又不滿足方差齊性,則只能使用Kruskal Wallis秩和檢驗。

實際運用

一些文獻對統計描述這一塊寫得過于簡單,審稿人往往容易從其中抓住論文的辮子,下面是一些例子。

正確描述:符合正態(tài)分布的計量資料以均數±標準差表示。配對設計一般考察每對數據的差值所代表的總體值與0之間的差別是否具有統計學差異。若觀測的定量指標滿足正態(tài)分布,則可以使用t檢驗;否則,使用秩和檢驗。

正確描述:符合正態(tài)分布的計量資料以均數±標準差表示,符合方差齊性則采用t檢驗;不符合正態(tài)分布的計量資料以中位數M(P25,P75)表示,采用秩和檢驗。

多組設計兩兩比較這個知識點最容易錯

實例:論文將實驗設計為4組,4組小鼠分別進行不同的干預措施,而后記錄和觀測指標,并評估比較這4種干預措施的效果,具體統計數據繪制表格如下。

S組

HSR組

SP組

ATR組

觀測指標1

4.1±0.8

6.5±0.6a

8.8±0.9b

10.0±1.1c

觀測指標2


注:與S組相比,aP<0.05  與HSR組相比,bP<0.05  與SP組相比,cP<0.05。

想一想,上述比較應該用什么統計方法?

A.    t檢驗

B.    秩和檢驗

C.    方差分析

D.    上述都不對

簡潔分析:

論文設計分為4組,a,b,c的P值對應組間兩兩比較。對于這類設計的組間兩兩比較,統計方法首先對這4組整體進行方差分析,先要說明四組不完全相同,也即4組之間的方差分析的P值小于0.05。在上述四組不完全相同的前提之下,再進行組間兩兩的比較,而且這種兩兩的比較的p值不是以0.05為準,而是以0.05除以比較的次數(這里總共比較的次數為C2/4,也就是6次)。這里有兩兩比較的專門方法,包括LSD法,Bonferroni法,Tukey法以及SNK法等。LSD法:相對簡單,容易得到有統計學差異的結果;Bonferroni法:對實驗誤差率控制得嚴格,相對保守,不容易得到有統計學差異的結果;Tukey法:此法要求高,對結論持謹慎態(tài)度的人傾向于使用它;SNK法:對實驗誤差率控制也較為嚴格。

深度剖析:

不能使用t檢驗代替多組設計(K≥3)組間兩兩比較的原因主要有:

1、每進行一次比較,犯錯誤的概率(實驗誤差率)的概率依然是以前所確定的顯著性水平,通常為0.05。這里設計了4個組,組間的兩兩比較總次數為C=6次,那么這6次比較均正確的概率為(1-0.05)6=0.735,犯錯誤的概率為1-0.735=0.265,遠大于0.05了。

2、割裂了整體設計,數據的利用低,檢驗統計量的自由度小導致結論可信度下降。

郵箱
huangbenjincv@163.com

茂名市| 宜兴市| 广宁县| 新竹市| 富锦市| 从化市| 靖州| 九江市| 合水县| 旬邑县| 萍乡市| 临澧县| 长宁县| 若尔盖县| 奎屯市| 东港市| 九江县| 丁青县| 遂溪县| 偏关县| 江源县| 饶平县| 新宁县| 周口市| 儋州市| 景泰县| 屯留县| 溧阳市| 鸡泽县| 达孜县| 武穴市| 米泉市| 调兵山市| 正蓝旗| 全州县| 南川市| 团风县| 台安县| 宁武县| 晋城| 康乐县|