第一章 緒論
一、教學大綱要求
(一)掌握內容
1.幾個基本概念
樣本與總體、頻率與概率、資料類型、隨機變量、誤差。
2.統計工作的步驟
設計、收集資料、整理資料、分析資料。
(二)熟悉內容
醫(yī)學統計學的含義、內容及其醫(yī)學應用。
(三)了解內容
醫(yī)學統計的歷史發(fā)展。
二、教學內容精要
(一) 統計學、醫(yī)學統計學、衛(wèi)生統計學
統計學是研究數據的收集、整理、分析與推斷的科學。
醫(yī)學統計學是用統計學的原理和方法研究生物醫(yī)學現象的一門學科。
衛(wèi)生統計學則是把統計理論、方法應用于居民健康狀況研究、醫(yī)療衛(wèi)生實踐、衛(wèi)生事業(yè)
管理和醫(yī)學科研的一門應用學科。
(二) 統計學中的幾個基本概念
1.隨機變量
隨機變量(random variable)指取值不能事先確定的觀察結果,通常簡稱為變量。隨機
變量有一個共同的特點是不能用一個常數來表示,而且理論上講,每個變量的取值服從特定
的概率分布。
隨機變量可分為兩種類型:離散型變量和連續(xù)型變量。
2.誤差
誤差(error)指實際觀察值與觀察真值之差、樣本指標與總體指標之差。誤差可分為系
統誤差和隨機誤差,兩種誤差的區(qū)別見表1-1。
表 1-1 系統誤差與隨機誤差的區(qū)別
誤差分類 產生原因 對觀察值的影響 處理方法
系統誤差
儀器未校正、測量者感
官的某種偏差、醫(yī)生掌
握療效標準偏高或偏低
等。
使觀察值不是分散在真值
的兩側,而是有方向性、系
統性或周期性地偏離真值。
通過實驗設計的完善和
技術措施的改進來消除
或減少。
隨機誤差 排除系統誤差后,其他
多種不確定因素。
使觀察值不按方向性、系統
性而隨機的變化,誤差變量
可通過統計處理估計隨
機誤差。
2
一般服從正態(tài)分布。
3.資料類型
觀察單位的某項特征的測量結果按其性質可分為三種類型:
(1)計量資料:對每個觀察單位用定量的方法測定某項指標量的大小,所得的資料稱為
計量資料(measurement data)。計量資料亦稱定量資料、測量資料。.其變量值是定量的,表
現為數值大小,一般有度量衡單位。如某一患者的身高(cm)、體重(kg)、紅細胞計數(1012/L)、
脈搏(次/分)、血壓(KPa)等。
(2)計數資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數稱為計數資料
(count data)。計數資料亦稱定性資料或分類資料。其觀察值是定性的,表現為互不相容的
類別或屬性。如調查某地某時的男、女性人口數;治療一批患者,其治療效果為有效、無效
的人數;調查一批少數民族居民的A、B、AB、O 四種血型的人數等。
(3)等級資料:將觀察單位按測量結果的某種屬性的不同程度分組,所得各組的觀察
單位數,稱為等級資料(ordinal data)。等級資料又稱有序變量。如患者的治療結果可分為治
愈、好轉、有效、無效或死亡,各種結果既是分類結果,又有順序和等級差別,但這種差別
卻不能準確測量;一批腎病患者尿蛋白含量的測定結果分為 +、++、+++等。
等級資料與計數資料不同:屬性分組有程度差別,各組按大小順序排列。
等級資料與計量資料不同:每個觀察單位未確切定量,故亦稱為半計量資料。
4.總體與樣本
總體(population)指特定研究對象中所有觀察單位的測量值?煞譃橛邢蘅傮w和無限總
體?傮w中的所有單位都能夠標識者為有限總體,反之為無限總體。
從總體中隨機抽取部分觀察單位,其測量結果的集合稱為樣本(sample)。樣本應具有代
表性。所謂有代表性的樣本,是指用隨機抽樣方法獲得的樣本。
5.概率與頻率
概率(probability)又稱幾率,是度量某一隨機事件A 發(fā)生可能性大小的一個數值,記
為P(A)。0<P(A)<1。
在相同的條件下,獨立重復做n 次試驗,事件A 出現了m 次,則比值m/n 稱為隨機事件
A在n 次試驗中出現的頻率(frequency)。當試驗重復很多次時P(A)= m/n。
(三)統計工作的步驟
1.設計:設計內容包括資料收集、整理和分析全過程總的設想和安排。設計是整個研
究中最關鍵的一環(huán),是今后工作應遵循的依據。
2.收集資料:應采取措施使能取得準確可靠的原始數據。
3.整理資料:簡化數據,使其系統化、條理化,便于進一步分析計算。
4.分析資料:計算有關指標,反映事物的綜合特征,闡明事物的內在聯系和規(guī)律。分
析資料包括統計描述和統計推斷。
(四)醫(yī)學研究中統計方法的應用
醫(yī)學統計方法在醫(yī)學研究中的應用主要有三個方面:
1.以正確的方式收集數據;
2.描述數據的統計特征;
3.統計分析得出正確結論。 |
|