國家衛(wèi)生數(shù)據字典
(初稿)
衛(wèi)生部統(tǒng)計信息中心
第四軍醫(yī)大學衛(wèi)生信息研究所
目 錄
一、字典結構 1
1.元數(shù)據標識符 3
2.數(shù)據元表示形式 4
3.數(shù)據類型 4
4.數(shù)據格式 5
5.基本屬性描述 5
二、字典內容 7
附錄1 數(shù)據元條目(278個) 8
附錄2 代碼條目(85個) 28
附錄3 大型代碼表(20個) 35
附錄4 詞匯表條目(6個) 60
附錄5 數(shù)據字典應用實例-醫(yī)院出院病人數(shù)據庫結構 63
國家衛(wèi)生數(shù)據字典(National Health Data Dictionary, NHDD)即元數(shù)據資源庫(Meta Data Repository),目的是為使用者提供數(shù)據元和描述數(shù)據元的元數(shù)據,是衛(wèi)生信息系統(tǒng)和數(shù)據庫建設必須遵循的行業(yè)標準。
一、字典結構
根據元數(shù)據注冊國際標準,國家衛(wèi)生數(shù)據字典具有8個基本結構,見圖1,其中最基本的結構是對象類、特性、表示。
對象類:現(xiàn)實世界中的想法、抽象概念或事物的集合,有清楚的邊界和含義,并且特性和其行為遵循同樣的規(guī)則,能夠加以識別和標識;
特性:對象類的所有個體所共有的某種性質;
表示:值域與數(shù)據類型的組合,必要時也包括度量單位或字符集。值域是數(shù)據元允許(或有效)值的集合。比如,表示醫(yī)生年齡的數(shù)據元可以用一個非負整數(shù)集(實際年齡,以年為單位)作為有效值集。另一種選擇是,把有效值用事先指定的類別清單表示,且每個類別都具有一個代碼值,如代碼值1(< 35歲),2(36~ 50歲),3(51~ 65歲),4(>65歲)。前者的值域是一個非窮舉域,后者的值域是一個窮舉域。窮舉域通常用編碼系統(tǒng)表示,如ICD-10編碼。ICD-10編碼是值域的一種分類模式。
數(shù)據集和術語(詞表)是國家衛(wèi)生數(shù)據字典的附屬結構。數(shù)據集有兩個主要作用,一是用來表示需要用多個數(shù)據元表示的事務,如人的姓名的完全表示包括當前姓名、昵稱、化名、筆名、中文名、外文名、曾用名、曾用名使用時間、曾用名停用時間等;二是用來規(guī)范國家最小數(shù)據集,如出生登記最小數(shù)據集、死亡報告最小數(shù)據集等。術語(詞表)是供所有元數(shù)據條目參照、引用的規(guī)范詞匯。
對象類是我們希望用于收集和存儲數(shù)據的事物。對象類的例子有病人、醫(yī)生、護士和化驗單等。特性用來區(qū)別和描述對象的特征,如膚色、姓名、性別、年齡、職業(yè)、收入、住址等。另外,特性有可能需要用多個詞組加以描述,這要視所用的自然語言而定。對象類和特性的組合稱為數(shù)據元概念(DEC)。數(shù)據元概念是能以數(shù)據元形式表示的概念,其描述不包括任何具體的表示。例如 “醫(yī)生年齡”就是對象類+特性構成的一個數(shù)據元概念,對應了兩種表示:實際年齡或年齡組。因此,數(shù)據元的構成可表達為:
|
|