利用申康實際數(shù)據(jù),用計算機模擬專家思維方式的標準化分型,實現(xiàn)所有申康病例的病例分型。
模型應用:先判斷病例為手術(shù)組還是非手術(shù)組,再將病例其他特征值代入所屬組的函數(shù)方程,計算出4個P值,哪個P值最大,就屬于哪種分型。
主要缺點:與專家“四型三線”分型的思維方式不完全符合,對病情是單純型,還是復合型未作考慮,仍有較大分型誤差
算法選擇:進行訓練數(shù)據(jù)分布特征的描述,根據(jù)數(shù)據(jù)分布選擇合適的回歸方法(線性回歸、嶺回歸、主成因回歸、Logistic回歸?)。
模擬檢驗:根據(jù)專家確定的病例分型、篩選的關(guān)鍵變量X,利用訓練數(shù)據(jù)和選定的回歸分析方法,進行12個函數(shù)方程的模擬,并進行檢驗。
回歸診斷:為提高模型擬合優(yōu)度,避免參數(shù)估計偏差,進行回歸診斷,包括檢測異常點(嚴重偏離既定模型,即殘差較其他各點大得多的點)、高扛桿點(遠離設計中心的點)和強影響點(對既定模型有較大影響的點)。
|
|