數字化醫院中病案數據質量的分析與監控
趙霞①② 彭宏① 李小華② 劉琛璽② 彭傳薇②
①
華南理工大學計算機科學與工程學院,510641,廣州市天河區五山路381號
② 廣州軍區廣州總醫院信息中心,510010,廣州市流花路111號
摘 要 保證醫療數據的質量,是醫院信息系統建設的重要環節。本文探討了一種醫療病案數據質量的分析監控方法,在分析通常的醫療數據質量問題類型的基礎上,提出建立元數據數據庫和業務規則來實施數據質量分析的方法,建立不同主題的數據質量分析模型,使用ETL技術對不同類型的數據質量問題進行分析和展現,不僅提高了數據分析處理的能力,而且為防止數據質量問題的產生提供了依據。通過在本院的具體使用得到驗證,為醫院信息系統建設中的數據質量處理提供了良好可行的解決方案。
關鍵詞 數據質量 醫療數據 元數據 業務規則 ETL
1
引言
當前,醫療數據是各大醫療機構走向信息化的必要基礎,然而隨著各醫院應用系統數據量的急劇擴大,新應用的不斷出現以及應用之間的相互整合,數據質量問題變得日益突出,這些問題主要表現在數據不正確、數據不完整、數據不一致等方面。質量低劣的數據已經成為影響醫院管理者進行正確決策的重要因素,所以數據質量管理必將成為醫療行業信息化進程中一個必不可少的環節。
病案首頁是病案主要內容的精華摘要,濃縮了整份住院病案中最重要的內容,是統計指標計算的數據源泉,是醫療、教學、科研等醫院管理活動的基礎,是病案質量檢查及醫療質量評估的依據。信息技術的發展將使醫療病案首頁的填寫向持續、動態、實時的方向發展,在信息化的醫療數據采集過程中,正確分析與監控病案首頁數據的數據質量對于醫療數據質量控制也具有重要影響。本研究首先對病案首頁的110余項數據進行了分析監控,為病案數據質量的進一步分析奠定了堅實的基礎。
2
數據質量的定義及分類
數據質量主要指一個信息系統在多大程度上實現了模式(schema) 和數據實例(instance)的一致性,及模式和數據實例在多大程度上實現了正確性(correctness)、一致性(consistency)、完整性(completeness)和最小性
(minimality) [1] 。
根據處理的是單數據源還是多數據源以及問題出在模式層還是實例層,數據質量問題分為4類:單數據源模式層問題、單數據源實例層問題、多數據源模式層問題和多數據源實例層問題。圖1表示了這種分類,并且分別列出了每一類中典型的數據質量問題[2]。
3
病案數據質量問題產生的原因[3]
醫療數據質量低下不是偶然造成的,在數據質量的背后,有許多因素在不斷地影響醫療數據的產生和質量。
3.1數據質量問題長期得不到足夠的重視,數據監管制度不健全 有些醫院長久以來一直沒有認識到數據質量的重要性,只是將醫療數據當做醫療過程的附屬產物看待,造成了數據混亂不準確和缺失等問題。
3.2 缺少良好的環節監控工具和措施 目前,大部分的數據質量監控工作和核查都保留在終末控制的層次上,很少在數據發生的各個源環節進行控制。這樣就不可避免地會遺漏一部分潛在的或不明顯的臟數據而影響最終的數據質量。
3.3醫療數據缺乏統一標準,信息孤島現象嚴重 目前,我國正在逐步完善各種醫療數據標準。各個醫院忙于建立自己的數據信息管理系統,經常采用不同供應商的產品,醫療數據的標準混亂,每個醫院各成體系,甚至同一醫院中有多個數據體系,造成大量數據信息孤島現象,使得醫療數據信息共享難以實現。雖然局部數據質量可能不低,但全局的數據情況卻是一片混亂。
3.4操作人員違規操作 各終端錄入人員違規操作是數據質量 |
|