結(jié)構(gòu)化數(shù)據(jù)輸入的新研究
*A.M. van Ginneken, *M. de Wilde
**包含飛(摘譯)
*荷蘭,鹿特丹, Erasmus大學(xué),醫(yī)學(xué)信息學(xué)教研室
**上海中醫(yī)藥大學(xué),中醫(yī)學(xué)信息化-標(biāo)準(zhǔn)化研究室
摘要 本文描述了結(jié)構(gòu)化數(shù)據(jù)輸入(SDE)的哲學(xué)思考,知識模型和知識編輯器、概念庫,和SDE的功能、模板、有效性檢查等有關(guān)技術(shù)及其界面,最后討論用戶個(gè)性化和介紹了當(dāng)前的發(fā)展現(xiàn)狀。
關(guān)鍵詞 電子病歷 醫(yī)學(xué)信息學(xué) 知識工程 標(biāo)準(zhǔn)化
(一) 結(jié)構(gòu)化輸入:一個(gè)悖論
傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)輸入(SDE)方法是紙張表格式的。人們?yōu)檫@種傳統(tǒng)方式開發(fā)了電子版,并提供輸入檢查,檢查數(shù)字?jǐn)?shù)據(jù)的有效性和提高數(shù)據(jù)的完整性等先進(jìn)功能。但這種固定排版表格在較小的學(xué)科領(lǐng)域,數(shù)據(jù)需求比較固定和簡單的部門是有效的。對較大的學(xué)科,及信息需求多變難以預(yù)測的部門,固定格式就成為累贅。內(nèi)科和兒科是典型的那種學(xué)科。需要幾十個(gè)甚至幾百個(gè)表格,有的病人還需不同的一組次級表格。而且一般還缺乏通覽的功能,用戶只能看到在顯的表格。除了用戶方面的不便以外,維護(hù)和適應(yīng)用戶問題也非常困難。由于格式刻板,固定不變,覆蓋面小,故一般用于數(shù)據(jù)類型較少,按常規(guī)收集數(shù)據(jù)的部門或研究項(xiàng)目中。需附加的數(shù)據(jù)則仍用自由文本輸入。
一些程序采取較為動(dòng)態(tài)的方式并提供有限的控制詞匯庫(controlled vocabularies),以菜單或一組模板(template)的形式提供預(yù)定義的描述性選項(xiàng)(predefined descriptive options)。所謂動(dòng)態(tài)是指所提供的描述體征和癥狀的選項(xiàng)對應(yīng)于當(dāng)前正在處理的問題。如 PEN&PAD, IMR-E, Ivory, Pure MD, Purkinje, 和A.M. van Ginneken等開發(fā)的內(nèi)分泌學(xué)病歷系統(tǒng)的原型。這些系統(tǒng)所覆蓋的領(lǐng)域范圍和內(nèi)容的詳盡程度不同:一些系統(tǒng)用概念-屬性-值(concept–attribute–value)模型,而補(bǔ)充的細(xì)節(jié)(additional detail)以自由文本的方式輸入。IMR-E提供的模板的基礎(chǔ)是一些經(jīng)選擇的癥狀。Purkinje則用樹狀層次結(jié)構(gòu),可根據(jù)要求的詳盡程度逐級擴(kuò)展。固定格式和動(dòng)態(tài)程序的優(yōu)缺點(diǎn)可歸結(jié)如下,前者方便快速數(shù)據(jù)輸入,但過分受限于內(nèi)容范圍;后者可變性較大,信息量較大的數(shù)據(jù)所需瀏覽量(nevigation)太大,用戶的”選擇-決定”的工作量過大;
總之,悖論在于醫(yī)生希望在一個(gè)表中能輸入任何數(shù)據(jù)。所以問題的實(shí)質(zhì)是有效性必以犧牲可變性為代價(jià),而可變性將會犧牲有效性,二者能否統(tǒng)一?
(二) 哲學(xué)思考
我們的哲學(xué)是電子病歷(CPR)應(yīng)有公共基本數(shù)據(jù)結(jié)構(gòu)但同時(shí)其覆蓋內(nèi)容可根據(jù)需要“量體裁衣”。公共結(jié)構(gòu)應(yīng)與專業(yè)無關(guān),即描述數(shù)據(jù)的屬性對所有專業(yè)是統(tǒng)一的。如實(shí)驗(yàn)室報(bào)告應(yīng)包括檢驗(yàn)類型、結(jié)果值、單位、正常值范圍。例如對于血糖濃度測定的報(bào)告,無論是外科醫(yī)生還是內(nèi)科醫(yī)生申請均無差別。又例如,藥物處方均有藥名、劑量和每天用藥次數(shù)等項(xiàng)目。與臨床專業(yè)無關(guān)的數(shù)據(jù)用直接模型:屏幕上的字段與表中的屬性一一對應(yīng)的直接關(guān)系。這種直接模型比較簡單但也較呆板:內(nèi)容的任何改變都要求數(shù)據(jù)庫和軟件作相應(yīng)的修改。因此,數(shù)據(jù)變化很少的專業(yè)可首選這種直接模型。
有些數(shù)據(jù)是專業(yè)依賴性的,也即不同的專科應(yīng)用不同的數(shù)據(jù)項(xiàng),如心臟科的病歷與矯形外科的病歷大相徑庭。當(dāng)前癥狀記錄,物理檢查,放射科報(bào)告,內(nèi)分泌科報(bào)告,病理報(bào)告等也是如此。但為了內(nèi)容的可適性(flexibility),基本結(jié)構(gòu)應(yīng)是非內(nèi)容依賴性的。我們選擇樹狀結(jié)構(gòu),不僅能表達(dá)病人數(shù)據(jù),而且能表達(dá)任何描述性信息。每個(gè)結(jié)點(diǎn)表示一個(gè)概念,其子樹則表示其描述。然而,樹狀數(shù)據(jù)模型并不反映‘父子系列’的抽象內(nèi)容。每個(gè)結(jié)點(diǎn)所指的概念必需“告以”解釋這種內(nèi)容。因?yàn)楦郊恿诉@一解釋步驟,所以稱其為間接模型。間接模型的可適性的關(guān)鍵是內(nèi)容的可擴(kuò)展性和不斷發(fā)展性且無須改變數(shù)據(jù)庫和軟件。
圖 1. 間接模型.知識庫和病人數(shù)據(jù)庫的內(nèi)容更新無須更新程序
ORCA(Open Record for CAre)是兼有專業(yè)獨(dú)立性和非獨(dú)立性數(shù)據(jù)并以直接和非直接數(shù)據(jù)模型實(shí)現(xiàn)的通用CPR的原型。該程序的采集結(jié)構(gòu)化數(shù)據(jù)的非直接部分的用戶界面是動(dòng)態(tài)的,但直覺性和高效性欠缺。高效性和可適應(yīng)性的結(jié)合是一個(gè)嚴(yán)峻的挑戰(zhàn),因此我們把研究重點(diǎn)放在專業(yè)依賴性數(shù)據(jù)的SDE上。這一SDE是全新的設(shè)計(jì)模塊,在數(shù)據(jù)錄入時(shí)利用知識庫指導(dǎo)。以下介紹此SDE的知識模型,知識編輯器及用戶界面。
|
|