新聞中心
PRESS CENTENR2013年(nian),北大(da)人(ren)民醫(yi)(yi)院CDR上有(you)(you)281萬患者(zhe)的(de)(de)6000多(duo)萬醫(yi)(yi)囑和1.9億條醫(yi)(yi)療文(wen)書,另有(you)(you)30多(duo)個T的(de)(de)影像數據(ju),這些都(dou)是結(jie)構化好(hao)的(de)(de)有(you)(you)質量的(de)(de)數據(ju),能(neng)否稱為?近日,一位以前在(zai)方正任職的(de)(de)業內(nei)專家認為,醫(yi)(yi)院內(nei)目前的(de)(de)數據(ju)并(bing)不能(neng)稱之大(da)數據(ju)。
那么(me)到底醫(yi)院的(de)數(shu)據(ju)能(neng)否(fou)稱為大(da)(da)數(shu)據(ju)?還是(shi)人們(men)習慣性(xing)的(de)使(shi)用(yong)了“大(da)(da)數(shu)據(ju)”這個詞,于是(shi)問題的(de)答案就(jiu)不同(tong)了。下(xia)面是(shi)大(da)(da)數(shu)據(ju)以及(ji)醫(yi)院內大(da)(da)數(shu)據(ju)的(de)一些思考(kao)!
首(shou)先,我不同意(yi)北京人(ren)民(min)醫(yi)院xx關(guan)于“醫(yi)院內(nei)沒(mei)有(you)大(da)數據”的(de)(de)論斷(duan)(雖然我不確(que)定這(zhe)(zhe)是劉帆(fan)的(de)(de)觀點(dian)),為(wei)什(shen)么沒(mei)有(you)?小到一只螞蟻、一個(ge)(ge)病毒的(de)(de)信(xin)息(xi),都可(ke)以是一個(ge)(ge)大(da)數據(例如:螞蟻的(de)(de)DNA信(xin)息(xi)、群體社會(hui)信(xin)息(xi),個(ge)(ge)體識別信(xin)息(xi)等。病毒感染信(xin)息(xi)、傳播信(xin)息(xi)、變異(yi)信(xin)息(xi)等),而每天人(ren)山人(ren)海擁(yong)擠得水(shui)泄不通的(de)(de)人(ren)民(min)醫(yi)院卻沒(mei)有(you)大(da)數據,這(zhe)(zhe)顯然不對。所以,這(zhe)(zhe)句話可(ke)以也(ye)許理解為(wei)“人(ren)民(min)醫(yi)院內(nei)目(mu)前(qian)沒(mei)有(you)大(da)數據應用”或者(zhe)“人(ren)民(min)醫(yi)院目(mu)前(qian)收集的(de)(de)信(xin)息(xi)不能(neng)稱為(wei)大(da)數據”。文(wen)字上的(de)(de)歧義反(fan)映出的(de)(de)得是行(xing)業本(ben)身對大(da)數據理解的(de)(de)混(hun)亂。
其次,“北大(da)人(ren)(ren)民(min)醫(yi)院CDR上的(de)(de)數(shu)(shu)據(ju)稱(cheng)不(bu)上大(da)數(shu)(shu)據(ju)”!導致(zhi)這個結(jie)(jie)論的(de)(de)依據(ju)也許是來自(zi)“這些都是結(jie)(jie)構化好的(de)(de)有(you)質(zhi)量的(de)(de)數(shu)(shu)據(ju)”這個判(pan)斷,言外之意就是說,大(da)數(shu)(shu)據(ju)代表的(de)(de)是結(jie)(jie)構混(hun)亂、質(zhi)量低下的(de)(de)數(shu)(shu)據(ju),人(ren)(ren)民(min)醫(yi)院CDR中的(de)(de)有(you)質(zhi)量的(de)(de)數(shu)(shu)據(ju)不(bu)是大(da)數(shu)(shu)據(ju)。
那么,什么才是(shi)(shi)結(jie)構化(hua)好(hao)的(de)(de)有(you)質量(liang)的(de)(de)數(shu)(shu)(shu)據(ju)(ju)(ju)呢?比如(ru)我(wo)做(zuo)一個LIS系(xi)統,我(wo)在(zai)內部顯然(ran)要考慮(lv)我(wo)存儲(chu)的(de)(de)數(shu)(shu)(shu)據(ju)(ju)(ju)結(jie)構清晰有(you)效,同時也會考慮(lv)數(shu)(shu)(shu)據(ju)(ju)(ju)存儲(chu)的(de)(de)質量(liang)(長期(qi)存儲(chu)和再利用(yong)等(deng))。如(ru)果我(wo)這個LIS接入到人(ren)民醫(yi)院CDR中(zhong),LIS中(zhong)的(de)(de)數(shu)(shu)(shu)和存儲(chu)在(zai)CDR中(zhong)的(de)(de)LIS數(shu)(shu)(shu)據(ju)(ju)(ju)是(shi)(shi)相同的(de)(de)結(jie)構嗎(ma)?是(shi)(shi)相同的(de)(de)質量(liang)嗎(ma)?由于(yu)結(jie)構變化(hua)等(deng)因(yin)素必(bi)(bi)然(ran)導(dao)致CDR中(zhong)數(shu)(shu)(shu)據(ju)(ju)(ju)質量(liang)(至少在(zai)完(wan)整性上(shang)(shang))低于(yu)原(yuan)始數(shu)(shu)(shu)據(ju)(ju)(ju)。因(yin)此(ci),CDR數(shu)(shu)(shu)據(ju)(ju)(ju)相對于(yu)原(yuan)始數(shu)(shu)(shu)據(ju)(ju)(ju)有(you)質量(liang)只能(neng)體現(xian)在(zai)它與(yu)其他數(shu)(shu)(shu)據(ju)(ju)(ju)的(de)(de)關(guan)系(xi)上(shang)(shang),例如(ru)LIS與(yu)電子病歷、與(yu)住院病案或(huo)RIS等(deng)的(de)(de)相互(hu)參(can)照引用(yong)上(shang)(shang)。按照這個觀點,實現(xian)CDR時,如(ru)果我(wo)們將進(jin)入的(de)(de)數(shu)(shu)(shu)據(ju)(ju)(ju)進(jin)行必(bi)(bi)要的(de)(de)處理,按照精心(xin)設計的(de)(de)數(shu)(shu)(shu)據(ju)(ju)(ju)結(jie)構存儲(chu)、維(wei)護好(hao)數(shu)(shu)(shu)據(ju)(ju)(ju)間(jian)的(de)(de)邏輯(ji)關(guan)系(xi),我(wo)們管理的(de)(de)數(shu)(shu)(shu)據(ju)(ju)(ju)無論多大,也是(shi)(shi)傳統數(shu)(shu)(shu)據(ju)(ju)(ju)處理的(de)(de)范疇,與(yu)大數(shu)(shu)(shu)據(ju)(ju)(ju)無關(guan)。
對于以上問題的以及推演出(chu)的結論,與我個人對醫療大數(shu)據的思(si)考存在(zai)一些差(cha)異,借著對這些問題的探討,將個人觀點(dian)表述出(chu)來,共大家參考。
首(shou)先(xian),我(wo)認為數(shu)(shu)據(ju)(ju)(ju)質量(liang)和格(ge)式(shi)并不是(shi)(shi)區分是(shi)(shi)否大數(shu)(shu)據(ju)(ju)(ju)的(de)(de)標準(zhun)。面對一組數(shu)(shu)據(ju)(ju)(ju),數(shu)(shu)據(ju)(ju)(ju)質量(liang)的(de)(de)好壞(huai)相對于應用(yong)、工具(ju)(ju)以(yi)及分析(xi)方法是(shi)(shi)有不同評判標準(zhun)的(de)(de)。例如,假設我(wo)們存儲在CDR中(zhong)的(de)(de)數(shu)(shu)據(ju)(ju)(ju)是(shi)(shi)XML格(ge)式(shi),不管我(wo)們將該格(ge)式(shi)定義得多完美(mei)、存儲的(de)(de)數(shu)(shu)據(ju)(ju)(ju)多萬善,采用(yong)傳統BI工具(ju)(ju)的(de)(de)開發人(ren)員(yuan)都會認為這些數(shu)(shu)據(ju)(ju)(ju)是(shi)(shi)垃圾(真(zhen)實場景),所謂(wei)吾(wu)之蜜(mi)糖、汝之毒藥(yao)也。
其(qi)次,為(wei)什么要(yao)(yao)(yao)區分(fen)大(da)(da)(da)數據(ju)(ju)或(huo)者非大(da)(da)(da)數據(ju)(ju)呢?我們保存(cun)數據(ju)(ju)是(shi)(shi)(shi)因(yin)為(wei)這(zhe)(zhe)些(xie)數據(ju)(ju)存(cun)在對今后有再利(li)用(yong)(yong)的(de)(de)(de)價值(zhi)。傳統(tong)(tong)上,我們設計的(de)(de)(de)信(xin)息(xi)系(xi)統(tong)(tong)時,在考慮(lv)存(cun)儲(chu)信(xin)息(xi)的(de)(de)(de)同時也會將利(li)用(yong)(yong)信(xin)息(xi)的(de)(de)(de)方式(shi)(shi)考慮(lv)進(jin)來,作為(wei)信(xin)息(xi)系(xi)統(tong)(tong)的(de)(de)(de)一部分(fen),這(zhe)(zhe)樣實現的(de)(de)(de)系(xi)統(tong)(tong)會對存(cun)儲(chu)的(de)(de)(de)內(nei)容提(ti)(ti)出(chu)(chu)各種要(yao)(yao)(yao)求(qiu)(qiu),讓存(cun)儲(chu)符合應(ying)用(yong)(yong)需(xu)要(yao)(yao)(yao)。而符合某一系(xi)統(tong)(tong)需(xu)要(yao)(yao)(yao)的(de)(de)(de)數據(ju)(ju)卻很(hen)難(nan)符合其(qi)他應(ying)用(yong)(yong)的(de)(de)(de)需(xu)要(yao)(yao)(yao),這(zhe)(zhe)就導致(zhi)所謂(wei)數據(ju)(ju)質(zhi)量的(de)(de)(de)低下(xia)。于是(shi)(shi)(shi)有人提(ti)(ti)出(chu)(chu)用(yong)(yong)CDR將各個系(xi)統(tong)(tong)數據(ju)(ju)抽取到CDR中,經過清(qing)洗、標準化等(deng)方式(shi)(shi)處理(li)后,統(tong)(tong)一存(cun)儲(chu)并加(jia)以(yi)利(li)用(yong)(yong),人民(min)醫(yi)院CDR也許就是(shi)(shi)(shi)這(zhe)(zhe)種思想(xiang)的(de)(de)(de)產(chan)物。如果對于這(zhe)(zhe)種CDR中存(cun)儲(chu)的(de)(de)(de)數據(ju)(ju),我們不(bu)再有任何其(qi)他利(li)用(yong)(yong)的(de)(de)(de)需(xu)求(qiu)(qiu),那(nei)么,我可以(yi)接受它不(bu)是(shi)(shi)(shi)大(da)(da)(da)數據(ju)(ju)這(zhe)(zhe)個觀點。然而,只要(yao)(yao)(yao)數據(ju)(ju)在這(zhe)(zhe)里,會不(bu)再利(li)用(yong)(yong)嗎(ma)?會沒(mei)有新的(de)(de)(de)、顛覆性的(de)(de)(de)應(ying)用(yong)(yong)需(xu)要(yao)(yao)(yao)嗎(ma)?今天(tian)我們習以(yi)為(wei)常的(de)(de)(de)東(dong)西在昨天(tian)還(huan)不(bu)曾(ceng)出(chu)(chu)現,明(ming)天(tian)的(de)(de)(de)數據(ju)(ju)分(fen)析方式(shi)(shi)會受制于你(ni)今天(tian)設計的(de)(de)(de)所謂(wei)優秀(xiu)的(de)(de)(de)數據(ju)(ju)結(jie)構嗎(ma)?是(shi)(shi)(shi)不(bu)是(shi)(shi)(shi)大(da)(da)(da)數據(ju)(ju),與數據(ju)(ju)無關、與系(xi)統(tong)(tong)無關、與數據(ju)(ju)的(de)(de)(de)生成方式(shi)(shi)無關。區分(fen)大(da)(da)(da)數據(ju)(ju)和非大(da)(da)(da)數據(ju)(ju)其(qi)實反(fan)映的(de)(de)(de)是(shi)(shi)(shi)利(li)用(yong)(yong)數據(ju)(ju)能力與方法。
大(da)數據作為(wei)一個(ge)名詞代表的(de)(de)內(nei)容及其豐富(fu)廣泛,它既包(bao)含(han)宏(hong)觀層面的(de)(de)趨(qu)勢、政(zheng)策等(deng)(deng)內(nei)容,同(tong)時(shi)也包(bao)含(han)具(ju)體(ti)的(de)(de)技(ji)術(shu)(shu)、方(fang)(fang)法(fa)以及觀念(nian)的(de)(de)創新。行(xing)業內(nei)的(de)(de)討(tao)論多集中在趨(qu)勢、政(zheng)策和對未來應用模(mo)式的(de)(de)憧憬(jing)上,很少(shao)就具(ju)體(ti)技(ji)術(shu)(shu)、實現、方(fang)(fang)法(fa)進(jin)行(xing)有深(shen)度的(de)(de)探討(tao),對業內(nei)有影響的(de)(de)案(an)例缺(que)乏又深(shen)度的(de)(de)分析,例如,圍繞人民醫院數據中心實現,在技(ji)術(shu)(shu)上有哪(na)些成(cheng)功的(de)(de)創造性(xing)方(fang)(fang)法(fa)?有哪(na)些不足可以改進(jin)?甚(shen)至(zhi)具(ju)體(ti)技(ji)術(shu)(shu)細節、遇到的(de)(de)問題等(deng)(deng)等(deng)(deng)。
上一篇: 移動醫療變革未來醫療服務模式