中新網(wǎng)2月12日電 2月11日,國(guó)際醫(yī)學(xué)科研期刊《Nature Medicine》在線發(fā)布了題為“Evaluation and accurate diagnoses of pediatric diseases using artificial intelligence”(《使用人工智能評(píng)估和準(zhǔn)確診斷兒科疾病》)的文章。該文章由廣州市婦女兒童醫(yī)療中心與依圖醫(yī)療等企業(yè)和科研機(jī)構(gòu)共同完成,基于機(jī)器學(xué)習(xí)的自然語言處理(NLP)技術(shù)實(shí)現(xiàn)不輸人類醫(yī)生的強(qiáng)大診斷能力,并具備多場(chǎng)景的應(yīng)用能力。
業(yè)界公認(rèn),人工智能是醫(yī)療行業(yè)革新的核心動(dòng)力。然而,盡管機(jī)器學(xué)習(xí)在影像診斷方面表現(xiàn)強(qiáng)勢(shì),但在數(shù)量巨大、多樣的電子病歷數(shù)據(jù)分析方面,仍面臨巨大挑戰(zhàn)。電子病歷的數(shù)據(jù)信息之廣、數(shù)據(jù)類型之多,以及某些方面的數(shù)據(jù)貧乏及可能出現(xiàn)的特殊案例等,都導(dǎo)致機(jī)器學(xué)習(xí)難以進(jìn)行精確的數(shù)據(jù)分析,并進(jìn)而形成預(yù)測(cè)臨床檢測(cè)的數(shù)據(jù)模型。
依圖提出并測(cè)試了一個(gè)專門對(duì)電子醫(yī)學(xué)病例進(jìn)行數(shù)據(jù)挖掘的系統(tǒng)框架,將醫(yī)學(xué)知識(shí)和數(shù)據(jù)驅(qū)動(dòng)模型結(jié)合在一起。
“此次成果的核心技術(shù)部分,實(shí)際上是通過深度學(xué)習(xí)技術(shù)與醫(yī)學(xué)知識(shí)圖譜,對(duì)EHR數(shù)據(jù)進(jìn)行解構(gòu),從而構(gòu)建了高質(zhì)量的智能病種庫(kù)。使得后續(xù)可以較容易地利用智能病種庫(kù)建立各種診斷模型。而診斷模型證明了基于AI的系統(tǒng)可以幫助醫(yī)生處理大型數(shù)據(jù)和輔助診斷,同時(shí)在診斷的不確定性和復(fù)雜性上給予臨床支持”,依圖醫(yī)療總裁倪浩表示,“兒科疾病癥狀多種多樣,臨床醫(yī)生同樣難以區(qū)分,診斷流程費(fèi)時(shí)費(fèi)力,但明確診斷非常重要。擁有可與經(jīng)驗(yàn)豐富的兒科醫(yī)生相媲美的助手進(jìn)行輔助診斷,能夠讓醫(yī)生有效地降低診斷時(shí)間,顯著優(yōu)化診斷流程。”
依圖與廣州市婦女兒童醫(yī)療中心進(jìn)行合作,收集了該中心在2016年1月至2017年7月間的567,498個(gè)門診病人的1,362,559次問診電子病歷,抽取到覆蓋初始診斷包括兒科55種病例學(xué)中常見疾病的1.016億個(gè)數(shù)據(jù)點(diǎn),并將這些信息用于訓(xùn)練和驗(yàn)證系統(tǒng)框架。相比以往模型,此次研究使用了超過140萬的龐大數(shù)據(jù),以完善診斷系統(tǒng),此外,此次研究中使用數(shù)據(jù)在表達(dá)和描述上的一致性,極大的提高了數(shù)據(jù)質(zhì)量。
不僅如此,此次研究還基于NLP實(shí)現(xiàn)了病歷的重新格式化。首先,有超過25年臨床實(shí)踐經(jīng)驗(yàn)的資深主治醫(yī)師手動(dòng)注釋了6,183個(gè)圖表,然后用3,564張人工標(biāo)注的圖表對(duì)NLP信息提取模型進(jìn)行訓(xùn)練,并用剩下的2,619張圖表對(duì)模型進(jìn)行驗(yàn)證。該NLP模型總結(jié)了代表臨床數(shù)據(jù)的關(guān)鍵概念類別,利用深度學(xué)習(xí)技術(shù)自動(dòng)將EHR注釋到標(biāo)準(zhǔn)化詞匯和臨床特征中,從而允許對(duì)診斷分類進(jìn)行進(jìn)一步處理。
廣州市婦女兒童醫(yī)療中心夏慧敏教授表示,“這篇文章的啟示意義在于,通過系統(tǒng)學(xué)習(xí)文本病歷,人工智能或?qū)⒖梢栽\斷更多疾病。但須要清醒認(rèn)識(shí)到,我們?nèi)杂泻芏嗷A(chǔ)性工作要做扎實(shí),比如高質(zhì)量數(shù)據(jù)的集成便是一個(gè)長(zhǎng)期的過程,因?yàn)榇髷?shù)據(jù)的收集和分析需要算法工程師、臨床醫(yī)生、流行病學(xué)專家等在內(nèi)的多專家的通力合作。此外,人工智能學(xué)習(xí)了海量數(shù)據(jù)后,其診斷結(jié)果的準(zhǔn)確性仍然需要更大范圍的數(shù)據(jù)對(duì)其進(jìn)行驗(yàn)證和比對(duì)。”