先是無人駕駛熱透半邊天,繼而下圍棋又打遍天下無敵手……逆天的人工智能,最近甚至把手伸進醫(yī)院——這不,廣州市婦女兒童醫(yī)療中心剛剛對外宣布,其基于深度學習開發(fā)出一個能診斷眼病和肺炎兩大類疾病的人工智能系統(tǒng),這項研究成果以封面文章登上2月23日的世界頂級期刊《Cell》(細胞)。
人工智能診斷疾病靠譜嗎?南方南君告訴你,絕對驚人!比對實驗發(fā)現(xiàn),該系統(tǒng)在診斷眼疾時的準確性達到96.6%;在區(qū)分肺炎和健康狀態(tài)時,準確性達到92.8%,這種水平足以匹敵人類醫(yī)生中訓(xùn)練了十幾二十年的專家級水平。
這是否意味著“搶醫(yī)生的飯碗”?不用過度擔心,在落實到實際應(yīng)用時,這項人工智能成果,還只是定位在輔助,即根據(jù)影像資料,給醫(yī)生提出診斷建議,并解釋判斷的依據(jù);最終的診斷結(jié)論,還是要醫(yī)生來下。
新一代系統(tǒng)有多強大?
肺炎是全世界兒童因感染導(dǎo)致死亡的首要原因。從一張胸部CT上找到肺結(jié)節(jié),一名經(jīng)過訓(xùn)練的醫(yī)生平均需要3—5分鐘,而依靠人工智能需要多久你造嗎?3—5秒!
這就是由張康教授領(lǐng)銜的廣州市婦女兒童醫(yī)療中心和加州大學圣迭戈分校課題組研發(fā)的新一代人工智能平臺的強大能力。
不光是快。決定肺炎預(yù)后的關(guān)鍵因素是能否根據(jù)肺炎的病原學類型精準用藥。換句話說,分清楚是細菌性肺炎,還是病毒性肺炎,很重要。傳統(tǒng)的基于血培養(yǎng)、痰培養(yǎng)、生化檢測等方法,很難快速準確判斷。而新一代人工智能平臺則可以基于兒童胸部X線片實現(xiàn)兒童肺炎病原學類型的秒級準確判定。
這就實現(xiàn)了用人工智能精確指導(dǎo)抗生素的合理使用,而且該平臺可以不受醫(yī)院級別和區(qū)域的限制,實現(xiàn)社區(qū)醫(yī)療、家庭醫(yī)生、??漆t(yī)院的廣覆蓋,為肺炎這一抗菌素濫用重災(zāi)區(qū)提供精準用藥方案,避免抗菌素濫用,促進兒童重癥肺炎康復(fù)。
這也是這一人工智能平臺的重大臨床意義所在。眾所周知,在全世界范圍內(nèi),專業(yè)高質(zhì)量的的醫(yī)療資源都是稀缺的。中國更是人口眾多,發(fā)展極不平衡。緊缺的醫(yī)療資源(特別是有經(jīng)驗的醫(yī)護人員)和龐大的診療需求之間矛盾突出。因此,人們十分期待,效率更高、精準度好的人工智能成為醫(yī)生的好幫手,對診前疾病的篩查、預(yù)防,就診時醫(yī)療圖像輔助診斷、檢驗結(jié)果分析、手術(shù)輔助,以及就診后的醫(yī)療隨訪、慢性病監(jiān)測、康復(fù)協(xié)助、健康管理,甚至對于基礎(chǔ)科研輔助、藥物研發(fā)、基因篩選分析、醫(yī)療培訓(xùn)等帶來革命性的變革。
就拿眼科來說,黃斑變性和糖尿病視網(wǎng)膜黃斑水腫是兩種最常見、可導(dǎo)致不可逆失明的疾病,如果及早發(fā)現(xiàn)的話,兩者都是可以治療的。但遺憾的是,這兩種病的診療資源一般都集中在城市地區(qū)的一些醫(yī)院里的資深專家身邊。
“現(xiàn)在我們的人工智能平臺可以不受人員不受區(qū)域的限制,可以在世界任何地方讓更多的患者早發(fā)現(xiàn)、早診斷、早治療?!?016年加入廣州市婦女兒童醫(yī)療中心基因檢測中心的加州大學圣地亞哥分校Shiley眼科研究所教授張康說。
據(jù)悉,這不僅是中國研究團隊首次在頂級生物醫(yī)學雜志發(fā)表有關(guān)醫(yī)學人工智能的研究成果;還是全世界首次實現(xiàn)用人工智能精確推薦治療手段。
為什么這么厲害?
有人說,人工智能看病靠譜嗎?把身家性命交給機器人,放心嗎?
研究團隊從黃斑變性和糖尿病視網(wǎng)膜黃斑水腫這兩種疾病切入,讓這一人工智能系統(tǒng)不停地學習眼部光學相干斷層掃描圖像。在學習了超過20萬病例的圖像數(shù)據(jù)后,該平臺診斷黃斑變性、黃斑水腫的準確性達到96.6%,靈敏性達到97.8%。與5名眼科醫(yī)生診斷結(jié)果相PK,確認平臺可以達到訓(xùn)練有素的眼科醫(yī)生的水平,并在30秒內(nèi)決定病人是否應(yīng)該接受治療。
南方南君了解到,這套人工智能系統(tǒng)之所以這么厲害,來自于其超強的深度學習能力。深度學習是人工智能的熱門研究領(lǐng)域,相信很多人不會陌生。我們所熟知的AlphaGo、自動駕駛等這些重量級應(yīng)用,都是基于深度學習技術(shù)開發(fā)的。
在此項研發(fā)過程中,課題組應(yīng)用了基于遷移學習模型的新算法,既大幅提升了人工智能的學習效率,又有利于實現(xiàn)“一個系統(tǒng)解決多種疾病”的目標。
“傳統(tǒng)的深度學習模型一般需要上百萬的高質(zhì)量同類型的標注數(shù)據(jù)才能獲得較為穩(wěn)定和精確的輸出結(jié)果,但現(xiàn)實中給每種疾病都收集上百萬張高質(zhì)量的標注圖像幾乎是不可能實現(xiàn)的,使得人工智能在醫(yī)學影像學領(lǐng)域的病種廣覆蓋很難實現(xiàn)?!睆埧到榻B。所以,目前已有的醫(yī)療人工智能一般一個系統(tǒng)只能針對一種疾病。
相對而言,這項基于遷移學習模型新一代人工智能平臺所需的數(shù)據(jù)量極少,研究者只需要幾千張就可以很好地完成一次跨病種遷移。
例如,在本研究中,課題組在20萬張眼部圖像數(shù)據(jù)訓(xùn)練出來的人工智能系統(tǒng)基礎(chǔ)上,只用了5000張胸部X線圖像,就通過遷移學習構(gòu)建出肺炎的人工智能圖像診斷系統(tǒng),實現(xiàn)了兒童肺炎病原學類型的差異性分析和秒級判定。經(jīng)檢測,其在區(qū)分肺炎和健康狀態(tài)時,準確性達到92.8%,靈敏性達到93.2%;在區(qū)分細菌性肺炎和病毒性肺炎上,準確性達到90.7%,靈敏性達到88.6%。
此外,既往單純依靠深度學習技術(shù)的研究和產(chǎn)品,給出的報告中只有結(jié)果,而沒有列出判斷的理由與過程,這種“黑箱子”式的診斷,即便精準度很高,醫(yī)生也不敢妄加使用。難能可貴的是,新一代人工智能平臺一定程度上克服了這種局限性,讓你“知其然,還知其所以然”。
課題組創(chuàng)新性地使用了遮擋測試的思維,通過反復(fù)學習、實踐和改進,平臺可以顯示它從圖像的哪個區(qū)域得出診斷結(jié)果,在一定程度上給出了判斷理由,從而使其本身更有可信度。
機器人醫(yī)生還有多遠?
人工智能診斷起疾病來已然這么強悍,這是分分鐘要搶醫(yī)生飯碗的節(jié)奏啊!人們不禁發(fā)問:機器人醫(yī)生離我們的生活還有多遠?
張康說,目前他們的人工智能系統(tǒng)已經(jīng)在美國和拉丁美洲眼科診所進行小規(guī)模臨床試用。此外,在后續(xù)的研究中,他們還會進一步增加數(shù)據(jù)學習模本的數(shù)量,同時增加可診斷的疾病種類,并進一步優(yōu)化系統(tǒng)等。
而在研發(fā)者廣州市婦女兒童醫(yī)療中心,新技術(shù)的應(yīng)用自然首當其沖。早在2015年,針對優(yōu)質(zhì)醫(yī)療資源匱乏的痛點,該院基于信息化建設(shè)產(chǎn)生的優(yōu)質(zhì)醫(yī)療大數(shù)據(jù),就融合人工智能的前沿技術(shù),啟動了“咪姆熊”智能家族研發(fā)項目。
“這個家族成員有四頭熊,發(fā)熱熊、影像熊、導(dǎo)診熊、營養(yǎng)熊?!痹撛号R床數(shù)據(jù)中心主任梁會營風趣地介紹,“發(fā)熱熊”以兒童常見的發(fā)熱相關(guān)疾病為研究內(nèi)容,基于權(quán)威指南、專家共識、200余萬份的海量病歷等知識型文本,融合多源異構(gòu)數(shù)據(jù)整合技術(shù)、自然語言處理技術(shù)和機器學習算法,經(jīng)過一年的訓(xùn)練,已經(jīng)能夠成功針對24種兒童常見發(fā)熱相關(guān)疾病開展準確的輔助診斷,通過無縫嵌入電子病歷系統(tǒng)成為門診醫(yī)生的貼心助手。
而影像熊基于“胸部X線片+微生物培養(yǎng)檢測大數(shù)據(jù)”,采用深度學習算法,可智能識別肺炎的微生物感染狀況(細菌性、病毒性、混合感染性),為抗菌素的精準應(yīng)用提供決策支持,目前已實際應(yīng)用到醫(yī)生的輔助診斷。其實踐中形成的數(shù)據(jù)和技術(shù),成為新一代人工智能系統(tǒng)科研成果的重要基礎(chǔ)和組成部分。
另外兩頭“熊”也在茁壯成長中,不久的將來可望和公眾見面。
此次發(fā)表在《cell》的醫(yī)學人工智能研究成果,被廣州市婦女兒童醫(yī)療中心當做一個新的起點。中心主任、院長夏慧敏表示,“新一代人工智能平臺的終極目標,應(yīng)該是整合文本型病歷數(shù)據(jù)、全結(jié)構(gòu)化實驗室檢查數(shù)據(jù)、圖像數(shù)據(jù)、光電信號等多媒介數(shù)據(jù),模擬臨床醫(yī)生對患者病情進行系統(tǒng)評估,為醫(yī)務(wù)人員提供綜合的輔助決策。而不僅僅是為影像科醫(yī)生或某一醫(yī)技科人員提供單一方面的輔助決策?!?/p>
“因此,新一代平臺還在不斷強化當中。”夏慧敏舉例說,例如在兒童肺炎病原學類型智能判別領(lǐng)域,團隊正在系統(tǒng)閱讀X線片的基礎(chǔ)上,增加了實驗室檢查和臨床癥狀的學習,從而更精確判斷出兒童肺炎的病原菌類型。
“患者日益增長的優(yōu)質(zhì)醫(yī)療資源需要同專業(yè)醫(yī)療人員培養(yǎng)不足的矛盾,是我們面臨的痛點之一。希望在不久的將來,這項技術(shù)能應(yīng)用到初級保健、社區(qū)醫(yī)療、家庭醫(yī)生、??漆t(yī)院等,形成大范圍的自動化分診系統(tǒng),在一定程度上解決醫(yī)療服務(wù)能力不足的問題,提高健康服務(wù)的公平性和可及性,維護人類健康,提高生活質(zhì)量。”夏慧敏說。
概念解釋:
“遷移學習”(Transfer Learning),顧名思義就是就是把已訓(xùn)練好的模型參數(shù)遷移到新的模型來幫助新模型訓(xùn)練,也就是運用已有的知識來學習新的知識,找到已有知識和新知識之間的相似性,用成語來說就是“舉一反三”。
比如,已經(jīng)學會下圍棋,就可以類比著來學習象棋;會打籃球,就可以類比著來學習排球;已經(jīng)會中文,就可以類比著來學習英語、日語等。如何合理的尋找不同模型之間的共性,進而利用這個橋梁來幫助學習新知識,就是“遷移學習”的核心。遷移學習被認為是一種高效的技術(shù),尤其是面臨相對有限的訓(xùn)練數(shù)據(jù)時。
相較于其他大多數(shù)學習模型的“從零開始”,遷移學習先利用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)學習已有的已經(jīng)標記好的預(yù)訓(xùn)練網(wǎng)絡(luò)系統(tǒng),從而起到事半功倍的效果。
以醫(yī)學圖像學習為例,該系統(tǒng)會識別預(yù)系統(tǒng)中圖像的特點,研究人員再繼續(xù)導(dǎo)入含有第一層圖像相似參數(shù)和結(jié)構(gòu)的網(wǎng)絡(luò)系統(tǒng),最終構(gòu)建出終極層級。(人民日報中央廚房·南方南工作室 賀林平)