首頁>資訊 >
【全球獨家】最前線|人工智能可通過30秒語音評估抑郁癥——宇音數(shù)康、岳偉華課題組合作開發(fā)數(shù)字診斷項目 2022-12-20 07:41:13  來源:36氪

隨著疫情對公眾心理健康造成了一系列負(fù)面影響,抑郁癥正在成為一種社會性心理問題。


【資料圖】

數(shù)據(jù)顯示,全球有10億人正在受到精神心理問題的困擾,其中抑郁癥是非致命健康損失的最大誘因之一。作為一種會給患者及其家屬帶來巨大痛苦的常見精神障礙,抑郁癥患者常常表現(xiàn)出缺乏興趣、回避社交、精力流失使得完成工作學(xué)習(xí)任務(wù)困難等狀態(tài)。除了情緒變化,抑郁癥患者還會表現(xiàn)出一系列生物學(xué)癥狀,包括以早醒為特征的睡眠障礙、晝夜情緒變化、食欲改變等。

WHO(世界衛(wèi)生組織)報告稱,全球估計有超過3億人患有抑郁癥,平均發(fā)病率為4.4%,而抑郁癥的終生患病率在中國則高達(dá)6.8%。此外,到了2030年,抑郁癥將會成為全球第一大疾病負(fù)擔(dān)。

然而不幸的是,由于大眾對抑郁癥的認(rèn)知缺乏和污名化,許多人存在病恥感,排斥尋求幫助。同時,由于醫(yī)療可及性等因素,大量患者正在遭受誤診、或無法獲得所需的幫助。其中,當(dāng)抑郁癥患者較年長時,所帶來的個人負(fù)面影響和家庭負(fù)擔(dān)更為嚴(yán)重。老年抑郁癥患者的誤診率更高,獲得足夠支持的機(jī)會也更低。因此,如何幫助抑郁癥患者更加方便、精準(zhǔn)地獲得心理健康評估、檢測及監(jiān)測,成為了近年來的研究熱點。

傳統(tǒng)的抑郁癥診斷是通過受過專業(yè)培訓(xùn)的精神科醫(yī)生對患者進(jìn)行訪談和觀察,根據(jù)診斷標(biāo)準(zhǔn)評估患者是否患有抑郁癥。而在國內(nèi),精神科醫(yī)生的短缺使得有效識別抑郁癥變得更加困難。2017年,中國約有2.7萬名精神科醫(yī)生,平均每10萬人口2名精神科醫(yī)生。世衛(wèi)組織數(shù)據(jù)顯示,俄羅斯和美國的這一比例分別為每10萬人口11名和12名精神科醫(yī)生,盡管到2020年,全國精神科執(zhí)業(yè)(助理)醫(yī)師數(shù)量增加到4萬名,但面對中國龐大的人口基數(shù),目前抑郁癥的診斷仍存在較大的挑戰(zhàn)。

這一診斷方式導(dǎo)致了:患者對癥狀嚴(yán)重程度的不自知、隱瞞病情等問題,經(jīng)常會混淆診斷。而研究表明,成功的抑郁癥篩查和監(jiān)測可以提供更早的診斷和更精細(xì)的治療,這可能有助于改善嚴(yán)重抑郁癥的預(yù)后。

近年來,基于移動端的AI技術(shù)和可穿戴設(shè)備,對生理和心理數(shù)據(jù)進(jìn)行無創(chuàng)和連續(xù)監(jiān)測產(chǎn)生了巨大的作用。同時,語義識別、機(jī)器翻譯等技術(shù)也已經(jīng)逐漸成熟。聲學(xué)和語音命令處理方面的進(jìn)步,使得機(jī)器學(xué)習(xí)成為了健康診斷的新興領(lǐng)域。

語音的產(chǎn)生是一個復(fù)雜的神經(jīng)肌肉協(xié)調(diào)過程。肺部氣流經(jīng)由聲門帶動聲帶震動,并通過聲道的共鳴、諧振從而發(fā)出聲音。語音中攜帶了聲學(xué)、語言、情感等復(fù)雜信息。幾十年來的過往研究表明,抑郁癥患者在語言方面會表現(xiàn)出重音減輕、單調(diào)、響度衰減等現(xiàn)象,這些是由抑郁癥造成的實質(zhì)性改變引起的。

目前,一系列聲學(xué)特征已被確定為抑郁癥的預(yù)測因素,例如語音中的聲源特征、頻譜及韻律特征等。機(jī)器學(xué)習(xí)能夠從語音中捕獲人耳很難甚至無法感知但客觀存在的聲學(xué)特征變化,這一語音技術(shù)也在檢測抑郁癥等精神障礙方面表現(xiàn)出了可觀的潛力。

回歸到國內(nèi)研究領(lǐng)域,2019年開始,北京大學(xué)第六醫(yī)院的岳偉華教授課題組與語音人工智能科技公司「宇音數(shù)康」進(jìn)行合作,開啟了利用語音進(jìn)行抑郁癥篩查評估的合作研究項目。在經(jīng)歷了研究設(shè)計、倫理審查、數(shù)據(jù)收集、技術(shù)研發(fā)等階段后,目前該項目已經(jīng)進(jìn)入了相關(guān)臨床研究。

今年11月該項目組在《Frontiers in Psychiatry》發(fā)表了一篇臨床研究論文,其基于純語音信號處理的深度學(xué)習(xí)模型,可通過基于智能手機(jī)約30秒的語音進(jìn)行抑郁癥評估,且達(dá)到了82.14%的靈敏度和80.65%的特異性。即使在研究中采用了更高的對標(biāo)標(biāo)準(zhǔn)(采用與精神科醫(yī)師的DSM-5診斷結(jié)果對比,而歐美研究普遍采用與自測量表結(jié)果對比),該模型在臨床研究中的性能仍超過了目前歐美相關(guān)企業(yè)的數(shù)值表現(xiàn)。

技術(shù)合作方「宇音數(shù)康」是一家語音人工智能科技公司,致力于通過自研的語音生物標(biāo)記識別技術(shù)與AI平臺,為精神心理健康領(lǐng)域提供智能、專業(yè)、可規(guī)模化的篩查、監(jiān)測及干預(yù)解決方案。

“語音AI科技能夠幫助人類進(jìn)行高精度的、非侵入性的心理疾病檢測?!?/p>

「宇音數(shù)康」聯(lián)合創(chuàng)始人兼首席醫(yī)療官何恭誠表示,得益于NMPA和FDA對人工智能醫(yī)療器械(SaMD)和數(shù)字療法(DTx)的支持,語音生物標(biāo)記識別領(lǐng)域的技術(shù)正在顛覆此前“敏感”、“主觀”的精神心理產(chǎn)業(yè)。

該項目的語音模型在43000條臨床音頻會話組成的數(shù)據(jù)集上進(jìn)行深度學(xué)習(xí)訓(xùn)練而得,并在獨立驗證集上進(jìn)行測試與臨床研究。所有患者會話均采集自精神科醫(yī)生按照DSM-5國際標(biāo)準(zhǔn)進(jìn)行診斷的患者,通過不同智能手機(jī)在不同環(huán)境中收集并錄音。

“這有可能是目前世界上相關(guān)領(lǐng)域內(nèi)最高質(zhì)量的數(shù)據(jù)集?!?/p>

何恭誠告訴36氪,從技術(shù)迭代來看,該項目為利用深度學(xué)習(xí)技術(shù)快速識別和診斷抑郁癥提供了一種新方法,并證明了從原始語音信號中提取的聲音生物標(biāo)志物對于抑郁癥的早期評估與篩查具有很高的潛力。

在不久的未來,對于受到抑郁癥等心理問題困擾的人而言,只需要完成30秒左右的語音任務(wù),就可以在私密的環(huán)境中獲得客觀、專業(yè)、便捷的精神心理評估與篩查結(jié)果。

關(guān)鍵詞: 精神科醫(yī)生 人工智能 精神心理

相關(guān)閱讀:
熱點
圖片 圖片