中科院團隊發布國際最大規模漢語同步多模態神經影像數據集_國內_中國西藏網

中國西藏網 > 即時新聞 > 國內

中科院團隊發布國際最大規模漢語同步多模態神經影像數據集

發布時間：2022-10-10 11:19:00來源：中國新聞網

　　中新網北京10月9日電 (記者孫自法)中國科學院自動化研究所(中科院自動化所)9日向媒體發布信息說，該所自然語言處理研究組歷時近兩年，采集處理完成迄今國際上規模最大、包含信息最豐富的漢語同步多模態神經影像數據集，并于近日正式對外發布。

　　該數據集覆蓋了近萬個漢語詞匯，是當前國際上最大規模的用于腦語言處理機制研究的多模態同步神經影像數據集。其相關研究成果論文已在《自然》(Nature)旗下專業學術期刊《科學數據》(Scientific Data)發表。

　　據中科院自動化所自然語言處理研究組介紹，大腦在加工語言時，需要實時調動多個腦區的神經元進行協同工作。構建高時空分辨率的神經影像數據可以幫助人們更好地了解各個腦區以及腦區之間的協同合作，對于研究大腦的語言加工機制至關重要。

　　當前已有的開源數據主要針對英文采集，只包括單一模態的神經影像數據，如高空間分辨率的功能核磁共振(fMRI)或高時間分辨率的腦磁圖(MEG)，并且大多使用1小時以內的實驗材料，數據規模有限，無法借助數據需求量大的計算模型進行更全面、更深入的大腦語言加工機制探索。

　　為突破上述問題，該研究組歷時近兩年采集處理完成目前國際上規模最大、包含信息最豐富的漢語同步多模態神經影像數據集，針對12個被試收聽約6個小時故事時的功能核磁共振(fMRI)、腦磁圖(MEG)、每個被試的T1/T2加權結構像、擴散磁共振成像(diffusion MRI)和靜息態核磁共振(resting MRI)數據采集整理而成。為了便于利用計算模型進行腦語言處理機制的研究，所有故事材料都由人工標注了句法結構樹，計算了文本中每個詞匯對應的音頻時間點、詞頻以及多種不同字和詞匯的向量。同時，所有測試指標均超越或可比于已有的同類數據集，具有充分的質量保證。

　　中科院自動化所自然語言處理研究組表示，目前國際最大規模漢語同步多模態神經影像數據集的公開發布，可以為全方位研究大腦在真實場景下理解詞匯、短語和句子時如何調動不同腦區以及不同腦區之間如何協同工作等科學問題提供重要支撐。

　　特別值得注意的是，該數據集覆蓋了近萬個漢語詞匯，這不僅對于研究大腦理解漢語的認知機理具有重要意義，而且將在探索自然語言計算模型與人腦語言處理機制之間的關系，研究如何利用神經影像數據提升現有語言計算模型的性能，從而構建新一代受腦啟發的神經語言模型等一系列工作中發揮顯著作用。(完)

（責編：陳濛濛）

版權聲明：凡注明“來源：中國西藏網”或“中國西藏網文”的所有作品，版權歸高原（北京）文化傳播有限公司。任何媒體轉載、摘編、引用，須注明來源中國西藏網和署著作者名，否則將追究相關法律責任。

相關閱讀

專題推薦

傲游截圖20180202095714.jpg

微觀

為藏族文化傳播注入青年力量楊玲：懷揣教育情懷奔赴雪域高原張琳：援藏是紅色家庭的血脈傳承韓同英：危重新生兒的守護者

賞閱

九寨溝開啟“雪景模式” 美得像童話世界

青海：秋日拾光，山河猶如童話世界青海河曲草原秋日成金色世界青海西寧：時令花卉別有韻味戳這里！領略秋日天峻溝的奇美壯麗

資料云

QQ截圖20200831163244.jpg

中央第七次西藏工作座談會

流淌的吉曲河——學歷史講拉薩雪域長歌新時代?邊疆行——西藏篇一江清水向東流

即時新聞

關于我們|信息聲明|誠聘英才|廣告服務|糾錯熱線|中國西藏網舉報受理和處置管理辦法

中國西藏網版權所有，未經書面授權禁止使用

中國西藏雜志社主辦版權所有：高原(北京)文化傳播有限公司 Copyright ? 2000-2017 by www.batgames.net All Rights Reserved

E-mail: xizangzongbianshi@163.com 違法和不良信息舉報電話：010-58336000 互聯網宗教信息服務許可證：京（2022）0000001

廣播電視節目制作經營許可證（京）字第04446號京ICP備 17049894號-2 京公網安備110102001709-1

在线无码AV五月花_亚洲av一级在线观看_直接看黄网站免费无码_成人 a v免费视频