據(jù)美國(guó)每日科學(xué)網(wǎng)站近日?qǐng)?bào)道,有史以來第一次,美國(guó)科學(xué)家研制出的一套新系統(tǒng),借助語音合成器和人工智能,通過監(jiān)控某人的大腦活動(dòng),將其想法直接轉(zhuǎn)化成了可理解、可識(shí)別的語音。研究人員稱,最新研究為那些言語能力有限或無法說話的人重新獲得與外界溝通的能力奠定了基礎(chǔ),也有望為計(jì)算機(jī)直接與大腦通信開辟新途徑。
幾十年的研究表明,當(dāng)人們說話(甚至想象說話)時(shí),大腦中會(huì)出現(xiàn)明顯的活動(dòng)模式。當(dāng)我們傾聽某人說話或想象聆聽時(shí),大腦也會(huì)出現(xiàn)可識(shí)別的信號(hào)模式。專家們?cè)噲D記錄和解碼這些模式,希望將人們的想法翻譯成口頭語言。
但實(shí)現(xiàn)這一壯舉極具挑戰(zhàn)性。以前科學(xué)家進(jìn)行的腦部信號(hào)解碼工作主要集中于構(gòu)建一些用于分析頻譜圖(聲音頻率的視覺表示)的簡(jiǎn)單計(jì)算機(jī)模型,但這種方法不能產(chǎn)生任何類似于可理解的語音的東西。哥倫比亞大學(xué)莫蒂默·B.祖克曼心腦行為研究所的莫斯尕拉尼團(tuán)隊(duì)因此求諸聲碼器,這是一種計(jì)算機(jī)算法,可在接受人們說話的錄音訓(xùn)練后合成語音。
為了教聲碼器解釋大腦活動(dòng),莫斯尕拉尼與神經(jīng)外科醫(yī)生阿希什·迪勒希-梅塔合作。在研究中,他們要求接受過腦部手術(shù)的癲癇患者聽取不同人說的句子,同時(shí)測(cè)量他們大腦的活動(dòng)模式,這也是對(duì)聲碼器進(jìn)行訓(xùn)練。
接下來,他們要求這些患者聽說話者復(fù)述0到9之間的數(shù)字,同時(shí)記錄可以通過聲碼器運(yùn)行的大腦信號(hào)。然后,再借助模仿生物大腦中神經(jīng)元結(jié)構(gòu)的人工智能——神經(jīng)網(wǎng)絡(luò),對(duì)聲碼器響應(yīng)這些信號(hào)所產(chǎn)生的聲音進(jìn)行分析。
莫斯尕拉尼說:“我們發(fā)現(xiàn),這些人可以理解并重復(fù)75%的聲音,遠(yuǎn)超以往任何嘗試?!?/p>
研究人員計(jì)劃接下來測(cè)試更復(fù)雜的單詞和句子。他們希望該系統(tǒng)可以成為植入物的一部分,將穿戴者的思想直接轉(zhuǎn)化為文字。
莫斯尕拉尼說:“這將改變游戲規(guī)則。它有望讓任何失去講話能力的人,重新?lián)碛信c周圍世界聯(lián)系的機(jī)會(huì)。”