來源:IPRdaily中文網(wǎng)(IPRdaily.cn)
作者:連立杰 審協(xié)北京中心通信部 IP創(chuàng)新贏
原標題:聽懂你說話才是真的人工智能
前些天,小編接到將十幾個小時的講座錄音轉文本的任務,傻敲了半天,才想到是否有專業(yè)軟件能解決問題?果然有,且轉換正確率相當高!讓小編狠想扒一扒這產品以及相關的專利技術。
今年兩會期間,“人工智能”這個詞火了。
因為《政府工作報告》中首次寫入了“人工智能”,這也意味著人工智能(AI)將正式進入國家策略層面。
要想實現(xiàn)AI,首先就需要讓機器能夠與人類進行對話,語音識別便成為AI的熱點技術。
一、語音識別技術的進階
今天小編為您介紹的是語音識別技術的進階——語音轉寫技術。
該技術將自然語言轉換為文本輸出,結合不同語言之間的轉換,實現(xiàn)多語種的文本輸出。
在兩會期間,科大訊飛公司董事長劉慶峰向總理李克強展示了他們公司最新研發(fā)的該人工智能技術產品。
李克強總理聽取劉慶峰介紹人工智能“曉譯”翻譯機
總理“各位代表:現(xiàn)在,我代表國務院,向大會報告政府工作”的話音剛落,一行通過該技術將語音實時轉換成的字幕,立即就出現(xiàn)在屏幕上。
科大訊飛研發(fā)的語音轉寫技術以及相關的產品專利已經(jīng)獲得授權(CN 102779508B)。其通過語音提取、語音識別、文本標注三個模塊實現(xiàn)語音到文本轉換。
“訊飛聽見”為頒獎典禮提供實時語音轉寫
語音識別的難點問題在于講話的人有方言、口音或者自己特殊的表達風格。這類問題如何解決呢?這就需要聽者對說話人的說話風格要有足夠的了解。
(舉個栗子:聽到了聲音“qìng fēng”,說話人想說的是一個名字“慶峰”還是包子鋪“慶豐”?)
看來要讓冷冰冰的計算機了解每個人的風格是一件很復雜的事情。
從訊飛的語音自適應專利技術(CN 105895104A)來看,其根據(jù)說話人聲音的特征建立模型,基于此模型對說話人的聲音進行識別??磥?,能夠獲得說話人聲音特征的建模方法就是語音識別中的關鍵技術。
為了能夠準確、快速的掌握說話人的聲音特征,多種性能各異的建模方法被應用于語音識別中,在研發(fā)的過程中,先后出現(xiàn)了DNN(深度神經(jīng)網(wǎng)絡)、CNN(卷積神經(jīng)網(wǎng)絡)、LSTM(時間遞歸神經(jīng)網(wǎng)絡)、Deep CNN(深度卷積神經(jīng)網(wǎng)絡)等性能優(yōu)異的語音模型。
創(chuàng)新實體也在不斷的對語音模型進行改進,以進一步優(yōu)化性能。
語音建模技術的積累在國內也取得了長足的進步,專利申請量逐年遞增,成為了人工智能領域研究的熱點。
在研發(fā)過程中,涌現(xiàn)出了以百度,科大訊飛為代表的國內優(yōu)秀企業(yè),技術上在全球也是處于領先地位。
此外,訊飛產品還能夠自動生成一段語音精華,其中使用了語音摘要技術(CN 106446109A)。有了這個技術,機器人不但能夠聽懂你,而且能夠幫你歸納總結。
是不是感覺機器已經(jīng)具備思考的基礎了?
訊飛錄音筆實時轉文字
最炸裂的是:它還可以自己做摘要
人工智能是對人的意識、思維的信息過程的模擬,其出現(xiàn)就是為了代替人類完成某些繁重的工作。
二、它的發(fā)展代表了未來?
原來從1999年成立的科大訊飛,早就陪伴在你身邊。
“對不起,您撥打的電話正在通話中,請稍后再撥!sorry, the telephone you dialed is busy now, please redial later. ”這句經(jīng)?;厥幵诙叺脑?,竟然出自訊飛之手。
你撥打各大運營商、銀行等電話時的自助語音客服,背后是來自科大訊飛的技術。
每天使用的微信、高德地圖(例如林志玲和郭德綱的合成音)、滴滴出行、攜程、大眾點評、新浪微博等在內的20余萬+合作伙伴使用的語音技術來自訊飛。訊飛通過這些終端覆蓋超過9億的用戶,每天在線服務量達20億次。
教育方面,每年的國家普通話評測、中高考的口語評測,機器評測技術都是來自科大訊飛。2015年科大訊飛機器智能閱卷技術便已在安慶、合肥等地成功試點應用。
經(jīng)過對人機評分結果的分析,指標方面都已達到或超過人工評分水平。這意味著,讓機器評閱主觀題已不再是空想。其中最讓人眼前一亮的,是哈工大訊飛聯(lián)合實驗室研發(fā)的語文作文評分技術。
機器人方面,讓機器人參加高考,并考上重點大學,這是“訊飛超腦”計劃的目標之一。
“高考機器人項目”始于2015年7月,起源于科大訊飛(002230)牽頭承辦了國家“十二五”863計劃信息技術領域“基于大數(shù)據(jù)的類人智能關鍵技術與系統(tǒng)”項目。
只有能夠跟人交流,懂人類語言的機器人,才是最NB的機器人。據(jù)悉,訊飛正在探索讓機器自動學習,能夠讓機器理解自然語言,同時將自然語言與我們人類的概念連接在一起。
習大大在2016年4月參觀訊飛的機器人“曉曼”,并進行了親切的交談。
在汽車領域,訊飛開發(fā)了“飛魚助理”,它承擔了一個車載秘書的功能。使用的越多,它對用戶的個人喜好越了解,對答的時候便能提供更準確的服務。
專業(yè)領域和個性化方面
科大訊飛與北京協(xié)和醫(yī)學院簽署全面戰(zhàn)略合作框架協(xié)議,推出智慧醫(yī)療系統(tǒng),智能語音是其中一項重要技術。通過采集醫(yī)生的語音信息并實時轉換成文字來記錄病例和布置醫(yī)囑,節(jié)省了醫(yī)生手寫病例的時間,提高了醫(yī)生的工作效率。
科大訊飛還與最高人民法院信息技術服務中心簽訂戰(zhàn)略合作協(xié)議,將智能語音識別系統(tǒng)應用于庭審文字記錄的生成中,共同致力于打造“智慧法院”。
還有娛樂方面,訊飛還將語音合成產品進行了個性化應用。如通過語音合成模擬奧巴馬等名人的音色,可以模仿奧巴馬發(fā)出聲音,讓你分分鐘變身名人。
不清楚各行各業(yè)的人工智能化是否會讓人失業(yè),但也許這就是未來,讓人類從重復勞動中抽身去發(fā)揮創(chuàng)意特長。
有了這樣的智能語音技術,或許在以后的現(xiàn)實生活中,我們也能夠與擎天柱做朋友,有大白溫馨的陪伴,體驗人工智能伴隨我們的人類世界。
來源:IPRdaily中文網(wǎng)(IPRdaily.cn)
作者:連立杰 審協(xié)北京中心通信部 IP創(chuàng)新贏
編輯:IPRdaily.cn 趙珍
校對:IPRdaily.cn 縱橫君
推薦閱讀
點擊下方圖片即可閱讀
「智戰(zhàn)2017」首屆知識產權競爭策略挑戰(zhàn)賽,等你來戰(zhàn)!要你好看!
首席知識產權官:一個即將崛起的知識產權職業(yè)群體!
十七種知識產權商業(yè)模式!
「關于IPRdaily」
IPRdaily成立于2014年,是全球影響力的知識產權媒體+產業(yè)服務平臺,致力于連接全球知識產權人,用戶匯聚了中國、美國、德國、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個國家和地區(qū)的高科技公司、成長型科技企業(yè)IP高管、研發(fā)人員、法務、政府機構、律所、事務所、科研院校等全球近50多萬產業(yè)用戶(國內25萬+海外30萬);同時擁有近百萬條高質量的技術資源+專利資源,通過媒體構建全球知識產權資產信息第一入口。2016年獲啟賦資本領投和天使匯跟投的Pre-A輪融資。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來自IPRdaily.cn 中文網(wǎng)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉載此文章須經(jīng)權利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場,如若轉載,請注明出處:“http://globalwellnesspartner.com/”
文章不錯,犒勞下辛苦的作者吧