數(shù)十年專注企業(yè)數(shù)字化轉型、智能化升級、企業(yè)上云解決方案服務商
工單提交 騰佑科技咨詢熱線咨詢熱線: 400-996-8756
百度云服務中心騰佑科技公司
云服務器活動 服務器租用 服務器托管 機柜租賃 帶寬租賃
  • 最新資訊
  • 熱門資訊
  • 最熱資訊
智能建站

Web服務器語音發(fā)展變化

發(fā)布時間:2012-03-06 作者:admin

簡述:Web服務器語音發(fā)展變化大體指的就是從無聲到有聲的變化。目前,文本語音轉換器(TTS,TexttoSpeech)的研究工作已經(jīng)取得了很大的進步,實現(xiàn)了自動的語言分析理解,并允許TTS的使用者增加更多的

Web服務器語音發(fā)展變化大體指的就是從無聲到有聲的變化?! ?/P>

目前,文本語音轉換器(TTS,Text to Speech)的研究工作已經(jīng)取得了很大的進步,實現(xiàn)了自動的語言分析理解,并允許TTS的使用者增加更多的韻律、音調(diào)在講話中,使TTS系統(tǒng)的發(fā)聲更接近人聲。在自動語音識別系統(tǒng)(ASR)領域里,自動語音識別系統(tǒng)在從整個詞的模仿匹配,向音素層次的識別系統(tǒng)方向發(fā)展。自動語音識別系統(tǒng)的詞匯表由一個基于聲音片斷的字母表構成,而且這種詞匯表是受不同語言限制的?;谶@種方式,在一個寬廣的聲音行列里,講話能被識別系統(tǒng)發(fā)現(xiàn)和挑揀出來,并加以識別。并且,在識別一個詞的時候,每一個音素將從系統(tǒng)的輸入中挑揀出來,拼接組合后與已經(jīng)有的音素和詞語模板進行比較,來產(chǎn)生需要的模板。音素的識別大大減輕了ASR對講話者的依賴性,并且使得它非常容易去建立大型的和容易修改的語音識別字典,從而滿足不同應用市場的需求。

Web語音發(fā)展的另一方面是VoiceXML(Voice Extensible Markup Language-語音可擴展標記語言)的進展。VoiceXML的主要目標是要將Web上已有的大量應用、豐富的內(nèi)容,讓交互式語音界面也能夠全部享受。Web服務器處理一個來自客戶端應用的請求,這一請求經(jīng)過了VoiceXML解釋程序和VoiceXML解釋程序語境處理,作為響應,服務器產(chǎn)生出VoiceXML文件,在回復當中,要經(jīng)過VoiceXML解釋程序的處理。VoiceXML 1.0規(guī)范基于XML,為語音和電話應用的開發(fā)者、服務提供商和設備制造商提供了一個智能化的API。VoiceXML的標準化將簡化Web上具有語音響應服務的個性化界面的創(chuàng)建,使人們能夠通過語音和電話訪問網(wǎng)站上的信息和服務,像今天通過CGI腳本一樣檢索中心數(shù)據(jù)庫,訪問企業(yè)內(nèi)部網(wǎng),制造新的語音訪問設備。VoiceXML的執(zhí)行平臺上面加載了相應的軟件和硬件,例如,ASR、TTS,從而實現(xiàn)語音的識別以及文本和語音之間的轉化。

目前,IBM、Nokia、Lucent、Motorola等著名廠商都已經(jīng)開發(fā)出相應支持VoiceXML的產(chǎn)品,但現(xiàn)在的ASR和TTS系統(tǒng)大多還不能支持中文。

本文由專業(yè)服務器托管——騰佑科技提供,推薦服務網(wǎng)通服務器租用

點擊展開全文

鄭州騰佑科技有限公司(以下簡稱“騰佑科技”)成立于2009年, 總部位于鄭州,是 一家致力于互聯(lián)網(wǎng)服務業(yè)的高新技術企業(yè),公司主營業(yè)務以互聯(lián)網(wǎng)數(shù)據(jù)中心、云計算、人 工智能、軟件開發(fā)、安全服務“互聯(lián)網(wǎng)+”行業(yè)解決方案及行業(yè)應用等相關業(yè)務。

售前咨詢熱線:400-996-8756

備案提交:0371-89913068

售后客服:0371-89913000

熱門活動

百度云服務中心
  • 熱門資訊
  • 隨便看看