12年老牌互聯(lián)網IT解決方案提供商
騰佑科技咨詢熱線咨詢熱線: 400-996-8756
工單提交 注冊/登錄
百度云服務中心騰佑科技公司

Web服務器語音發(fā)展變化

發(fā)布時間:2012-03-06 16:34 作者:admin

簡述:

Web服務器語音發(fā)展變化大體指的就是從無聲到有聲的變化?! ?/P>

目前,文本語音轉換器(TTS,Text to Speech)的研究工作已經取得了很大的進步,實現了自動的語言分析理解,并允許TTS的使用者增加更多的韻律、音調在講話中,使TTS系統(tǒng)的發(fā)聲更接近人聲。在自動語音識別系統(tǒng)(ASR)領域里,自動語音識別系統(tǒng)在從整個詞的模仿匹配,向音素層次的識別系統(tǒng)方向發(fā)展。自動語音識別系統(tǒng)的詞匯表由一個基于聲音片斷的字母表構成,而且這種詞匯表是受不同語言限制的?;谶@種方式,在一個寬廣的聲音行列里,講話能被識別系統(tǒng)發(fā)現和挑揀出來,并加以識別。并且,在識別一個詞的時候,每一個音素將從系統(tǒng)的輸入中挑揀出來,拼接組合后與已經有的音素和詞語模板進行比較,來產生需要的模板。音素的識別大大減輕了ASR對講話者的依賴性,并且使得它非常容易去建立大型的和容易修改的語音識別字典,從而滿足不同應用市場的需求。

Web語音發(fā)展的另一方面是VoiceXML(Voice Extensible Markup Language-語音可擴展標記語言)的進展。VoiceXML的主要目標是要將Web上已有的大量應用、豐富的內容,讓交互式語音界面也能夠全部享受。Web服務器處理一個來自客戶端應用的請求,這一請求經過了VoiceXML解釋程序和VoiceXML解釋程序語境處理,作為響應,服務器產生出VoiceXML文件,在回復當中,要經過VoiceXML解釋程序的處理。VoiceXML 1.0規(guī)范基于XML,為語音和電話應用的開發(fā)者、服務提供商和設備制造商提供了一個智能化的API。VoiceXML的標準化將簡化Web上具有語音響應服務的個性化界面的創(chuàng)建,使人們能夠通過語音和電話訪問網站上的信息和服務,像今天通過CGI腳本一樣檢索中心數據庫,訪問企業(yè)內部網,制造新的語音訪問設備。VoiceXML的執(zhí)行平臺上面加載了相應的軟件和硬件,例如,ASR、TTS,從而實現語音的識別以及文本和語音之間的轉化。

目前,IBM、Nokia、Lucent、Motorola等著名廠商都已經開發(fā)出相應支持VoiceXML的產品,但現在的ASR和TTS系統(tǒng)大多還不能支持中文。

本文由專業(yè)服務器托管——騰佑科技提供,推薦服務網通服務器租用

點擊展開全文

騰佑科技(mubashirfilms.com)成立于2009年,總部位于河南鄭州,是一家集互聯(lián)網基礎設施及軟硬件于一體化的高新技術企業(yè),具有IDC/ISP/ICP/云牌照、雙軟等資質,并擁有多個國家版權局認證。公司自成立以來,一直致力于發(fā)展互聯(lián)網IDC數據中心DataCenter、云計算Cloud、大數據BigDate、人工智能AI、內容加速CDN、互聯(lián)網安全、軟件定制開發(fā)等產品服務及行業(yè)客戶技術一體化智能解決方案;2018年成為百度智能云AI河南服務中心。

售前咨詢熱線:400-996-8756

備案提交:0371-89913068

售后客服:0371-89913000

熱門活動

百度云服務中心
  • 熱門資訊
  • 隨便看看