文語通

文語通

文檔朗讀軟件
文語通是一款強大的文檔朗讀軟件,可以将常見的文檔格式(如Doc、TXT及Html等)以清晰、自然、流暢的語音朗讀出來。[1]支持主流的操作系統,服務器端支持Windows、Unix、Linux等操作系統,客戶端支持Microsoft Windows、SUN Solaris、REDHAT Linux、SUSE Linux等操作系統。
    軟件名稱:文語通 軟件平台: 軟件語言:中文 開發商: 軟件授權: 軟件版本: 軟件大小:651MB 運行環境:Win9X/WinXP/Win2000

主要功能

1、程序運行就自動初始化并加載服務;

2、可以通過浏覽文件批量添加.txt文本文件,内碼支持gb2312GBKBIG5UTF8,(注意單個.txt文本要求小于64K,這是合成系統程序本身的限制,考慮到語言的連貫性問題,編程時并沒有采用自動分割大txt文件的方法,需要大家手動分割txt文件小于64KB);

3、合成過程中時間等狀态實時顯示,可實現一邊合成一邊朗讀的“實時預覽模式”(如隻要求生成wav文件則請選擇“主線程調用方式”);

4、批量生成同名的wav文件後如有需要請大家用别的音頻轉換程序轉成自己所需要的如mp3等模式。

使用感覺

感覺很不錯的朗讀軟件,它的發音引擎很好,聽起來很舒服,而且比别的朗讀軟件相比更自然。

它朗讀中文文章感覺很好,英文的單詞發音非常棒(隻是如果是英文文章朗讀起來就不是很自然了,因為它是一個單詞一個單詞朗讀的)。

還能使“變看為聽”,這樣如果您看一篇文章累了的時候,不妨讓它“讀”給您聽,豈不很惬意。

鮮明特點

方便靈活的應用架構

基于TCP/IP的高效網絡語音合成服務和集中式的資源管理機制,形成客戶端-資源管理器-服務器有機結合的體系架構,構建可靈活伸縮的方案,其高可用性曆經衆多重點行業大規模關鍵業務的應用檢驗,确保提供值得信賴的7×24小時不間斷自動化語音服務。并支持分布式應用架構(專利技術),負責文本分析和預處理的前端與負責語音合成的後端可以分别部署在異地服務器上,遠程網絡之間傳輸的隻是經分析标注的文本信息,從而極大降低語音應用的網絡帶寬要求,非常适合基于互聯網的大規模分布式語音應用。

InterPhonicSDK針對不同開發工具,不同集成要求和方案,提供多種形式的開發接口,包括:标準開發接口(DLL)、COM組件、SAPI開發接口等,開發者可以根據實際需要靈活選擇。提供豐富的開發例程和文檔,幫助合作夥伴加速語音應用開發過程。

提供豐富完善的動态參數設置與調節功能和工具,幫助用戶對語音合成效果進行靈活高效的控制與管理。提供對全局參數(如音量、語速、音高等)、用戶詞典、用戶規則、定制資源包統一進行配置和管理的工具;數字、标點符号、英文發音方式的設定;中英文加詞功能,可以指定每個字詞的拼音或音标等等;提供統一的簡單易用圖形化用戶界面進行操作設定,并可通過API參數進行動态設置和調整,還支持以CSSML(中文語音合成标記語言)進行标記、描述和控制。

支持開放式标準

全面支持中文語音合成系統通用技術标準(GB/T21024-2007),遵循标準規定的術語定義、分類标準、數據交換格式标準和應用規範。

支持語音合成标記語言(SSML:Speech Synthesis Markup Language),它是W3C的語音接口框架的一部分,是關于語音應用和在萬維網上構建語音應用的一套規範,通過SSML,人們可以更多的通過移動電話、桌面計算機和其他設備來聆聽合成語音,把計算和信息傳輸延伸到全球每個角落。

支持媒體資源控制協議(MRCP:Media Resource Control Protocol),它由IETF發布,定義了媒體服務器和網絡語音資源(包括語音識别和語音合成服務器)之間的接口标準。

高效便捷的增強工具集

科大訊飛在長期幫助客戶進行應用開發和效果優化的過程中,積累了豐富的實踐經驗,在此基礎上逐步形成了一系列使用便捷的高效組件,如離線語音應用工具、CSSML可視化編輯工具、DOC/XLS文本格式轉換工具等。靈活運用這些工具有助于加速應用開發,優化合成效果、方便系統維護和技術支持。

字符集、語音數據格式支持

全面支持GB2312、GBK、BIG5、GB18030、UTF-8和UNICODE編碼字符集,自動識别UNICODE文本;支持直接輸出多種采樣率的語音數據格式(包括6K/8K/11K/16K)的線性Wav、A/U率Wav和Vox等多種格式的語音數據。

廣泛的平台支持

支持主流的操作系統,服務器端支持Windows、Unix、Linux等操作系統,客戶端支持Microsoft Windows、SUN Solaris、REDHAT Linux、SUSE Linux等操作系統。

與業内知名的相關平台和設備商均有過成功的集成案例。通過與衆多平台和設備提供商、系統集成商及軟件開發商的緊密合作,能夠保證向用戶提供圍繞語音應用全程的專業服務。

CSSML,效果提升更自如

CSSML(Chinese Speech Synthesis Markup Language)是由科大訊飛提出并牽頭制訂的中文語音數據描述規範。該标準得到了國家863專家組、國家信标委和國家技術監督局的大力關注與支持,2005年正式通過國家标準化組織的評審,成為中文語音合成技術标準與規範的重要内容。CSSML針對中文語音應用設計和擴展,可以對多種特性進行靈活标注與控制,并與SSML兼容。

InterPhonic提供業界創新的預錄音統一管理功能,将預錄音作為語音合成系統的資源,并通過提示音智能匹配和合成模闆等方式使預錄音與合成音匹配更加容易、銜接更加流暢,同時避免頻繁處理提示音播放與語音合成的切換與過渡問題,簡化應用流程的複雜程度,進一步提高服務效果與質量。

InterPhonic提供業界首創的背景音功能,通過系統提供的簡單易用工具,可以便捷高效的添加背景音樂,調整背景音樂和合成語音的音量對比,并可直接試聽實際效果,使語音服務更加親切自然。

相關詞條

相關搜索

其它詞條