WAV

WAV

專門為Windows開發的标準數字音頻文件
WAV是最常見的聲音文件格式之一,是微軟公司專門為Windows開發的一種标準數字音頻文件,該文件能記錄各種單聲道或立體聲的聲音信息,并能保證聲音不失真。但WAV文件有一個緻命的缺點,就是它所占用的磁盤空間太大(每分鐘的音樂大約需要12兆磁盤空間)。它符合資源互換文件格式(RIFF)規範,用于保存Windows平台的音頻信息資源,被Windows平台及其應用程序所廣泛支持。Wave格式支持MSADPCM、CCITT A律、CCITT μ律和其他壓縮算法,支持多種音頻位數、采樣頻率和聲道,是PC機上最為流行的聲音文件格式;但其文件尺寸較大,多用于存儲簡短的聲音片段。
    中文名:波形聲音文件 外文名:WAV 所屬學科:計算機科學技術 研發公司:Microsoft 實質:一種标準數字音頻文件 特點:真實記錄自然聲波形等 擴展名:wav

簡述

WAV文件是在PC機平台上很常見的、最經典的多媒體音頻文件,最早于1991年8月出現在Windows3.1操作系統上,文件擴展名為WAV,是WaveForm的簡寫,也稱為波形文件,可直接存儲聲音波形,還原的波形曲線十分逼真。WAV文件格式簡稱WAV格式是一種存儲聲音波形的數字音頻格式,是由微軟公司和IBM聯合設計的,經過了多次修訂,可用于Windows,Macintosh,Linux等多種操作系統。WAV支持多種音頻數字、取樣頻率和聲道,标準格式化的WAV文件和CD格式一樣,也是44.1kHz的取樣頻率,16位量化數字,因此聲音文件質量和CD相差無幾。WAV的特點如下:真實記錄自然聲波形,基本無數據壓縮,數據量大。

一般來說,由WAV文件還原而成的聲音的音質取決于聲音卡采樣樣本的尺寸,采樣頻率越高,音質就越好,但開銷就越大,WAV文件也就越大。

存儲過程

聲源發出的聲波通過話筒被轉換成連續變化的電信号,經過放大、抗混疊濾波後,按固定的頻率進行采樣,每個樣本是在一個采樣周期内檢測到的電信号幅度值;接下來将其由模拟電信号量化為由二進制數表示的積分值;最後編碼并存儲為音頻流數據。有的應用為了節省存儲空間,存儲前,還要對采樣數據先進行壓縮。

文件結構

在Windows環境下,大部分多媒體文件都是按照資源互換文件格式(Resources lnterchange File Format)存放信息,簡稱RIFF格式。構成RIFF文件的基本單位稱之為塊(chunk)。每個RIFF文檔是由若幹個塊構成。每個塊(chunk)由塊标識、塊長度及數據等三部分所組成。

其中,塊标識保存的是由4個ASCII碼字符組成的塊名字。如不滿4個字符則在右邊以空格充填。塊長度字段。

應用

RIFF塊

文件格式類型“WAVE”

fmt塊

fact塊(壓縮編碼格式要含有該塊)

data塊

表1WAV文件結構

占4個字節,保存的是當前塊數據的長度,不包括塊标識和塊長度字段。所以一個塊的實際長度為塊長度字段内的數值加8。RIFF格式規定,隻有RIFF及LIST塊可以含有子塊,其它的塊不允許包含子塊。一個RIFF格式文檔本身就是一個塊。其前4個字節為文檔标識“RIFF”,同時也是RIFF的塊标識,标明該文檔是一個有效的RIFF文檔;第二部分為文件的數據長度,占4個字節,其數值為文件長度-8;第三部分為RIFF塊數據,其中,前4個字節為文件格式類型标識,如:“WAVE”,“AVI”等,後面其它部分為RIFF塊的子塊。

WAV文件采用的是RIFF格式結構。至少是由3個塊構成,分别是RIFF、fmt和Data。所有基于壓縮編碼的WAV文件必須含有fact塊。此外所有其它塊都是可選的。塊mt,Data及fact均為RIFF塊的子塊。WAV文件的文件格式類型标識符為“WAVE”。基本結構如表1。

編碼

編碼包括了兩方面内容,一是按一定格式存儲數據,二是采用一定的算法壓縮數據。WAV格式對音頻流的編碼沒有硬性規定,支持非壓縮的PCM(Puls Code Modulation)脈沖編碼調制格式,還支持壓縮型的微軟自适應差分脈沖編碼調制Microsoft ADPCM(Adaptive Differential Puls Code Modulation)、國際電報聯盟(International Telegraph Union)制定的語音壓縮标準ITU G.711a-law、ITU G.711-law、IMA ADPCM、ITU G.723ADPCM(Yamaha)、GSM 6.10、ITU G.721 ADPCM編碼和其它壓縮算法。MP3編碼同樣也可以運用在WAV中,隻要安裝相應的Decode,就可以播放WAV中的MP3音樂。

PCM編碼是直接存儲聲波采樣被量化後所産生的非壓縮數據,故被視為單純的無損耗編碼格式,其優點是可獲得高質量的音頻信号。基于PCM編碼的WAV格式是最基本的WAV格式,被聲卡直接支持,能直接存儲采樣的聲音數據,所存儲的數據能直接通過聲卡播放,還原的波形曲線與原始聲音波形十分接近,播放的聲音質量是一流的,在Windows平台下被支持得最好,常常被用作在其它編碼的文件之間轉換的中間文件。PCM的缺點是文件體積過大,不适合長時間記錄。正因為如此,又出現了多種在PCM編碼的基礎上經改進發展起來的編碼格式,如:DPCM,ADPCM編碼等。

影響因素

采樣頻率:每秒鐘采集音頻數據的次數。采樣頻率越高,音頻保真度越高。計算機廣泛配置的16位聲卡,使用的采樣頻率通常包括11025Hz、22050Hz、44100Hz和48000Hz四種,其中,采用11025Hz采樣的聲音效果相當于電話聲音的效果;采用22050HZ采樣的聲音效果相當于FM調頻廣播的效果;采用44100HZ采樣的聲音效果相當于CD聲音的效果。

采樣位數(振幅采樣精度):即采樣值或取樣值,是用來衡量聲音波動變化的一個參數,也是聲卡的分辨率。它的數值越大,分辨率也就越高,發出聲音的能力越強。目前計算機中配置的16位聲卡的采樣位數包括8位和16位兩種。

聲道數:有單聲道和立體聲之分,單聲道的聲音隻能使用一個喇叭發聲(有的聲卡也将單聲道信息處理成兩個喇叭同時輸出),立體聲的WAV可以使兩個喇叭都發聲(一般左右聲道有分工),這樣更能感受到音頻信息的空間效果。顯然,雙聲道數據還原特性更接近人們的聽力習慣,但采集得到的數據量會增加1倍。

适用範圍

一般來說,采樣的樣本尺度(信息量)越大,采樣頻率越高,音質就越好,但波形音頻的開銷就越大。由于一般講話以8位11.025KHz采樣就能較好地還原,因此,波形音頻一般适用于以下幾種場合:

1、播放的聲音是講話語音,音樂效果對聲音的質量要求不太高的場合。

2、需要從CD-ROM光盤驅動器同時加載聲音和其他數據,聲音數據的傳輸不能獨占處理時間的場合。

3、需要在PC硬盤中存儲的聲音數據在1分以下以及可用存儲空間足夠的時候。

上一篇:諾日朗瀑布

下一篇:鄭州輕工業學院輕工職業學院

相關詞條

相關搜索

其它詞條