WAV:專門為Windows開發的标準數字音頻文件-中文百科頻道

簡述

WAV文件是在PC機平台上很常見的、最經典的多媒體音頻文件，最早于1991年8月出現在Windows3.1操作系統上，文件擴展名為WAV，是WaveForm的簡寫，也稱為波形文件，可直接存儲聲音波形，還原的波形曲線十分逼真。WAV文件格式簡稱WAV格式是一種存儲聲音波形的數字音頻格式，是由微軟公司和IBM聯合設計的，經過了多次修訂，可用于Windows，Macintosh，Linux等多種操作系統。WAV支持多種音頻數字、取樣頻率和聲道，标準格式化的WAV文件和CD格式一樣，也是44.1kHz的取樣頻率，16位量化數字，因此聲音文件質量和CD相差無幾。WAV的特點如下：真實記錄自然聲波形，基本無數據壓縮，數據量大。

一般來說，由WAV文件還原而成的聲音的音質取決于聲音卡采樣樣本的尺寸，采樣頻率越高，音質就越好，但開銷就越大，WAV文件也就越大。

存儲過程

聲源發出的聲波通過話筒被轉換成連續變化的電信号，經過放大、抗混疊濾波後，按固定的頻率進行采樣，每個樣本是在一個采樣周期内檢測到的電信号幅度值；接下來将其由模拟電信号量化為由二進制數表示的積分值；最後編碼并存儲為音頻流數據。有的應用為了節省存儲空間，存儲前，還要對采樣數據先進行壓縮。

文件結構

在Windows環境下，大部分多媒體文件都是按照資源互換文件格式（Resources lnterchange File Format）存放信息，簡稱RIFF格式。構成RIFF文件的基本單位稱之為塊（chunk）。每個RIFF文檔是由若幹個塊構成。每個塊（chunk）由塊标識、塊長度及數據等三部分所組成。

其中，塊标識保存的是由4個ASCII碼字符組成的塊名字。如不滿4個字符則在右邊以空格充填。塊長度字段。

應用

RIFF塊

文件格式類型“WAVE”

fmt塊

fact塊（壓縮編碼格式要含有該塊）

data塊

占4個字節，保存的是當前塊數據的長度，不包括塊标識和塊長度字段。所以一個塊的實際長度為塊長度字段内的數值加8。RIFF格式規定，隻有RIFF及LIST塊可以含有子塊，其它的塊不允許包含子塊。一個RIFF格式文檔本身就是一個塊。其前4個字節為文檔标識“RIFF”，同時也是RIFF的塊标識，标明該文檔是一個有效的RIFF文檔；第二部分為文件的數據長度，占4個字節，其數值為文件長度-8；第三部分為RIFF塊數據，其中，前4個字節為文件格式類型标識，如：“WAVE”，“AVI”等，後面其它部分為RIFF塊的子塊。

WAV文件采用的是RIFF格式結構。至少是由3個塊構成，分别是RIFF、fmt和Data。所有基于壓縮編碼的WAV文件必須含有fact塊。此外所有其它塊都是可選的。塊mt，Data及fact均為RIFF塊的子塊。WAV文件的文件格式類型标識符為“WAVE”。基本結構如表1。

編碼

編碼包括了兩方面内容，一是按一定格式存儲數據，二是采用一定的算法壓縮數據。WAV格式對音頻流的編碼沒有硬性規定，支持非壓縮的PCM（Puls Code Modulation）脈沖編碼調制格式，還支持壓縮型的微軟自适應差分脈沖編碼調制Microsoft ADPCM（Adaptive Differential Puls Code Modulation）、國際電報聯盟（International Telegraph Union）制定的語音壓縮标準ITU G.711a-law、ITU G.711-law、IMA ADPCM、ITU G.723ADPCM（Yamaha）、GSM 6.10、ITU G.721 ADPCM編碼和其它壓縮算法。MP3編碼同樣也可以運用在WAV中，隻要安裝相應的Decode，就可以播放WAV中的MP3音樂。

PCM編碼是直接存儲聲波采樣被量化後所産生的非壓縮數據，故被視為單純的無損耗編碼格式，其優點是可獲得高質量的音頻信号。基于PCM編碼的WAV格式是最基本的WAV格式，被聲卡直接支持，能直接存儲采樣的聲音數據，所存儲的數據能直接通過聲卡播放，還原的波形曲線與原始聲音波形十分接近，播放的聲音質量是一流的，在Windows平台下被支持得最好，常常被用作在其它編碼的文件之間轉換的中間文件。PCM的缺點是文件體積過大，不适合長時間記錄。正因為如此，又出現了多種在PCM編碼的基礎上經改進發展起來的編碼格式，如：DPCM，ADPCM編碼等。

影響因素

采樣頻率：每秒鐘采集音頻數據的次數。采樣頻率越高，音頻保真度越高。計算機廣泛配置的16位聲卡，使用的采樣頻率通常包括11025Hz、22050Hz、44100Hz和48000Hz四種，其中，采用11025Hz采樣的聲音效果相當于電話聲音的效果；采用22050HZ采樣的聲音效果相當于FM調頻廣播的效果；采用44100HZ采樣的聲音效果相當于CD聲音的效果。

采樣位數（振幅采樣精度）：即采樣值或取樣值，是用來衡量聲音波動變化的一個參數，也是聲卡的分辨率。它的數值越大，分辨率也就越高，發出聲音的能力越強。目前計算機中配置的16位聲卡的采樣位數包括8位和16位兩種。

聲道數：有單聲道和立體聲之分，單聲道的聲音隻能使用一個喇叭發聲（有的聲卡也将單聲道信息處理成兩個喇叭同時輸出），立體聲的WAV可以使兩個喇叭都發聲（一般左右聲道有分工），這樣更能感受到音頻信息的空間效果。顯然，雙聲道數據還原特性更接近人們的聽力習慣，但采集得到的數據量會增加1倍。