AVI

AVI

音頻視頻交錯格式
AVI英文全稱為Audio Video Interleaved,即音頻視頻交錯格式,是微軟公司于1992年11月推出、作為其Windows視頻軟件一部分的一種多媒體容器格式。AVI文件将音頻(語音)和視頻(影像)數據包含在一個文件容器中,允許音視頻同步回放。類似DVD視頻格式,AVI文件支持多個音視頻流。AVI信息主要應用在多媒體光盤上,用來保存電視、電影等各種影像信息。[1]
  • 中文名:音頻視頻交錯格式
  • 外文名:Audio Video Interleaved
  • 别名:
  • 屬性:多媒體容器格式
  • 類比:DVD視頻格式

發展曆程

它于1992年被Microsoft公司推出,随Windows 3.1一起被人們所認識和熟知。所謂“音頻視頻交錯”,就是可以将視頻和音頻交織在一起進行同步播放。這種視頻格式的優點是可以跨多個平台使用,其缺點是體積過于龐大,而且更加糟糕的是壓縮标準不統一,最普遍的現象就是高版本Windows媒體播放器播放不了采用早期編碼編輯的AVI格式視頻,而低版本Windows媒體播放器又播放不了采用最新編碼編輯的AVI格式視頻,所以我們在進行一些AVI格式的視頻播放時常會出現由于視頻編碼問題而造成的視頻不能播放或即使能夠播放,但存在不能調節播放進度和播放時隻有聲音沒有圖像等一些莫名其妙的問題,如果用戶在進行AVI格式的視頻播放時遇到了這些問題,可以通過下載相應的解碼器來解決。AVI是視頻文件的常見封裝格式,比如一些遊戲、教育軟件的片頭,多媒體光盤中,都會有不少的AVI。在Windows各版本操作系統裡都能直接播放AVI,而且它自己的格式也有好幾種,最常見的有Intel Indeo(R)Video R3.2.Microsoft video 等。

AVI含三部分:文件頭、數據塊和索引塊。

其中數據塊包含實際數據流,即圖像和聲音序列數據。這是文件的主體,也是決定文件容量的主要部分。視頻文件的大小等于該文件的數據率乘以該視頻播放的時間長度,索引塊包括數據塊列表和它們在文件中的位置,以提供文件内數據随機存取能力。文件頭包括文件的通用信息,定義數據格式,所用的壓縮算法等參數。

nAVI格式

nAVI是newAVI的縮寫,是一個名為ShadowRealm的地下組織發展起來的一種新視頻格式(與我們上面所說的AVI格式沒有太大聯系)。它是由Microsoft ASF壓縮算法的修改而來的,但是又與下面介紹的網絡影像視頻中的ASF視頻格式有所區别,它以犧牲原有ASF視頻文件視頻“流”特性為代價而通過增加幀率來大幅提高ASF視頻文件的清晰度。

DV-AVI格式

DV的英文全稱是Digital Video Format,是由索尼、松下、JVC等多家廠商聯合提出的一種家用數字視頻格式。數碼攝像機就是使用這種格式記錄視頻數據的。它可以通過電腦的IEEE 1394接口傳輸視頻數據到電腦,也可以将電腦中編輯好的的視頻數據回錄到數碼攝像機中。這種視頻格式的文件擴展名一般是.avi,所以也叫DV-AVI格式。

2007年10月,AVI圖像反轉的原因很可能是暴風影音和Windows Media Player沖突,下載一個完整的DVIX解碼器可以解決。

1992年初Microsoft公司推出了AVI技術及其應用軟件VFW(Video for Windows)。在AVI文件中,運動圖像和伴音數據是以交織的方式存儲,并獨立于硬件設備。這種按交替方式組織音頻和視像數據的方式可使得讀取視頻數據流時能更有效地從存儲媒介得到連續的信息。構成一個AVI文件的主要參數包括視像參數、伴音參數和壓縮參數等:

AVI沒有MPEG這麼複雜,從Windows 3.1時代,它就已經面世了。它最直接的優點就是兼容好、調用方便而且圖象質量好,因此也常常與DVD相并稱。但它的缺點也是十分明顯的:體積大。也是因為這一點,我們才看到了MPEG-1和MPEG-4的誕生。2小時影像的AVI文件的體積與MPEG-2相差無幾,不過這隻是針對标準分辨率而言的:根據不同的應用要求,AVI的分辨率可以随意調。窗口越大,文件的數據量也就越大。降低分辨率可以大幅減低它的體積,但圖象質量就必然受損。與MPEG-2格式文件體積差不多的情況下,AVI格式的視頻質量相對而言要差不少,但制作起來對電腦的配置要求不高,經常有人先錄制好了AVI格式的視頻,再轉換為其他格式。

數字視頻

AVI及其播放器VFW已成為了PC機上最常用的視頻數據格式,是由于其具有如下的一些顯著特點:

一、提供無硬件視頻回放功能

AVI格式和VFW軟件雖然是為當前的MPC設計的,但它也可以不斷提高以适應MPC的發展。根據AVI格式的參數,其視窗的大小和幀率可以根據播放環境的硬件能力和處理速度進行調整。在低檔MPC機上或在網絡上播放時,VFW的視窗可以很小,色彩數和幀率可以很低;而在Pentium級系統上,對于64K色、320×240的壓縮視頻數據可實現每秒25幀的回放速率。這樣,VFW就可以适用于不同的硬件平台,使用戶可以在普通的MPC上進行數字視頻信息的編輯和重放,而不需要昂貴的專門硬件設備。

二、實現同步控制和實時播放

通過同步控制參數,AVI可以通過自調整來适應重放環境,如果MPC的處理能力不夠高,而AVI文件的數據率又較大,在Windows環境下播放該AVI文件時,播放器可以通過丢掉某些幀,調整AVI的實際播放數據率來達到視頻、音頻同步的效果。

三、可以高效地播放存儲在硬盤和光盤上的AVI文件

由于AVI數據的交叉存儲,VFW播放AVI數據時隻需占用有限的内存空間,因為播放程序可以一邊讀取硬盤或光盤上的視頻數據一邊播放,而無需預先把容量很大的視頻數據加載到内存中。在播放AVI視頻數據時,隻需在指定的時間内訪問少量的視頻圖像和部分音頻數據。這種方式不僅可以提高系統的工作效率,同時也可以實現迅速地加載和快速地啟動播放程序,減少播放AVI視頻數據時用戶的等待時間。

四、提供了開放的AVI數字視頻文件結構

AVI文件結構不僅解決了音頻和視頻的同步問題,而且具有通用和開放的特點。它可以在任何Windows環境下工作,而且還具有擴展環境的功能。用戶可以開發自己的AVI視頻文件,在Windows環境下可随時調用。

五、AVI文件可以再編輯

AVI一般采用幀内有損壓縮,可以用一般的視頻編輯軟件如Adobe Premiere或MediaStudio進行再編輯和處理。

六.AVI大緻分為4種類型

1:H.264/MPEG-4AVC VideoFormat(*.avi) 是MPEG4視頻格式的擴展。具有更高的壓縮率。

2:AVI —Audio-Video.lnterleaved(*.avi) 是将與語言同步組成在一起的格式。

3:Lossless.uncompressed.AVI(*.avi ) 是主要用于用戶視頻編輯。

4:AVI:with DVcodec(*.avi) 是主要用于用戶視頻編輯格式,也是比較老的格式。

相關參數

視像參數

1.視窗尺寸(Video size):根據不同的應用要求,AVI的視窗大小或分辨率可按4:3的比例或随意調整:大到全屏720×576,小到160×120甚至更低。窗口越大,視頻文件的數據量越大。

2.幀率(Frames Per Second,即fps):幀率也可以調整,而且與數據量成正比。不同的幀率會産生不同的畫面連續效果。

伴音參數

在AVI文件中,視像和伴音是分别存儲的,因此可以把一段視頻中的視像與另一段視頻中的伴音組合在一起。AVI文件與WAV文件密切相關,因為WAV文件是AVI文件中伴音信号的來源。伴音的基本參數也即WAV文件格式的參數,除此以外,AVI文件還包括與音頻有關的其他參數:

1.視像與伴音的交織參數(Interlace Audio Every X Frames)AVI格式中每X幀交織存儲的音頻信号,也即伴音和視像交替的頻率X是可調參數,X的最小值是一幀,即每個視頻幀與音頻數據交織組織,這是CD-ROM上使用的默認值。交織參數越小,回放AVI文件時讀到内存中的數據流越少,回放越容易連續。因此,如果AVI文件的存儲平台的數據傳輸率較大,則交錯參數可設置得高一些。當AVI文件存儲在硬盤上時,也即從硬盤上讀AVI文件進行播放時,可以使用大一些的交織頻率,如幾幀,甚至1秒。

2.同步控制(Synchronization)

在AVI文件中,視像和伴音是同步得很好的。但在MPC中回放AVI文件時則有可能出現視像和伴音不同步的現象。

壓縮參數

在采集原始模拟視頻時可以用不壓縮的方式,這樣可以獲得最優秀的質量。編輯後應根據應用環境選擇合适的壓縮參數。

展開結構

AVI(Audio Video Interleaved的縮寫)是一種RIFF(Resource Interchange File Format的縮寫)文件格式,多用于音視頻捕捉、編輯、回放等應用程序中。通常情況下,一個AVI文件可以包含多個不同類型的媒體流(典型的情況下有一個音頻流和一個視頻流),不過含有單一音頻流或單一視頻流的AVI文件也是合法的。AVI可以算是Windows操作系統上最基本的、也是最常用的一種媒體文件格式。

先來介紹RIFF文件格式。RIFF文件使用四字符碼FOURCC(four-character code)來表征數據類型,比如‘RIFF’、‘AVI’、‘LIST’等。注意,Windows操作系統使用的字節順序是little-endian,DWORD類型0xA8B9C0D1在文件(或内存)中存儲順序為: D1 C0 B9 A8。另外,四字符碼中像‘AVI ’一樣含有空格也是合法的。

最開始的4個字節是一個四字符碼‘RIFF’,表示這是一個RIFF文件;緊跟着後面用4個字節表示此RIFF文件的大小;然後又是一個四字符碼說明文件的具體類型(比如AVI、WAVE等);最後就是實際的數據。注意文件大小值的計算方法為:實際數據長度 +4(文件類型域的大小);也就是說,文件大小的值不包括‘RIFF’域和“文件大小”域本身的大小。

RIFF文件的實際數據中,通常還使用了列表(List)和塊(Chunk)的形式來組織。列表可以嵌套子列表和塊。其中,列表的結構為:‘LIST’ listSize listType listData ——‘LIST’是一個四字符碼,表示這是一個列表;listSize占用4字節,記錄了整個列表的大小;listType也是一個四字符碼,表示本列表的具體類型;listData就是實際的列表數據。注意listSize值的計算方法為:實際的列表數據長度 +4(listType域的大小);也就是說listSize值不包括‘LIST’域和listSize域本身的大小。再來看塊的結構:ckID ckSize ckData ——ckID是一個表示塊類型的四字符碼;ckSize占用4字節,記錄了整個塊的大小;ckData為實際的塊數據。注意ckSize值指的是實際的塊數據長度,而不包括ckID域和ckSize域本身的大小。(注意:在下面的内容中,将以LIST (listType (listData))的形式來表示一個列表,以ckID (ckData) 的形式來表示一個塊,如[ optional element ]中括号中的元素表示為可選項。)

文件格式

接下來介紹AVI文件格式。AVI文件類型用一個四字符碼‘AVI ’來表示。整個AVI文件的結構為:一個RIFF頭 + 兩個列表(一個用于描述媒體流格式、一個用于保存媒體流數據) + 一個可選的索引塊。AVI文件的展開結構大緻如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

/*

* heres the general layout of an AVI riff file (new format)

*

* RIFF (3F??????) AVI <- not more than 1 GB in size

* LIST (size) hdrl

* avih (0038)

* LIST (size) strl

* strh (0038)

* strf (????)

* indx (3ff8) <- size may vary,should be sector sized

* LIST (size) strl

* strh (0038)

* strf (????)

* indx (3ff8) <- size may vary,should be sector sized

* LIST (size) odml

* dmlh (????)

* JUNK (size) <- fill to align to sector - 12

* LIST (7f??????) movi <- aligned on sector - 12

* 00dc (size) <- sector aligned

* 01wb (size) <- sector aligned

* ix00 (size) <- sector aligned

* idx1 (00??????) <- sector aligned

* RIFF (7F??????) AVIX

* JUNK (size) <- fill to align to sector -12

* LIST (size) movi

* 00dc (size) <- sector aligned

* RIFF (7F??????) AVIX <- not more than 2GB in size

* JUNK (size) <- fill to align to sector - 12

* LIST (size) movi

* 00dc (size) <- sector aligned

*

*-===================================================================*/

'hdrl'

首先,RIFF ('AVI'…)表征了AVI文件類型。然後就是AVI文件必需的第一個列表——'hdrl'列表,用于描述AVI文件中各個流的格式信息(AVI文件中的每一路媒體數據都稱為一個流)。'hdrl'列表嵌套了一系列塊和子列表——首先是一個'avih'塊,用于記錄AVI文件的全局信息,比如流的數量、視頻圖像的寬和高等,可以使用一個AVIMAINHEADER數據結構來操作:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

typedefstruct_avimainheader{

FOURCCfcc;//必須為‘avih’

DWORDcb;//本數據結構的大小,不包括最初的8個字節(fcc和cb兩個域)

DWORDdwMicroSecPerFrame;//視頻幀間隔時間(以微秒為單位)

DWORDdwMaxBytesPerSec;//這個AVI文件的最大數據率

DWORDdwPaddingGranularity;//數據填充的粒度

DWORDdwFlags;//AVI文件的全局标記,比如是否含有索引塊等

DWORDdwTotalFrames;//總幀數

DWORDdwInitialFrames;//為交互格式指定初始幀數(非交互格式應該指定為0)

DWORDdwStreams;//本文件包含的流的個數

DWORDdwSuggestedBufferSize;//建議讀取本文件的緩存大小(應能容納最大的塊)

DWORDdwWidth;//視頻圖像的寬(以像素為單位)

DWORDdwHeight;//視頻圖像的高(以像素為單位)

DWORDdwReserved;//保留

}AVIMAINHEADER;

'strl'

然後,就是一個或多個'strl'子列表。(文件中有多少個流,這裡就對應有多少個'strl'子列表。)每個'strl'子列表至少包含一個'strh'塊和一個'strf'塊,而'strd'塊(保存編解碼器需要的一些配置信息)和'strn'塊(保存流的名字)是可選的。首先是'strh'塊,用于說明這個流的頭信息,可以使用一個AVISTREAMHEADER數據結構來操作:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

typedef struct _avistreamheader {

FOURCC fcc; // 必須為‘strh’

FOURCC fccType; // 流的類型:‘auds’(音頻流)、‘vids’(視頻流)、

//‘mids’(MIDI流)、‘txts’(文字流)

FOURCC fccHandler; // 指定流的處理者,對于音視頻來說就是解碼器

DWORD dwFlags; // 标記:是否允許這個流輸出?調色闆是否變化?

WORD wPriority; // 流的優先級(當有多個相同類型的流時優先級最高的為默認流)

WORD wLanguage;

DWORD dwInitialFrames; // 為交互格式指定初始幀數

DWORD dwScale; // 這個流使用的時間尺度

DWORD dwRate;

DWORD dwStart; // 流的開始時間

DWORD dwLength; // 流的長度(單位與dwScale和dwRate的定義有關)

讀取這個流數據建議使用的緩存大小

DWORD dwQuality; // 流數據的質量指标(0 ~ 10,000)

DWORD dwSampleSize; // Sample的大小

struct {

short int left;

short int top;

short int right;

short int bottom;

} rcFrame; // 指定這個流(視頻流或文字流)在視頻主窗口中的顯示位置

//視頻主窗口由AⅥMAINHEADER結構中的dwWidth和dwHeight決定

} AVISTREAMHEADER;

'strf'

然後是'strf'塊,用于說明流的具體格式。如果是視頻流,則使用一個BITMAPINFO數據結構來描述;如果是音頻流,則使用一個WAVEFORMATEX數據結構來描述。

當AVI文件中的所有流都使用一個'strl'子列表說明了以後(注意:'strl'子列表出現的順序與媒體流的編号是對應的,比如第一個'strl'子列表說明的是第一個流(Stream 0),第二個'strl'子列表說明的是第二個流(Stream 1),以此類推),'hdrl'列表的任務也就完成了,随後跟着的就是AVI文件必需的第二個列表——'movi'列表,用于保存真正的媒體流數據(視頻圖像幀數據或音頻采樣數據等)。那麼,怎麼來組織這些數據呢?可以将數據塊直接嵌在'movi'列表裡面,也可以将幾個數據塊分組成一個'rec'列表後再編排進'movi'列表。(注意:在讀取AVI文件内容時,建議将一個'rec'列表中的所有數據塊一次性讀出。)但是,當AVI文件中包含有多個流的時候,數據塊與數據塊之間如何來區别呢?于是數據塊使用了一個四字符碼來表征它的類型,這個四字符碼由2個字節的類型碼和2個字節的流編号組成。标準的類型碼定義如下:'db'(非壓縮視頻幀)、'dc'(壓縮視頻幀)、'pc'(改用新的調色闆)、'wb'(音縮視頻)。比如第一個流(Stream 0)是音頻,則表征音頻數據塊的四字符碼為'00wb';第二個流(Stream 1)是視頻,則表征視頻數據塊的四字符碼為'01db'或'01dc'。對于視頻數據來說,在AVI數據序列中間還可以定義一個新的調色闆,每個改變的調色闆數據塊用‘xxpc’來表征,新的調色闆使用一個數據結構AVIPALCHANGE來定義。(注意:如果一個流的調色辦中途可能改變,則應在這個流格式的描述中,也就是AVISTREAMHEADER結構的dwFlags中包含一個AVISF_VIDEO_PALCHANGES标記。)另外,文字流數據塊可以使用随意的類型碼表征。

最後,緊跟在'hdrl'列表和'movi'列表之後的,就是AVI文件可選的索引塊。這個索引塊為AVI文件中每一個媒體數據塊進行索引,并且記錄它們在文件中的偏移(可能相對于'movi'列表,也可能相對于AVI文件開頭)。索引塊使用一個四字符碼'idx1'來表征,索引信息使用一個數據結構來AVIOLDINDEX定義。

1

2

3

4

5

6

7

8

9

typedefstruct_avioldindex{

FOURCCfcc;//必須為‘idx1’

struct_avioldindex_entry{

DWORDdwChunkId;//表征本數據塊的四字符碼

DWORDdwFlags;//說明本數據塊是不是關鍵幀、是不是‘rec’列表等信息

DWORDdwOffset;//本數據塊在文件中的偏移量

DWORDdwSize;//本數據塊的大小

}aIndex;//這是一個數組!為每個媒體數據塊都定義一個索引信息

}AVIOLDINDEX;

注意:如果一個AVI文件包含有索引塊,則應在主AVI信息頭的描述中,也就是AVIMAINHEADER結構的dwFlags中包含一個AVIF_HASINDEX标記。

還有一種特殊的數據塊,用一個四字符碼'JUNK'來表征,它用于内部數據的隊齊(填充),應用程序應該忽略這些數據塊的實際意義。

相關詞條

相關搜索

其它詞條