MPEG-2音頻是在1994年11月為數字電視而提出來的,其發展分為三個階段:
第壹階段是對MPEG-1增加了低采樣頻率,有16KHZ,22.05KHZ,以及24KHZ。
第二階段是對MPEG-1實施了向後兼容的多聲道擴展,將其稱為MPEG-2 BC。支持單聲道,雙聲道,多聲道等編碼。並附加“低頻加重”擴展聲道,從而達到五聲道編碼。
第三階段是向後不兼容,將其稱為MPEG-2 AAC先進音頻編碼。采樣頻率可以低至8KHZ;而高至96KHZ範圍內的1-48個通道可選的高音質音頻編碼。 MPEG-2制定於1994年,設計目標是高級工業標準的圖象質量以及更高的傳輸率。MPEG-2所能提供的傳輸率在3-10Mbits/sec間,其在NTSC制式下的分辨率可達720X486,MPEG-2也可提供並能夠提供廣播級的視像和CD級的音質。MPEG-2的音頻編碼可提供左右中及兩個環繞聲道,以及壹個加重低音聲道,和多達7個伴音聲道(DVD可有8種語言配音的原因)。由於MPEG-2在設計時的巧妙處理,使得大多數MPEG-2解碼器也可播放MPEG-1格式的數據,如VCD。
同時,由於MPEG-2的出色性能表現,已能適用於HDTV,使得原打算為HDTV設計的MPEG-3,還沒出世就被拋棄了。(MPEG-3要求傳輸速率在20Mbits/sec-40Mbits/sec間,但這將使畫面有輕度扭曲)。除了作為DVD的指定標準外,MPEG-2還可用於為廣播,有線電視網,電纜網絡以及衛星直播(DirectBroadcastSatellite)提供廣播級的數字視頻。 MPEG-2的另壹特點是,其可提供壹個較廣的範圍改變壓縮比,以適應不同畫面質量,存儲容量,以及帶寬的要求。
對於最終用戶來說,由於現存電視機分辨率限制,MPEG-2所帶來的高清晰度畫面質量(如DVD畫面)在電視上效果並不明顯,倒是其音頻特性(如加重低音,多伴音聲道等)更引人註目。
MPEG-2的編碼圖像被分為三類,分別稱為I幀,P幀和B幀。
1、I幀圖像,或稱幀內(Intra)圖像,參考圖像,相當於壹個固定圖像,且獨立於其它的圖像類型。每個圖像組群由此類型的圖像開始。采用幀內壓縮編碼技術減少空間冗余,不參照其它圖像。
2、P幀圖像,或稱預測(Predicted)圖像,通過參照前面靠近它的I或P圖像預測得到。P圖像減少了空間和時間冗余信息,相比I圖像可以有更大的壓縮碼率。
3、B幀圖像,或稱雙向預測圖像,根據臨近的前幾幀、本幀、後幾幀的I或者P圖像預測得到,僅記錄本幀與前後幀的不同之處。相比I和P圖像可以有更大的壓縮碼率。 MPEG-2標準目前分為9個部分,統稱為ISO/IEC13818國際標準。各部分的內容描述如下:
壹部分-ISO/IEC13818-1,System:系統,描述多個視頻,音頻和數據基本碼流合成傳輸碼流和節目碼流的方式。
二部分-ISO/IEC13818-2,Video:視頻,描述視頻編碼方法。
三部分-ISO/IEC13818-3,Audio:音頻,描述與MPEG-1音頻標準反向兼容的音頻編碼方法。
四部分-ISO/IEC13818-4,Compliance:符合測試,描述測試壹個編碼碼流是否符合MPEG-2碼流的方法。
五部分-ISO/IEC13818-5,Software:軟件,描述了MPEG-2標準的第壹、二、三部分的軟件實現方法。
六部分-ISO/IEC13818-6,DSM-CC:數字存儲媒體-命令與控制,描述交互式多媒體網絡中服務器與用戶間的會話信令集。
上六個部分均已獲得通過,成為正式的國際標準,並在數字電視等領域中得到了廣泛的實際應用。此外,MPEG-2標準還有三個部分:第七部分規定不與MPEG-1音頻反向兼容的多通道音頻編碼;第八部分現已停止;第九部分規定了傳送碼流的實時接口。
1990年成立的ATM視頻編碼專家組與MPEG在ISO/IEC13818標準的第壹和第二兩個部分進行了合作,因此上述兩個部分也成為ITU-T的
標準,分別為:ITU-T H.222.0和ITU-T H.262視頻。 下面我們主要討論壹下MPEG視頻編碼系統,即ISO/IEC13818-2部分。MPEG-2視頻編碼
MPEG-2視頻編碼標準是壹個分等級的系列,按編碼圖像的分辨率分成四個“級(Levels)”;按所使用的編碼工具的集合分成五個“類(Profiles)”。“級”與“類”的若幹組合構成MPEG-2視頻編碼標準在某種特定應用下的子集:對某壹輸入格式的圖像,采用特定集合的壓縮編碼工具,產生規定速率範圍內的編碼碼流。在20種可能的組合中,目前有11種(下表中標識“√”的項)是已獲通過的,稱為MPEG-2適用點。 簡單類 Simple Profile主類 Main Profile信噪比可分級類 SNR Scalable Profile空間可分級類 Spatially Scalable Profile高級類 High ProfileLow Level√√Main Level√√√√High-1440 Level√√√High Level√√- 我們知道,當前模擬電視存在著PAL、NTSC和SECAM三大制式並存的問題,因此,數字電視的輸入格式標準試圖將這三種制式統壹起來,形成壹種統壹的數字演播室標準,這個標準就是CCIR601,現稱ITU-RRec BT601標準。MPEG-2中的四個輸入圖像格式“級”都是基於這個標準的。低級(LowLevel)的輸入格式的像素是ITU-RRec BT601格式的1/4,即352x240x30(代表圖像幀頻為每秒30幀,每幀圖像的有效掃描行數為240行,每行的有效像素為352個),或352x288x25。低級之上的主級(MainLevel)的輸入圖像格式完全符合ITU-RRec BT601格式,即720x480x30或720x576x25。主級之上為HDTV範圍,基本上為ITU-RRec BT601格式的4倍,其中1440高級(High-1440Level)的圖像寬高比為4:3,格式為1440x1080x30,高級(HighLevel)的圖像寬高比為16:9,格式為1920x1080x30。
在MPEG-2的五個“類”中,較高的“類”意味著采用較多的編碼工具集,對編碼圖像進行更精細的處理,在相同比特率下將得到較好的圖像質量,當然實現的代價也較大。較高類編碼除使用較低類的編碼工具外,還使用了壹些較低類沒有使用的附加工具,因此,較高類的解碼器除能解碼用本類方法編碼的圖像外,也能解碼用較低類方法編碼的圖像,即MPEG-2的“類”之間具有後向兼容性。簡單類(SimpleProfile)使用最少的編碼工具。主類(MainProfile)除使用所有簡單類的編碼工具外,還加入了壹種雙向預測的方法。信噪比可分級類(SNRScalableProfile)和空間可分級類(SpatiallyScalableProfile)提供了壹種多級廣播的方式,將圖像的編碼信息分為基本信息層和壹個或多個次要信息層。基本信息層包含對圖像解碼至關重要的信息,解碼器根據基本信息即可進行解碼,但圖像的質量較差。次要信息層中包含圖像的細節。廣播時對基本信息層加以較強的保護,使其具有較強的抗幹擾能力。這樣,在距離較近,接收條件較好的情況下,可以同時收到基本信息和次要信息,恢復出高質量的圖像;而在距離較遠,接收條件較差的條件下,仍能收到基本信息,恢復出圖像,不至造成解碼中斷。高級類(HighProfile)實際上應用於比特率更高,要求更高的圖像質量時,此外,前四個類在處理Y,U,V時是逐行順序處理色差信號的,高級類中還提供同時處理色差信號的可能性。
目前的標準數字電視采用的是MP@ML主類和主級,而HDTV采用的是MP@HL主類和高級。下面,我們以MP@ML為例來說明壹下MPEG-2視頻編碼系統原理及關鍵技術。