本文僅從工程和實施角度幫助用戶理解視頻壓縮技術,不涉及過深的算法原理和代碼實現。本文由裕瀚科技研發(fā)部原創(chuàng),轉載請注明出處。
1. 視頻壓縮概述
視頻是由連續(xù)的圖像幀序列組成,圖像的連續(xù)播放呈現出連續(xù)的動態(tài)影像即為視頻。所謂視頻壓縮即視頻編碼技術,是指通過壓縮技術將原始的視頻格式轉化為另一種數字視頻格式,其目的在于減少文件空間占用。比如攝像頭經過采集后直接生成的原始視頻,不考慮壓縮的話,其視頻數據量非常龐大,在網絡傳輸和數據存儲的過程中,帶寬資源和存儲設備無法支撐如此巨大的數據量,所以在進行傳輸或者存儲前,需要將原始視頻數據進行視頻壓縮處理。

2. 視頻編解碼器
視頻編解碼器是指一個能夠針對數字視頻文件或者視頻流進行壓縮和解壓縮的程序或者設備。由于編解碼實現路徑和方式的不同,視頻編解碼器也分為硬件編解碼器和軟件編解碼器。目前主流的視頻編解碼器分為5個系列:H.26X系列(H.264/HEVC/VVC)、AVS系列(AVS1/AVS2/AVS3)、SVAC系列(SVAC1.0/SVAC2.0)、VP8/VP9系列以及最新的AV1。其中AVS系列和SVAC系列均是我國具有獨立知識產權的視頻編解碼標準。評價編解碼器優(yōu)劣的主要評價標準在于:壓縮比的高低、編解碼速度的快慢、編解碼功耗以及解碼兼容性。

3. 視頻壓縮的本質
視頻可以被壓縮是因為前后幀圖像數據中存在大量的信息冗余,主要可以從以下四類進行探討:
空間冗余: 同一圖像幀內,相近像素之間的差別很小,具有較高的相似度;
時間冗余:視頻中相鄰的前后圖像幀之間,其中發(fā)生變化的像素占整張圖像像素的比例極其微小,存儲運動關系,該特點在監(jiān)控場景中尤為常見;
編碼冗余:不同像素的出現概率不同,出現概率高的像素分配較少的字節(jié),概率低的分配較多的字節(jié);
視覺冗余: 人眼視覺系統(tǒng)對不同像素顏色敏感度不同,編碼時可以丟棄這些冗余的信息,而幾乎不影響人眼視覺效果。
4. 視頻畫質評價
談到視頻壓縮,就免不了要談到壓縮后的視頻畫質。在監(jiān)控領域常見問題就是壓縮后視頻畫質和原始視頻是否有區(qū)別,能否作為證據進行溯源,是否會影響AI智能分析精度等;在互聯網領域大家就更關注壓縮后視頻畫質是否會出現馬賽克等而影響用戶對視頻美觀程度和流暢度評價。
視頻編碼畫質評價標準主要可以分為主觀評價和客觀評價,其中主觀評價標準是通過人眼直觀觀察進行評分,是最為接近的用戶對視頻畫質的整體反饋。但由于主觀評價的完成需要耗費大量人力和時間,并且受人為的影響因素較大,這里暫時不深入進行討論。
本文將從客觀評價標準簡要闡述下視頻編碼畫質的評價標準,主要介紹目前主流的全參考視頻質量評價模型的兩種視頻評價標準:PSNR(峰值信噪比)、MS-SSIM(結構相似度)。
PSNR:目前最主流的畫質評價方法,被公安部相關機構和互聯網企業(yè)引用最多的評價方式;PSNR取值20~40之間,數值越大,畫質越好。
MS-SSIM:通過感知結構信息來評價畫質,其結果更為接近肉眼感知效果;MS-SSIM取值0~1之間,數值越大,畫質越好。
