為什么數字和圖像可以被壓縮
回憶是非常美好的,每個人都希望將自己最美好的東西永遠的保存下來。隨著科技的不斷進步,人們保存的方式方法也逐漸變多了,人們可以通過視頻和圖像的方式保存,可是有時候感覺內存不夠需要壓縮文件,這對文件有什么影響嗎?又為什么數字圖像可以被壓縮呢?下面就小編來給大家解答一下疑惑吧。
如果想要搞清楚這個問題,就要從圖像是如何被數字化的談起。先來看一張玩具鴨子的圖片是怎么被數字化的。
首先,要把這張圖片分成若干小塊,每個小塊中的顏色用一個數字來表示。如果圖像是純黑純白兩色的,那每塊只用1 或0 表示即可。如果圖像是16 色的,那每塊就要用4 位二進制數來表示,因為4 位二進制數有16 種組合,每種組合表示一種顏色,正好可以表示16 種顏色。而真彩色位圖的每個小塊,都是不同等級的紅、綠、藍三種色彩組合的,表達起來就更復雜一些。如果每種顏色有28 個等級,那就可以有224 種顏色,這樣一來,每小塊就需要24 位二進制數來表示,才能囊括所有色彩。
此可見,數字圖像色彩越絢麗,需要記錄的二進制數就越多。小色塊越多,分布得越密,則一幅圖的總數據量就越大。
回頭來看這個玩具鴨子圖片,如果像圖中所示被分成了154 個色塊(11&ties;14),并按真彩色位圖來計算,則總數據量就是154&ties;24=3696比特。這些小格子顯然是太大了,如果這樣來切分圖片,還原后的圖片就不能表現圖片的細節。在實際應用中切分的格子要密得多。這些格子其實就是我們常說的像素。格子分得越多表示像素越高,也就是分辨率越高,大家都熟悉的顯示器分辨率就是1024&ties;768。所謂數字化圖片,就是將圖片的畫面信息用二進制數字來表示。
壓縮文件有很多種格式,你在自己的圖片文件后看到的&ld;bp&rd;或&ld;jpg&rd;就是文件格式的名稱。bp 格式是將圖像的每個格子都獨立記錄的,因此數據量很大。如果按照前述的預測差值運算后,就變成了有損壓縮式,jpg 格式就是其中之一。對于畫質基本相同的兩幅圖像,jpg 格式的數據量要比bp 小得多。不過,雖然jpg 是有損壓縮的,但畫質的損失非常小。因為它是很智能的,比如它可以自動對有大面積相似色彩的飛機圖片給予較大的壓縮率,而對人群圖片給予較小的壓縮率。
相對于上述的靜態的圖像壓縮,視頻圖像的壓縮率就更大了。視頻圖像文件也有很多文件格式。一般情況下,一秒鐘視頻會切換成幾十張畫面,而這些畫面的絕大部分都是相同的,可是采集是每幅獨立采的,因此生成的avi格式的數據量是很大的。不僅每幅畫面本身可以壓縮,更重要的是幅與幅之間也可以壓縮,這就形成了數據量小得多的peg 格式。當然,也可以采用壓縮率更高的r 格式。r 格式的畫質比peg 差得不多,但數據量卻小了很多倍,更方便在網上傳輸。
不同的視頻,幅與幅之間的相似度是不同的,有些相似度很大的電視劇,也許在幾分鐘內,演員都坐在沙發上聊天,除了嘴巴動作外每幅畫面都基本一樣,對這種視頻可以采用較大的壓縮率,而對動感性很強的武打片,則需要采用較小的壓縮率,這種格式就是rvb。跟r 格式不同的是,它的壓縮率是可變的,vb 就是可變比特率的意思。rvb 則比r 更先進,相同數據量的rvb 視頻會比r 視頻清晰,而相同清晰度的視頻,rvb 格式的數據量會更小。
根據先驗信息我們知道,只有極少數的組合是經常出現的,絕大多數的組合是基本不會出現的,如果我們得到了一組模糊不清的組合,它跟經常出現的某個組合與基本不會出現的某個組合的相似度一樣,那我們就毫不猶豫地認定它就是那個經常出現的組合。當然,它是那個基本不會出現的組合的可能性也是不能排除的。就好比那個民國美女如果真的涂了藍嘴唇,那我們依靠先驗信息做的判斷就可能出錯了。