經(jīng)過(guò)壓縮的文件叫壓縮文件,壓縮的原理是把文件的二進(jìn)制代碼壓縮,就是把相鄰的0,1代碼減少,比如有000000,可以把它變成6個(gè)0 的寫(xiě)法60,來(lái)減少該文件的空間.
二進(jìn)制與ASCII編碼
電腦里基本的存儲單位是字節。ASCII碼是一種以字節為單位對常用符號進(jìn)行編碼的方案,因其合理性而較為流行。因為一個(gè)字節有8位,所以ASCII最多可對2^8=256個(gè)字符進(jìn)行編碼,其中前128個(gè)稱(chēng)為標準ASCII碼(二進(jìn)制編號00000000-01111111),后128個(gè)稱(chēng)為擴展ASCII碼(二進(jìn)制編號10000000-11111111),電腦里的漢字就是利用兩個(gè)擴展ASCII碼的組合來(lái)實(shí)現的(GB2312漢字編碼方案)。比如漢字“王”占用的兩個(gè)ASCII編碼分別是205和245,十六進(jìn)制表示是CD和F5,化為二進(jìn)制就是11001101和11110101。也就是說(shuō),在電腦處理“王”這個(gè)漢字時(shí),電腦里的信息是“1100110111110101”這樣一串數字。再如大寫(xiě)的英文字母“A”的ASCII編碼是65,十六進(jìn)制表示是41,在電腦里的信息實(shí)際上是“01000001”。
【縮位壓縮】
知道了上述原理后,我們來(lái)介紹“縮位壓縮”的原理。“縮位”,就是縮減編碼里沒(méi)有必要使用的“位”。例如文件里一個(gè)漢字也沒(méi)有,也就是說(shuō)內容中沒(méi)有使用擴展ASCII碼,這樣所有字符編碼的第七位(最前面那一位)將都會(huì )是0。利用這一點(diǎn)我們就可以縮掉這一位,假設文件內容是ABCDEFGH。
文件內容: ABCDEFGH
二進(jìn)制內容:01000001 01000010 01000011 01000100 01000101 01000110 01000111 01001000
壓縮后文件內容: [該內容中文狀態(tài)下顯示是亂碼,故無(wú)法寫(xiě)出]
二進(jìn)制內容:10000011 00001010 00011100 01001000 10110001 10100011 11001000
這個(gè)壓縮過(guò)程就是將原來(lái)頂頭的0全部去掉后每8位重排,這樣原來(lái)占用8個(gè)字節的文件就只占用了7個(gè)字節。只要解壓時(shí)再加上第七位的0,文件就可以恢復原樣。這一壓縮技術(shù)特別適用于對數字的壓縮。因為0~9這十個(gè)阿拉件數字占用的ASCII編碼是從00110000-00111001,其前四位全部都是“0011”。
壓縮文件的基本原理是查找文件內的重復字節,并建立一個(gè)相同字節的"詞典"文件,并用一個(gè)代碼表示,比如在文件里有幾處有一個(gè)相同的詞"中華人民共和國"用一個(gè)代碼表示并寫(xiě)入"詞典"文件,這樣就可以達到縮小文件的目的.
由于計算機處理的信息是以二進(jìn)制數的形式表示的,因此壓縮軟件就是把二進(jìn)制信息中相同的字符串以特殊字符標記來(lái)達到壓縮的目的。為了有助于理解文件壓縮,請您在腦海里想象一幅藍天白云的圖片。對于成千上萬(wàn)單調重復的藍色像點(diǎn)而言,與其一個(gè)一個(gè)定義“藍、藍、藍……”長(cháng)長(cháng)的一串顏色,還不如告訴電腦:“從這個(gè)位置開(kāi)始存儲1117個(gè)藍色像點(diǎn)”來(lái)得簡(jiǎn)潔,而且還能大大節約存儲空間。這是一個(gè)非常簡(jiǎn)單的圖像壓縮的例子。其實(shí),所有的計算機文件歸根結底都是以“1”和“0”的形式存儲的,和藍色像點(diǎn)一樣,只要通過(guò)合理的數學(xué)計算公式,文件的體積都能夠被大大壓縮以達到“數據無(wú)損稠密”的效果。總的來(lái)說(shuō),壓縮可以分為有損和無(wú)損壓縮兩種。如果丟失個(gè)別的數據不會(huì )造成太大的影響,這時(shí)忽略它們是個(gè)好主意,這就是有損壓縮。有損壓縮廣泛應用于動(dòng)畫(huà)、聲音和圖像文件中,典型的代表就是影碟文件格式mpeg、音樂(lè )文件格式mp3和圖像文件格式j(luò )pg。但是更多情況下壓縮數據必須準確無(wú)誤,人們便設計出了無(wú)損壓縮格式,比如常見(jiàn)的zip、rar等。壓縮軟件(compression software)自然就是利用壓縮原理壓縮數據的工具,壓縮后所生成的文件稱(chēng)為壓縮包(archive),體積只有原來(lái)的幾分之一甚至更小。當然,壓縮包已經(jīng)是另一種文件格式了,如果你想使用其中的數據,首先得用壓縮軟件把數據還原,這個(gè)過(guò)程稱(chēng)作解壓縮。常見(jiàn)的壓縮軟件有winzip、winrar等。
有兩種形式的重復存在于計算機數據中,zip就是對這兩種重復進(jìn)行了壓縮。
一種是短語(yǔ)形式的重復,即三個(gè)字節以上的重復,對于這種重復,zip用兩個(gè)數字:1.重復位置距當前壓縮位置的距離;2.重復的長(cháng)度,來(lái)表示這個(gè)重復,假設這兩個(gè)數字各占一個(gè)字節,于是數據便得到了壓縮,這很容易理解。
一個(gè)字節有 0 - 255 共 256 種可能的取值,三個(gè)字節有 256 * 256 * 256 共一千六百多萬(wàn)種可能的情況,更長(cháng)的短語(yǔ)取值的可能情況以指數方式增長(cháng),出現重復的概率似乎極低,實(shí)則不然,各種類(lèi)型的數據都有出現重復的傾向,一篇論文中,為數不多的術(shù)語(yǔ)傾向于重復出現;一篇小說(shuō),人名和地名會(huì )重復出現;一張上下漸變的背景圖片,水平方向上的像素會(huì )重復出現;程序的源文件中,語(yǔ)法關(guān)鍵字會(huì )重復出現(我們寫(xiě)程序時(shí),多少次前后copy、paste?),以幾十 K 為單位的非壓縮格式的數據中,傾向于大量出現短語(yǔ)式的重復。經(jīng)過(guò)上面提到的方式進(jìn)行壓縮后,短語(yǔ)式重復的傾向被完全破壞,所以在壓縮的結果上進(jìn)行第二次短語(yǔ)式壓縮一般是沒(méi)有效果的。
第二種重復為單字節的重復,一個(gè)字節只有256種可能的取值,所以這種重復是必然的。其中,某些字節出現次數可能較多,另一些則較少,在統計上有分布不均勻的傾向,這是容易理解的,比如一個(gè) ASCII 文本文件中,某些符號可能很少用到,而字母和數字則使用較多,各字母的使用頻率也是不一樣的,據說(shuō)字母 e 的使用概率最高;許多圖片呈現深色調或淺色調,深色(或淺色)的像素使用較多(這里順便提一下:png 圖片格式是一種無(wú)損壓縮,其核心算法就是 zip 算法,它和 zip 格式的文件的主要區別在于:作為一種圖片格式,它在文件頭處存放了圖片的大小、使用的顏色數等信息);上面提到的短語(yǔ)式壓縮的結果也有這種傾向:重復傾向于出現在離當前壓縮位置較近的地方,重復長(cháng)度傾向于比較短(20字節以?xún)龋_@樣,就有了壓縮的可能:給 256 種字節取值重新編碼,使出現較多的字節使用較短的編碼,出現較少的字節使用較長(cháng)的編碼,這樣一來(lái),變短的字節相對于變長(cháng)的字節更多,文件的總長(cháng)度就會(huì )減少,并且,字節使用比例越不均勻,壓縮比例就越大。
那樣看你是有損壓縮還是無(wú)損壓縮咯~
一般的視頻壓縮或者說(shuō)全部的視頻是有損壓縮,否則數據兩將大的驚人,里面關(guān)系到壓縮算法等,這里不贅述~而你常用的壓縮如用rar等能還原的稱(chēng)為無(wú)損壓縮,壓縮比的大小直接關(guān)系到壓縮后的體積,
至于LZ發(fā)問(wèn)的音質(zhì)與效果當然會(huì )有影響~不過(guò)在一定范圍內,你肉眼不會(huì )覺(jué)察出來(lái),但體積上卻不及原來(lái)的幾十分之一甚至^^^音頻的話(huà)如MP3格式的音頻最常見(jiàn)吧,除了壓縮外還把頻率很高和很低的(人耳不能覺(jué)察出來(lái)的部分刪除),所以效果很好~
當然有損壓縮有個(gè)度,超過(guò)范圍就會(huì )造成破音,模糊不清等情況了~
LZ ,這是我認真回答的,選我額~~~
壓縮的原理:計算機處理信息是以二進(jìn)制數(0和1)的形式標示的,壓縮軟件把二進(jìn)制信息中相同的字符串以特殊字符標記起來(lái)壓縮的,從而實(shí)現縮小文件大小的。
文件的壓縮比則根據文件的類(lèi)型不同有所不同,比如文檔類(lèi)的文件壓縮比很大(一個(gè)字或者一個(gè)詞在同一個(gè)文件會(huì )反復出現),而圖形圖像的壓縮比則比較小(每一個(gè)像素點(diǎn)的色素不同是常有的,不同顏色和顏色深淺、對比度的不同、亮度不同等的對應二進(jìn)制代碼是不同的)。 如果原文件被刪掉了,只要將壓縮文件解壓就可以。
回答者。
下面以winrar為例給你說(shuō)明一下:
我們使用計算機所做的事情大多都是對文件進(jìn)行處理。每個(gè)文件都會(huì )占用一定的磁盤(pán)空間,我們希望一些文件,尤其是暫時(shí)不用但又比較重要不能刪除的文件(如備份文件,有點(diǎn)像雞肋呀),盡可能少的占用磁盤(pán)空間。但是,許多文件的存儲格式是比較松散的,這樣就浪費了一些寶貴的計算機存儲資源。這時(shí),我們可以借助壓縮工具解決這個(gè)問(wèn)題,通過(guò)對原來(lái)的文件進(jìn)行壓縮處理,使之用更少的磁盤(pán)空間保存起來(lái),當需要使用時(shí)再進(jìn)行解壓縮操作,這樣就大大節省了磁盤(pán)空間。當你要拷貝許多小文件時(shí),通過(guò)壓縮處理可以提高執行效率。如果小文件很多,操作系統要執行頻繁的文件定位操作,需要花費很多的時(shí)間。如果先把這些小文件壓縮,變成一個(gè)壓縮文件后,再拷貝時(shí)就很方便了。由于計算機處理的信息是以二進(jìn)制數的形式表示的,因此壓縮軟件就是把二進(jìn)制信息中相同的字符串以特殊字符標記來(lái)達到壓縮的目的。為了有助于理解文件壓縮,請您在腦海里想象一幅藍天白云的圖片。對于成千上萬(wàn)單調重復的藍色像點(diǎn)而言,與其一個(gè)一個(gè)定義“藍、藍、藍……”長(cháng)長(cháng)的一串顏色,還不如告訴電腦:“從這個(gè)位置開(kāi)始存儲1117個(gè)藍色像點(diǎn)”來(lái)得簡(jiǎn)潔,而且還能大大節約存儲空間。這是一個(gè)非常簡(jiǎn)單的圖像壓縮的例子。其實(shí),所有的計算機文件歸根結底都是以“1”和“0”的形式存儲的,和藍色像點(diǎn)一樣,只要通過(guò)合理的數學(xué)計算公式,文件的體積都能夠被大大壓縮以達到“數據無(wú)損稠密”的效果。總的來(lái)說(shuō),壓縮可以分為有損和無(wú)損壓縮兩種。如果丟失個(gè)別的數據不會(huì )造成太大的影響,這時(shí)忽略它們是個(gè)好主意,這就是有損壓縮。有損壓縮廣泛應用于動(dòng)畫(huà)、聲音和圖像文件中,典型的代表就是影碟文件格式mpeg、音樂(lè )文件格式mp3和圖像文件格式j(luò )pg。但是更多情況下壓縮數據必須準確無(wú)誤,人們便設計出了無(wú)損壓縮格式,比如常見(jiàn)的zip、rar等。壓縮軟件(compression software)自然就是利用壓縮原理壓縮數據的工具,壓縮后所生成的文件稱(chēng)為壓縮包(archive),體積只有原來(lái)的幾分之一甚至更小。當然,壓縮包已經(jīng)是另一種文件格式了,如果你想使用其中的數據,首先得用壓縮軟件把數據還原,這個(gè)過(guò)程稱(chēng)作解壓縮。常見(jiàn)的壓縮軟件有winzip、winrar等。
什么是壓縮文件?
簡(jiǎn)單的說(shuō),就是經(jīng)過(guò)壓縮軟件壓縮的文件叫壓縮文件,壓縮的原理是把文件的二進(jìn)制代碼壓縮,把相鄰的0,1代碼減少,比如有000000,可以把它變成6個(gè)0 的寫(xiě)法60,來(lái)減少該文件的空間。
■怎么壓縮文件?
首先要安裝壓縮軟件,現在比較流行的是WinRAR「一種高效快速的文件壓縮軟件(中文版)」。
其次是建立一個(gè)壓縮包:選擇你要制作成壓縮包的文件或文件夾,當然你也可也多選,方法同資源管理器,也就是按住Ctrl或Shift再選擇文件(文件夾)。 選取完畢之后,就可以單擊工具欄上的“壓縮”按鈕,在這里你可以選擇壓縮格式:RAR和ZIP。 如果你想得到較大的壓縮率,建議選擇RAR格式。
各個(gè)選項選擇好以后,單擊確定按鈕就開(kāi)始制作壓縮包了,非常方便。
有時(shí)候大家會(huì )遇到這個(gè)問(wèn)題,就是你在一個(gè)論壇里要上傳一些文件壓縮包,壓縮包大小有3M,但是論壇限制會(huì )員上傳大小只有2M,怎么辦呢?
其實(shí)辦法很簡(jiǎn)單,就是在你壓縮這個(gè)文件時(shí),分成幾個(gè)帶分卷壓縮包,分卷包大小設置為2M即可,比如:原來(lái)文件名為123.rar(3M),壓縮成分卷包后為123.part1.rar(2M)與123.part2.rar(1M)兩個(gè)文件,這樣你就可以上傳了。
具體方法如下:
1、在要壓縮的文件上點(diǎn)右鍵
2、添加到壓縮文件。.
3、選常規
4、壓縮方式選最好
5、批定壓縮分卷大小(按字節計算),1M = 1024K,1K = 1024字節,填寫(xiě)數字即可
當你下載了帶有分卷的壓縮包后,如何解壓文件呢?
具體方法如下:
1、把所有的壓縮分卷全部下載完整
2、所有分卷必須在同一個(gè)文件夾內
3、然后雙擊解壓第一個(gè)分卷,即可
注:分卷解壓的文件必須是連續的,若分卷未下載完整,則解壓時(shí)自然會(huì )提示需要下一壓縮分卷
壓縮原理需要專(zhuān)業(yè)人士來(lái)解釋?zhuān)抑涣私庖稽c(diǎn):
(1)多媒體文件(視頻文件、音頻文件、MP3等),絕大多數已是經(jīng)過(guò)壓縮或高度壓縮處理過(guò)的,無(wú)法再作進(jìn)一步的壓縮或者根本無(wú)法壓縮,就目前的壓縮技術(shù)來(lái)看,即使可以再進(jìn)一步壓縮,必定會(huì )以犧牲視頻文件、音頻文件的畫(huà)質(zhì)、音質(zhì)為代價(jià);
(2)壓縮比大的文件,多半是指那些文本文件或一些數據表格文件,這些文件中重復的數據、文字信息比較多,壓縮軟件可以通過(guò)其算法,把重復的信息全部歸納一個(gè)信息處理,盡可能縮小文件的大小,解壓時(shí)再將重復的信息通過(guò)處理回歸原位。對于這些文本文件,你不可能為縮小大小,而事先刪除那些重復的數據或文字,如果這樣,你恐怕根本就無(wú)法使用了。所以,只要文件內部重復的數據、文字信息越多,其壓縮比就會(huì )越高
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權,根據《信息網(wǎng)絡(luò )傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個(gè)月內通知我們,我們會(huì )及時(shí)刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習?shū)B(niǎo). 頁(yè)面生成時(shí)間:2.684秒