以色列加快蚕食巴勒斯坦,俄国吞并克里米亚,印度全面控制印控克什米尔,美国要“买”格陵兰,百年未有之大变局啊,威尔逊的棺材板快盖不住了。
欧盟:望之不似人君,陛下何意反?
中俄:好!威!支!希!着建国速办!
提这个问题说明你去过香港,但没进香港人家里看看原因。
原因很简单…人家房子小啊!
20平能隔出三室一厅,100平的,那都叫千尺豪宅了。基本我们看见最多的是30-50平的居民楼。这面积在大陆这边的高楼是单身公寓,可人家香港这边可能四世同堂啊。
你想想,每个房间10平不到。分体空调最小也1p了,装起来开冷库吗?
任何一样产品,如果沒有人用,那么只可能是一个原因——
它不好用。
绝对不可能是其他的原因。什么垄断啊,什么用户懒惰啊,这些原因都是不存在的。
7-Zip也是如此。
至于什么「7-ZIP比winRAR在多个方面优秀」这种说法,只是7-Zip往自己脸上贴金而已。
举个栗子,这是我公司的一个文件夹:
我就不说正宗的7-zip软件了,那玩意儿跟winRAR根本沒法比。我说说最近比较火的bandizip,这个软件也支持7z格式。
用bandizip压缩一下,选择zip格式,耗时4秒。
换7z格式压缩,耗时20秒。
zip格式压缩包的大小是79.9M,7z格式压缩包的大小是76.9M。7z格式只比zip格式小3%,但是压缩耗时多了4倍。这种情况下,7z的优势何在?
当然,我们可以修改参数。我把压缩级別调成快速压缩,再用7z格式压缩一遍,结果如下:
耗时8秒,压缩後的文件大小变成了79.8M。
同样的文件,我用winRAR,标准压缩成rar文件,耗时也就是8秒。快速压缩成rar文件甚至能达到跟zip文件同样的4秒速度。
7z总是吹它的压缩率,其真正的原因是:它能吹的也就只有压缩率了。压缩率高3% ,或者高5%,代价是压缩解压速度慢一倍以上,这沒什么值得骄傲的。
下面是谷歌官方做的一个评测:
Deflate是zip使用的算法,Lzma是7z使用的算法。把Deflate:9和Lzma:1做比较:
7z的压缩率比zip高(3.847÷3.371-1)×100%=14%
zip的压缩速度比7z高(15.5÷10.2-1)×100%=52%
zip的解压缩速度比7z高(347.3÷70-1)×100%=396%
7z別说打败rar了,它连把zip按到地上摩擦都做不到。原文是这样说的:
表明了Zopfli,LZMA,LZHAM,和 bzip2在压缩和解压缩时占用CPU时间较长,不会直接代替deflate。
Lzma算法的速度是如此之慢,以至于很多人使用7z时都误以为自己的电脑中病毒了,因为它实在是太慢了。
看看这位,他下载了一个16GB大小的7z格式的压缩包花了10分钟,然後解压缩花了10个小时。
再来做个实验。
我们知道文字类的文件是最容易压缩的。我随便下了几篇网文,加起来一千多万字,分別压缩成zip、7z、rar格式做比较。其中zip和7z用的是好压5.9版,rar用的是WinRAR5.71版,全都采用默认配置。
好压压缩成zip格式耗时2秒,压缩速度14.4M/秒,压缩率39.9%。
好压压缩成7z格式耗时30秒,压缩速度1.2M/秒,压缩率25.6%。
WinRAR压缩成rar格式耗时4秒,压缩率26%。
三个文件的大小比较:
7z凭什么取代rar?
2019年9月26日更新:
本文的所有实验都是简单且可复现的。
上面我们已经以实验的方式说明了为什么不要使用7-Zip压缩的7z格式,下面我们继续以实验的方式说明为什么不要使用7-Zip压缩的zip格式。
这次我还是不用正宗的7-Zip,我用360压缩举例说明。
新建一个文档:
用360压缩制作成zip格式:
点「压缩包语言」,选择「繁体中文」,不出意料地乱码了:
可能有人知道这是因为zip格式不支持Unicode文件名。但是同一个文件,我用2345好压制作成zip格式,换成360压缩打开:
点「压缩包语言」,选择「繁体中文」,这次沒有乱码!
这说明,用2345好压制作的zip文件,跟用360压缩制作的zip文件,是不一样的,不会出现文件名乱码。
事实真相是:並不是zip格式不支持Unicode文件名,而是用7-Zip压缩制作的zip格式不支持Unicode文件名。请注意这其中的差別。
上面说的是360压缩,怎么又跑到7-Zip上面去了?这是因为国产的所有压缩软件,除了好压之外,全都是7-Zip加了个壳。所以7-Zip有的缺点,他们全都有。
我刚试了下7-Zip目前最新的19.00版本,不出意外地发现它依然不支持Unicode文件名。而只要7-Zip不支持Unicode文件名,像360压缩这种7-Zip加壳软件也绝不可能支持Unicode文件名。
现阶段最好用的压缩软件还是好压和WinRAR。
为什么不推荐bandizip呢?因为我讨厌它的推广方式。比方说下面这个表:
这个表是假的。WinZip和WinRAR都支持Unicode文件名,都支持7z的分卷压缩文件,目前也都是免费软件,剩下的「快速拖曳」和「高速压缩」我不太清楚是什么,估计也不是什么重要的东西。总之这个软件的虚假宣传很严重。
2019年9月28日更新:
这种看法是错误的。
好压、WinRAR、WinZip、bandizip这四款压缩软件制作的zip文件彼此通用,也就是说他们都是标准zip格式。
这四款软件都使用Unicode文件名,把这四款软件制作的zip文件拿到韩国去,拿到日本去,拿到世界上任何一个地方去,都不会乱码。只有7-Zip以及360压缩这种7-Zip加壳软件才会有文件名乱码问题。
实际上,对于Zip格式来说,Unicode文件名是可选的。7-Zip选择不支持Unicode文件名是有它自己的想法,因为加入Unicode支持会导致压缩包变大,然後研發7-Zip的那帮人觉得压缩率更重要,所以他们不支持Unicode。
7-Zip官网说7-Zip创建的 zip 格式比大多数其它压缩软件创建的都小 2-10%。大家都用一样的zip格式,凭什么你就比我小?就是因为7-Zip放弃支持Unicode。
「Zip格式本身沒有定义Unicode文件名」,我还真不好说这句话是错的。实际上这句话的正确说法是「Zip格式本身沒有定义一定要用Unicode文件名」,zip格式可以使用Unicode,也可以不使用Unicode,选择权在压缩软件,WinZip和bandizip的Unicode支持就是可选的。
7-Zip不加入对Unicode的支持,把压缩包缩小2-10%,它只说後者不说前者,只说好事不说坏事,这就是宣传。
2019年9月28日更新:
评论区有人指出7-Zip支持Unicode,但是需要手动添加参数。我试了一下,是真的。看来7-Zip还是能用的,只是需要使用者拥有很强的专业知识,对普通用户不够友好。
评论区有人说7-Zip默认不支持Unicode是为了兼容老的程序。这裡我给大家看一段bandizip的帮助说明:
UTF-8是用于存储Unicode的标准字符编码方法,其被开发用于显示各种语言。
由于Unicode和UTF-8是在20世纪90年代之后开发的,因此ZIP格式的初始版本(在20世纪80年代制造)不支持UTF-8。 由于ZIP格式成为标准档案格式并且需要支持Unicode,因此,已经引入了几种方法来处理ZIP文件上的UTF-8字符串。
Bandizip支持其中两种;一种方法是将文件名转换为UTF-8,另一种方法是将额外的UTF-8文件名存储在额外的头字段中,同时将原始文件存储在MBCS中。
在Zip文件中使用Unicode文件名(UTF-8)
Bandizip将文件名存储在ZIP文件中,并将其转换为UTF-8。 它是由APPNOTE定义的标准文件名存储方法,但是一些压缩程序偶尔无法识别ZIP文件或错误处理它们将导致文件名损坏。
将Unicode文件名存储在Zip文件的额外头字段中(UTF-8)
Bandizip将附加UTF-8文件名存储在ZIP格式的额外头字段中,同时将原始文件存储在MBCS中。 此方法也由APPNOTE定义为“Info-ZIP Unicode Path Extra Field(ZIP信息U码路径额外字段)”。 因为它使用额外字段来存储UTF-8文件名,所以文件大小将比前者大几十字节。 但是,原始文件名存储在MBCS中,因此文件更安全,更兼容。
由于大多数压缩程序(如7zip,Winrar和Winzip)都支持此功能,因此可以防止文件名在使用不同系统语言的操作系统中被破坏。
Unicode filenames in ZIP format
简单点说就是zip支持Unicode有两种方式,第一种方式是直接把文件名从本地代码转换成UTF8存储在zip文件中,第二种方式是依然在zip文件中存储本地文件名代码,然後把本地文件名代码转换成UTF8存储在ZIP文件的额外头字段中。第一种方式有可能会出现兼容性问题,第二种方式因为存储的还是本地文件名代码,所以绝对不会出现兼容性问题,但是这样就相当于把文件名存了两次,所以文件会大一些。
大家猜猜,好压、WinRAR、WinZip,以及加了cu参数的7-Zip分別支持哪一种Unicode存储方式?
实测好压支持的是第一种。
上面我用好压制作了一个「新建文本文档.zip」,裡面内容就是一个名为「新建文本文档.txt」的空文档,我用notepad++打开是这个样子的:
一堆乱码,注意那个「金區板缓XXXXX.txt」其实就是「新建文本文档.txt」的乱码。
选择UTF8编码。
正确的文件名就出来了。
我再把这个名为「新建文本文档.txt」的空文档用WinRAR压缩成zip格式,用notepad++打开:
注意前面是正确的文件名「新建文本文档.txt」,後面是乱码。
选择UTF8编码。
前面变成乱码,後面显示正确的文件名「新建文本文档.txt」。
这个用WinRAR制作的文件比先前用好压制作的文件大了48个字节。
这就是第二种方式,实测WinZip用的也是这种方式。
至于7-Zip,它用的是跟好压一样的第一种方式。
我们理一下思路:
zip文件有三种方式,第一种支持Unicode兼容性一般,第二种支持Unicode兼容性好但体积最大,第三种不支持Unicode体积最小。
好压使用的是第一种方式,WinRAR和WinZip使用的是第二种方式。7-Zip默认第三种方式,加入cu参数後是第一种,不支持第二种。
实际上像WinRAR和WinZip这种国际性大公司才是最在乎兼容性的,自由软件开發者我感觉都不太在乎兼容性。
9月30日更新:
说说bandizip这个软件。
安装之後右键菜单会多出来一个「新建文件夹」选项。
然後是传说中的压缩包预览功能。
發现问题所在了吗?bandizip佔的位置太大了,好压和WinRAR都只佔了四五行,bandizip一个软件就佔了十几行,挤得右键菜单都显示不全了。
按道理说,如果我想知道压缩包裡有什么,直接双击打开不就可以了吗?所以我给压缩包预览功能的评价是负分。
还有那个自动解压功能。压缩包裡面有个A文件夹,A文件夹裡面有个B文件,换別的软件解压出来都是A文件夹裡面有个B文件,而bandizip解压出来直接就是B文件,我还得自己建个文件夹把B文件放进去。
总之,许多bandizip吹爆的特性,反而给我造成了困扰。而去掉这些特性,bandizip就不剩什么了。
而且我认为bandizip的界面很「简陋」,这裡说明一下,我所谓的「简陋」意思可能和別人不太一样。
来对比一下。这是bandizip的压缩界面:
这是好压的压缩界面:
bandizip只有一个压缩时间。好压则是压缩时间、压缩速度、压缩率、文件个数什么都有。这就是我所谓的「简陋」,即功能上的「简陋」。
再来看看好压的配置界面,可以自定义压缩算法、字典大小、单词大小。以这个配置压缩解压需要多少内存直接给你标出来。7-Zip也不过如此了吧。
还可以编辑过滤列表,对不同後缀名的文件采用不同的压缩配置。
这就是为什么我宁愿使用有广告的好压,也不用干净清洁小巧的bandizip。
2019年10月1日更新:
刚才测试了一下Win7自带的explorer.exe对zip文件的支持情况,结论如下。
explorer压缩zip文件不支持Unicode,但是可以打开Unicode文件名的zip文件,实测好压和WinRAR压缩的zip文件都可以打开。
explorer只支持deflate和deflate64两种压缩算法,不支持其他压缩算法。
2019年10月2日更新:
感觉好像歪楼了,题目问的是为什么RAR 比 7Z 更流行。我总结一下,7-Zip相比于RAR至少有三大缺点:
⒈界面简陋
⒉压缩耗时高,佔用内存多(在有的人眼中这是优势)
⒊稳定性差,压缩包容易损坏
第三点不是我说的,我给大家摘一段bandizip对7z格式的评价(链接):
为了实现更高的压缩比,7z使用了包括报头压缩在内的各种方式。
但是,由于这些功能,当压缩文件受到轻微损坏时,几乎不可能恢复它。
因此,在以7z格式备份重要文件时,请注意不要损坏它们。
您可以在7Z网站上找到有关如何恢复损坏的7Z文件的信息,但即使对专家来说,完成恢复也是极其困难的。
有人说这是商业软件的刻意抹黑,我给大家转一段开源界大佬对7z的评价(链接):
The [LZMA2 format] contains an unrestricted mix of LZMA packets and uncompressed data packets. Each packet starts with a header that is not protected by any check sequence in spite of containing the type and size of the following data. Therefore, every bit flip in a LZMA2 header causes either a framing error or a desynchronization of the decoder. In any case it is usually not possible to decode the remaining data in the block or even to know what failed. Compare this with [Deflate] which at least does protect the length field of its non-compressed blocks. (Deflate's compressed blocks do not have a length field).
这段文字是什么意思呢?我简单解释一下,LZMA2是7z的默认压缩算法,用这种算法压缩文件会产生这么一种情况:
假如一个普通文件内容是「ABCDEFG」,然後它第二个字节损坏了,我们看到的就是「A?CDEFG」。但如果这是一个使用了LZMA2算法的7z压缩包,我们看到的就是「A??????」。
Therefore, every bit flip in a LZMA2 header causes either a framing error or a desynchronization of the decoder. In any case it is usually not possible to decode the remaining data in the block or even to know what failed.翻译:因此,在LZMA2报头中的每个位翻转都会引起解码器的帧错误或者同步失调。在所有情况下,通常都不可能解码块中的剩余数据,甚至都不知道哪裡错了。
最後,这位大佬给出的建议是:不要用LZMA2算法储存重要文件。
也就是说,如果你坚持使用7z格式,那么你就祈祷吧,祈祷压缩包裡一个字节错误都不要有。因为只要出现一个字节错误,整个压缩包就废了。
所以,即使不考虑时间因素,rar相比于7z仍然是有优势的。
2019年10月4日更新:
今天评论区还有人对我说:你说的不对,zip格式不支持Unicode。唉……
说个可能会违反大家常识的事:一般人可能会认为7-Zip这种免费软件靠的是口碑,WinRAR这种商业软件靠的是宣传。
错!
真实的情况是:WinRAR靠的是口碑,而7-Zip靠的是宣传。
我印象中从来沒见过WinRAR做广告宣传过它自己。WinRAR崛起靠的是它良好的口碑带动人民群众用脚投它的票。
7-Zip並不是缺乏宣传推广,而是它的宣传推广已经过头了。过头到什么程度?明明是7-Zip自己的zip格式不支持Unicode,现在好多人以为全世界的zip格式都不支持Unicode。7-Zip的bug已经快变成feature了。
我试过很多压缩软件,只有7-Zip的zip格式默认不支持Unicode。其他不支持Unicode的软件,我都能在他们的安装目录裡找到7z.dll,这些软件都是直接把7-Zip的东西拿过来用,都不带改的。
有人说什么国外都用7z,于是就有了这么一个有趣的问题:(为什么 Linux 要用 tar.gz,很少用 7Z 或 ZIP)?作为一个自由软件,7z连它的大本营linux都沒有搞定。
还有人说什么国外注重版权,都不用rar。我给大家看一张英文维基百科的截图:
英文维基百科对rar的评价是:second in popularity to .zip files.人家对7z可沒有这么高的评价。
类似的还有bandizip,有人做宣传说bandizip支持Unicode,而WinZip和WinRAR都不支持?
我發现,像7-Zip和bandizip这种免费软件,其官网还是比较靠谱的,基本沒什么虚假宣传。但是其免费的特征,会招来一群人帮他们做免费宣传。然後这群人中的大部分啥都不懂,但是想象力很丰富,会自动脑补出一些並不存在的东西。比方说他们看到7-Zip宣传自己的7z格式支持Unicode,就会自动脑补成zip格式不支持Unicode;他们看到bandizip宣传自己的zip格式支持Unicode,就会自动脑补成別家的zip格式不支持Unicode。明明bandizip的大标题是「ZIP格式的Unicode文件名」,正文说的是「我们和WinZip、WinRAR一样都支持Unicode」,这些人连点进去看一眼正文的想法都沒有。
然後这些人对他们宣传的东西有一种谜之自信。有人说7z格式易损坏,马上就会有人跳出来说你有什么证据?沒有人会把自己的缺点放在官网上宣传,然後这群人的逻辑是:7z不说它有这个缺点,那么它就沒有这个缺点,你这样造谣污蔑肯定是收了钱的。
为什么我说7z易损坏的时候要引用那么多资料呢?因为我害怕被人喷。
10月6日更新:
我记得我已经把这个评论踩下去了。怎么又被顶上来了?
这个评论存在事实错误。因为我用的都是默认配置,7z的默认配置是16M字典大小:
WinRAR的默认配置是是32M字典大小:
居然还有43个赞,可见7z的虚假宣传多么严重了。
市场永不失效。——这是我学了经济学之後最大的收获。
一提起市场失效,大部分都会想到德沃夏克键盘和QWERTY键盘的故事。我学经济学之前也认为这是一个市场失效的典型案例。但是後来我知道了三点我以前不知道的东西:
⒈德沃夏克键盘是有专利的,每一个使用德沃夏克键盘的人都要给德沃夏克交专利费,而QWERTY键盘免费。
⒉所有德沃夏克键盘优于QWERTY键盘的实验,都是德沃夏克自己搞的,他是在推销自己的产品,所以其实验的真实性值得怀疑。
⒊德沃夏克键盘並不完美,比如说现代英语中I的使用频率远高于U,但是德沃夏克键盘把U放在了比I更顺手的位置上。
我觉得第一点就能把这个问题下的大多数人劝退了。
有人说什么WinRAR的流行靠的是盗版软件,装机的人都装WinRAR,用户沒有选择权。
问题来了:为什么装机的人都装WinRAR呢?还不是因为它好用!
这就好比说Windows为什么流行?因为国内电脑都预装盗版Windows,用户沒有选择权。
我才不会告诉你们当年我的笔记本电脑上预装的就是Linux,我回家第一件事就是把Linux格了,换个盗版Windows装上去。
如果装机的人选择7-Zip而不是WinRAR,最大的可能不是用户从WinRAR迁移到7-Zip,而是他这个电脑卖不出去了。
目前的现状是:Windows平台上最流行的压缩格式是zip,其次是rar(rar是第二流行的压缩格式这种观点是英文维基百科说的)。
Linux平台上最流行的压缩格式是tar.gz,其次是tar.bz2。
zip用的是deflate算法,tar.gz用的也是deflate算法,其实就相当于换了个後缀名。tar.bz2用的是bzip2算法,rar用的是私有压缩算法。
这三种压缩格式中,综合考虑压缩率、压缩时间、稳定性等等因素,rar是最好的,但是它收费,所以屈居老二,zip排第一,这很合理,很符合市场规律。
现在好多人吹捧7z的同时都要把zip踩一下,这真是令人无语的操作。很多人都不知道,其实zip也是开源格式。现在压缩界的龙头老大,是被一个开源格式牢牢掌控着的,这个格式就是zip。我平时压东西用的也是zip。
7z三大缺点,一丑二慢三不稳定。按理说第一个缺点是最不重要的,为什么人们常常提起的反而是第一个缺点呢?
这是因为「丑」这个缺点,是一眼就能够看见的,不容抵赖。後两个缺点不是长年累月地使用是不会發现的。
我以前也用7-Zip,7-Zip的zip格式默认不支持Unicode文件名这种坑点我是亲身实践發现的。像WinRAR这种商业软件,人人得而诛之,它一旦出现什么问题就会被人挑出来指着鼻子骂;而7-Zip这种免费软件,推销的人都会或多或少地美化它。WinRAR名面上有很多坑,但是我们知道它就只有这么多坑,而7-Zip看似完美的表象下你根本不知道它有多少坑。
2019年10月9日更新:
标准版:为大众提供的免费的版本
专业版:为专业用户提供的付费版本
企业版:为企业用户提供的付费版本
自7.0开始,Bandizip将会在软件中加入广告,强制更新,並且不再提供离线安装包。希望广大Bandizip爱好者届时能继续支持这个软件,呵呵。
2019年11月3日更新:
有人说字典大小不同不能比较,那我来一个字典大小相同的比较实验:
zip用32K字典,rar和7z都用1M字典,使用的测试材料是中文小说,结论如下。
压缩耗时比:
zip标准:RAR标准:7z快速:7z标准=1:2.5:4.8:9
最终文件大小的比例是:
zip标准:RAR标准:7z快速:7z标准=120%:1:107%:93%
bandizip很鸡贼,他的「正常压缩」使用的是7-Zip「快速压缩」的参数,他的「最大压缩」使用的是7-Zip「标准压缩」的参数。所以使用bandizip压7z的时候,我们会發现他的压缩速度比较快,但是压缩比不高。
2021年10月10日更新:
「7-Zip 现在会为 UTF-8 编码的文件名写入额外的字段至 zip 压缩包中。
这可以让 zip 压缩包在不同系统中提取时能得到正确的文件名。」
7-Zip终于加入Unicode支持了,版本号是21.02 alpha,更新时间是2021年5月6日。
标准zip加入Unicode文件名的时间是2006年。时隔15年之後,7-zip终于支持这个标准了,真是不容易。
另外bandizip所谓的「高速压缩」实测是假的,宣传口径而已。
吴蜀地广人稀呀,就像现在中国胡焕庸线以西领土占64%,人口占6%