百科问答小站 logo
百科问答小站 font logo



如何评价IMO(国际奥数) 2019中国队团体总分与美国并列第一,重新夺回团体桂冠? 第1页

  

user avatar   eric314 网友的相关建议: 
      

下面为大家介绍参赛队伍:

美国队:

加拿大队:

澳大利亚队:

新西兰队:

从曼哈顿计划开始,盎格鲁撒克逊人的科技基本都是靠依附的外族搞的,颇有蒙古帝国遗风。。。


user avatar   moorhsum 网友的相关建议: 
      

任何一样产品,如果沒有人用,那么只可能是一个原因——

它不好用。

绝对不可能是其他的原因。什么垄断啊,什么用户懒惰啊,这些原因都是不存在的。

7-Zip也是如此。

至于什么「7-ZIP比winRAR在多个方面优秀」这种说法,只是7-Zip往自己脸上贴金而已。

举个栗子,这是我公司的一个文件夹:

我就不说正宗的7-zip软件了,那玩意儿跟winRAR根本沒法比。我说说最近比较火的bandizip,这个软件也支持7z格式。

用bandizip压缩一下,选择zip格式,耗时4秒。

换7z格式压缩,耗时20秒。

zip格式压缩包的大小是79.9M,7z格式压缩包的大小是76.9M。7z格式只比zip格式小3%,但是压缩耗时多了4倍。这种情况下,7z的优势何在?

当然,我们可以修改参数。我把压缩级別调成快速压缩,再用7z格式压缩一遍,结果如下:

耗时8秒,压缩後的文件大小变成了79.8M。

同样的文件,我用winRAR,标准压缩成rar文件,耗时也就是8秒。快速压缩成rar文件甚至能达到跟zip文件同样的4秒速度。

7z总是吹它的压缩率,其真正的原因是:它能吹的也就只有压缩率了。压缩率高3% ,或者高5%,代价是压缩解压速度慢一倍以上,这沒什么值得骄傲的。

下面是谷歌官方做的一个评测:

Deflate是zip使用的算法,Lzma是7z使用的算法。把Deflate:9和Lzma:1做比较:

7z的压缩率比zip高(3.847÷3.371-1)×100%=14%

zip的压缩速度比7z高(15.5÷10.2-1)×100%=52%

zip的解压缩速度比7z高(347.3÷70-1)×100%=396%

7z別说打败rar了,它连把zip按到地上摩擦都做不到。原文是这样说的:

表明了Zopfli,LZMA,LZHAM,和 bzip2在压缩和解压缩时占用CPU时间较长,不会直接代替deflate。

Lzma算法的速度是如此之慢,以至于很多人使用7z时都误以为自己的电脑中病毒了,因为它实在是太慢了。

看看这位,他下载了一个16GB大小的7z格式的压缩包花了10分钟,然後解压缩花了10个小时。

再来做个实验。

我们知道文字类的文件是最容易压缩的。我随便下了几篇网文,加起来一千多万字,分別压缩成zip、7z、rar格式做比较。其中zip和7z用的是好压5.9版,rar用的是WinRAR5.71版,全都采用默认配置。

好压压缩成zip格式耗时2秒,压缩速度14.4M/秒,压缩率39.9%。

好压压缩成7z格式耗时30秒,压缩速度1.2M/秒,压缩率25.6%。

WinRAR压缩成rar格式耗时4秒,压缩率26%。

三个文件的大小比较:

7z凭什么取代rar?


2019年9月26日更新:

本文的所有实验都是简单且可复现的。

上面我们已经以实验的方式说明了为什么不要使用7-Zip压缩的7z格式,下面我们继续以实验的方式说明为什么不要使用7-Zip压缩的zip格式。

这次我还是不用正宗的7-Zip,我用360压缩举例说明。

新建一个文档:

用360压缩制作成zip格式:

点「压缩包语言」,选择「繁体中文」,不出意料地乱码了:

可能有人知道这是因为zip格式不支持Unicode文件名。但是同一个文件,我用2345好压制作成zip格式,换成360压缩打开:

点「压缩包语言」,选择「繁体中文」,这次沒有乱码!

这说明,用2345好压制作的zip文件,跟用360压缩制作的zip文件,是不一样的,不会出现文件名乱码。

事实真相是:並不是zip格式不支持Unicode文件名,而是用7-Zip压缩制作的zip格式不支持Unicode文件名。请注意这其中的差別。

上面说的是360压缩,怎么又跑到7-Zip上面去了?这是因为国产的所有压缩软件,除了好压之外,全都是7-Zip加了个壳。所以7-Zip有的缺点,他们全都有

我刚试了下7-Zip目前最新的19.00版本,不出意外地发现它依然不支持Unicode文件名。而只要7-Zip不支持Unicode文件名,像360压缩这种7-Zip加壳软件也绝不可能支持Unicode文件名。

现阶段最好用的压缩软件还是好压和WinRAR。

为什么不推荐bandizip呢?因为我讨厌它的推广方式。比方说下面这个表:

这个表是假的。WinZip和WinRAR都支持Unicode文件名,都支持7z的分卷压缩文件,目前也都是免费软件,剩下的「快速拖曳」和「高速压缩」我不太清楚是什么,估计也不是什么重要的东西。总之这个软件的虚假宣传很严重。



2019年9月28日更新:

这种看法是错误的。

好压、WinRAR、WinZip、bandizip这四款压缩软件制作的zip文件彼此通用,也就是说他们都是标准zip格式。

这四款软件都使用Unicode文件名,把这四款软件制作的zip文件拿到韩国去,拿到日本去,拿到世界上任何一个地方去,都不会乱码。只有7-Zip以及360压缩这种7-Zip加壳软件才会有文件名乱码问题。

实际上,对于Zip格式来说,Unicode文件名是可选的。7-Zip选择不支持Unicode文件名是有它自己的想法,因为加入Unicode支持会导致压缩包变大,然後研發7-Zip的那帮人觉得压缩率更重要,所以他们不支持Unicode。

7-Zip官网说7-Zip创建的 zip 格式比大多数其它压缩软件创建的都小 2-10%。大家都用一样的zip格式,凭什么你就比我小?就是因为7-Zip放弃支持Unicode。

「Zip格式本身沒有定义Unicode文件名」,我还真不好说这句话是错的。实际上这句话的正确说法是「Zip格式本身沒有定义一定要用Unicode文件名」,zip格式可以使用Unicode,也可以不使用Unicode,选择权在压缩软件,WinZip和bandizip的Unicode支持就是可选的。

7-Zip不加入对Unicode的支持,把压缩包缩小2-10%,它只说後者不说前者,只说好事不说坏事,这就是宣传。


2019年9月28日更新:

评论区有人指出7-Zip支持Unicode,但是需要手动添加参数。我试了一下,是真的。看来7-Zip还是能用的,只是需要使用者拥有很强的专业知识,对普通用户不够友好。

评论区有人说7-Zip默认不支持Unicode是为了兼容老的程序。这裡我给大家看一段bandizip的帮助说明:

UTF-8是用于存储Unicode的标准字符编码方法,其被开发用于显示各种语言。
由于Unicode和UTF-8是在20世纪90年代之后开发的,因此ZIP格式的初始版本(在20世纪80年代制造)不支持UTF-8。 由于ZIP格式成为标准档案格式并且需要支持Unicode,因此,已经引入了几种方法来处理ZIP文件上的UTF-8字符串。
Bandizip支持其中两种;一种方法是将文件名转换为UTF-8,另一种方法是将额外的UTF-8文件名存储在额外的头字段中,同时将原始文件存储在MBCS中。
在Zip文件中使用Unicode文件名(UTF-8)
Bandizip将文件名存储在ZIP文件中,并将其转换为UTF-8。 它是由APPNOTE定义的标准文件名存储方法,但是一些压缩程序偶尔无法识别ZIP文件或错误处理它们将导致文件名损坏。
将Unicode文件名存储在Zip文件的额外头字段中(UTF-8)
Bandizip将附加UTF-8文件名存储在ZIP格式的额外头字段中,同时将原始文件存储在MBCS中。 此方法也由APPNOTE定义为“Info-ZIP Unicode Path Extra Field(ZIP信息U码路径额外字段)”。 因为它使用额外字段来存储UTF-8文件名,所以文件大小将比前者大几十字节。 但是,原始文件名存储在MBCS中,因此文件更安全,更兼容。
由于大多数压缩程序(如7zip,Winrar和Winzip)都支持此功能,因此可以防止文件名在使用不同系统语言的操作系统中被破坏。

Unicode filenames in ZIP format

简单点说就是zip支持Unicode有两种方式,第一种方式是直接把文件名从本地代码转换成UTF8存储在zip文件中,第二种方式是依然在zip文件中存储本地文件名代码,然後把本地文件名代码转换成UTF8存储在ZIP文件的额外头字段中。第一种方式有可能会出现兼容性问题,第二种方式因为存储的还是本地文件名代码,所以绝对不会出现兼容性问题,但是这样就相当于把文件名存了两次,所以文件会大一些。

大家猜猜,好压、WinRAR、WinZip,以及加了cu参数的7-Zip分別支持哪一种Unicode存储方式?

实测好压支持的是第一种。

上面我用好压制作了一个「新建文本文档.zip」,裡面内容就是一个名为「新建文本文档.txt」的空文档,我用notepad++打开是这个样子的:

一堆乱码,注意那个「金區板缓XXXXX.txt」其实就是「新建文本文档.txt」的乱码。

选择UTF8编码。

正确的文件名就出来了。

我再把这个名为「新建文本文档.txt」的空文档用WinRAR压缩成zip格式,用notepad++打开:

注意前面是正确的文件名「新建文本文档.txt」,後面是乱码。

选择UTF8编码。

前面变成乱码,後面显示正确的文件名「新建文本文档.txt」。

这个用WinRAR制作的文件比先前用好压制作的文件大了48个字节。

这就是第二种方式,实测WinZip用的也是这种方式。

至于7-Zip,它用的是跟好压一样的第一种方式。

我们理一下思路:

zip文件有三种方式,第一种支持Unicode兼容性一般,第二种支持Unicode兼容性好但体积最大,第三种不支持Unicode体积最小。

好压使用的是第一种方式,WinRAR和WinZip使用的是第二种方式。7-Zip默认第三种方式,加入cu参数後是第一种,不支持第二种。

实际上像WinRAR和WinZip这种国际性大公司才是最在乎兼容性的,自由软件开發者我感觉都不太在乎兼容性。


9月30日更新:

说说bandizip这个软件。

安装之後右键菜单会多出来一个「新建文件夹」选项。

然後是传说中的压缩包预览功能。

發现问题所在了吗?bandizip佔的位置太大了,好压和WinRAR都只佔了四五行,bandizip一个软件就佔了十几行,挤得右键菜单都显示不全了。

按道理说,如果我想知道压缩包裡有什么,直接双击打开不就可以了吗?所以我给压缩包预览功能的评价是负分。

还有那个自动解压功能。压缩包裡面有个A文件夹,A文件夹裡面有个B文件,换別的软件解压出来都是A文件夹裡面有个B文件,而bandizip解压出来直接就是B文件,我还得自己建个文件夹把B文件放进去。

总之,许多bandizip吹爆的特性,反而给我造成了困扰。而去掉这些特性,bandizip就不剩什么了。

而且我认为bandizip的界面很「简陋」,这裡说明一下,我所谓的「简陋」意思可能和別人不太一样。

来对比一下。这是bandizip的压缩界面:

这是好压的压缩界面:

bandizip只有一个压缩时间。好压则是压缩时间、压缩速度、压缩率、文件个数什么都有。这就是我所谓的「简陋」,即功能上的「简陋」。

再来看看好压的配置界面,可以自定义压缩算法、字典大小、单词大小。以这个配置压缩解压需要多少内存直接给你标出来。7-Zip也不过如此了吧。

还可以编辑过滤列表,对不同後缀名的文件采用不同的压缩配置。

这就是为什么我宁愿使用有广告的好压,也不用干净清洁小巧的bandizip。


2019年10月1日更新:

刚才测试了一下Win7自带的explorer.exe对zip文件的支持情况,结论如下。

explorer压缩zip文件不支持Unicode,但是可以打开Unicode文件名的zip文件,实测好压和WinRAR压缩的zip文件都可以打开。

explorer只支持deflate和deflate64两种压缩算法,不支持其他压缩算法。

2019年10月2日更新:

感觉好像歪楼了,题目问的是为什么RAR 比 7Z 更流行。我总结一下,7-Zip相比于RAR至少有三大缺点:

⒈界面简陋

⒉压缩耗时高,佔用内存多(在有的人眼中这是优势)

⒊稳定性差,压缩包容易损坏

第三点不是我说的,我给大家摘一段bandizip对7z格式的评价(链接):

为了实现更高的压缩比,7z使用了包括报头压缩在内的各种方式。
但是,由于这些功能,当压缩文件受到轻微损坏时,几乎不可能恢复它。
因此,在以7z格式备份重要文件时,请注意不要损坏它们。
您可以在7Z网站上找到有关如何恢复损坏的7Z文件的信息,但即使对专家来说,完成恢复也是极其困难的。

有人说这是商业软件的刻意抹黑,我给大家转一段开源界大佬对7z的评价(链接):

The [LZMA2 format] contains an unrestricted mix of LZMA packets and uncompressed data packets. Each packet starts with a header that is not protected by any check sequence in spite of containing the type and size of the following data. Therefore, every bit flip in a LZMA2 header causes either a framing error or a desynchronization of the decoder. In any case it is usually not possible to decode the remaining data in the block or even to know what failed. Compare this with [Deflate] which at least does protect the length field of its non-compressed blocks. (Deflate's compressed blocks do not have a length field).

这段文字是什么意思呢?我简单解释一下,LZMA2是7z的默认压缩算法,用这种算法压缩文件会产生这么一种情况:

假如一个普通文件内容是「ABCDEFG」,然後它第二个字节损坏了,我们看到的就是「A?CDEFG」。但如果这是一个使用了LZMA2算法的7z压缩包,我们看到的就是「A??????」。

Therefore, every bit flip in a LZMA2 header causes either a framing error or a desynchronization of the decoder. In any case it is usually not possible to decode the remaining data in the block or even to know what failed.翻译:因此,在LZMA2报头中的每个位翻转都会引起解码器的帧错误或者同步失调。在所有情况下,通常都不可能解码块中的剩余数据,甚至都不知道哪裡错了

最後,这位大佬给出的建议是:不要用LZMA2算法储存重要文件。

也就是说,如果你坚持使用7z格式,那么你就祈祷吧,祈祷压缩包裡一个字节错误都不要有。因为只要出现一个字节错误,整个压缩包就废了。

所以,即使不考虑时间因素,rar相比于7z仍然是有优势的。


2019年10月4日更新:

今天评论区还有人对我说:你说的不对,zip格式不支持Unicode。唉……

说个可能会违反大家常识的事:一般人可能会认为7-Zip这种免费软件靠的是口碑,WinRAR这种商业软件靠的是宣传。

错!

真实的情况是:WinRAR靠的是口碑,而7-Zip靠的是宣传

我印象中从来沒见过WinRAR做广告宣传过它自己。WinRAR崛起靠的是它良好的口碑带动人民群众用脚投它的票。

7-Zip並不是缺乏宣传推广,而是它的宣传推广已经过头了。过头到什么程度?明明是7-Zip自己的zip格式不支持Unicode,现在好多人以为全世界的zip格式都不支持Unicode。7-Zip的bug已经快变成feature了

我试过很多压缩软件,只有7-Zip的zip格式默认不支持Unicode。其他不支持Unicode的软件,我都能在他们的安装目录裡找到7z.dll,这些软件都是直接把7-Zip的东西拿过来用,都不带改的。

有人说什么国外都用7z,于是就有了这么一个有趣的问题:(为什么 Linux 要用 tar.gz,很少用 7Z 或 ZIP)?作为一个自由软件,7z连它的大本营linux都沒有搞定

还有人说什么国外注重版权,都不用rar。我给大家看一张英文维基百科的截图:

英文维基百科对rar的评价是:second in popularity to .zip files.人家对7z可沒有这么高的评价。

类似的还有bandizip,有人做宣传说bandizip支持Unicode,而WinZip和WinRAR都不支持?

我發现,像7-Zip和bandizip这种免费软件,其官网还是比较靠谱的,基本沒什么虚假宣传。但是其免费的特征,会招来一群人帮他们做免费宣传。然後这群人中的大部分啥都不懂,但是想象力很丰富,会自动脑补出一些並不存在的东西。比方说他们看到7-Zip宣传自己的7z格式支持Unicode,就会自动脑补成zip格式不支持Unicode;他们看到bandizip宣传自己的zip格式支持Unicode,就会自动脑补成別家的zip格式不支持Unicode。明明bandizip的大标题是「ZIP格式的Unicode文件名」,正文说的是「我们和WinZip、WinRAR一样都支持Unicode」,这些人连点进去看一眼正文的想法都沒有。

然後这些人对他们宣传的东西有一种谜之自信。有人说7z格式易损坏,马上就会有人跳出来说你有什么证据?沒有人会把自己的缺点放在官网上宣传,然後这群人的逻辑是:7z不说它有这个缺点,那么它就沒有这个缺点,你这样造谣污蔑肯定是收了钱的。

为什么我说7z易损坏的时候要引用那么多资料呢?因为我害怕被人喷。


10月6日更新:

我记得我已经把这个评论踩下去了。怎么又被顶上来了?

这个评论存在事实错误。因为我用的都是默认配置,7z的默认配置是16M字典大小:

WinRAR的默认配置是是32M字典大小:

居然还有43个赞,可见7z的虚假宣传多么严重了。

市场永不失效。——这是我学了经济学之後最大的收获。

一提起市场失效,大部分都会想到德沃夏克键盘和QWERTY键盘的故事。我学经济学之前也认为这是一个市场失效的典型案例。但是後来我知道了三点我以前不知道的东西:

⒈德沃夏克键盘是有专利的,每一个使用德沃夏克键盘的人都要给德沃夏克交专利费,而QWERTY键盘免费。

⒉所有德沃夏克键盘优于QWERTY键盘的实验,都是德沃夏克自己搞的,他是在推销自己的产品,所以其实验的真实性值得怀疑。

⒊德沃夏克键盘並不完美,比如说现代英语中I的使用频率远高于U,但是德沃夏克键盘把U放在了比I更顺手的位置上。

我觉得第一点就能把这个问题下的大多数人劝退了。

有人说什么WinRAR的流行靠的是盗版软件,装机的人都装WinRAR,用户沒有选择权。

问题来了:为什么装机的人都装WinRAR呢?还不是因为它好用!

这就好比说Windows为什么流行?因为国内电脑都预装盗版Windows,用户沒有选择权。

我才不会告诉你们当年我的笔记本电脑上预装的就是Linux,我回家第一件事就是把Linux格了,换个盗版Windows装上去。

如果装机的人选择7-Zip而不是WinRAR,最大的可能不是用户从WinRAR迁移到7-Zip,而是他这个电脑卖不出去了。

目前的现状是:Windows平台上最流行的压缩格式是zip,其次是rar(rar是第二流行的压缩格式这种观点是英文维基百科说的)。

Linux平台上最流行的压缩格式是tar.gz,其次是tar.bz2。

zip用的是deflate算法,tar.gz用的也是deflate算法,其实就相当于换了个後缀名。tar.bz2用的是bzip2算法,rar用的是私有压缩算法。

这三种压缩格式中,综合考虑压缩率、压缩时间、稳定性等等因素,rar是最好的,但是它收费,所以屈居老二,zip排第一,这很合理,很符合市场规律。

现在好多人吹捧7z的同时都要把zip踩一下,这真是令人无语的操作。很多人都不知道,其实zip也是开源格式。现在压缩界的龙头老大,是被一个开源格式牢牢掌控着的,这个格式就是zip。我平时压东西用的也是zip。

7z三大缺点,一丑二慢三不稳定。按理说第一个缺点是最不重要的,为什么人们常常提起的反而是第一个缺点呢?

这是因为「丑」这个缺点,是一眼就能够看见的,不容抵赖。後两个缺点不是长年累月地使用是不会發现的。

我以前也用7-Zip,7-Zip的zip格式默认不支持Unicode文件名这种坑点我是亲身实践發现的。像WinRAR这种商业软件,人人得而诛之,它一旦出现什么问题就会被人挑出来指着鼻子骂;而7-Zip这种免费软件,推销的人都会或多或少地美化它。WinRAR名面上有很多坑,但是我们知道它就只有这么多坑,而7-Zip看似完美的表象下你根本不知道它有多少坑。


2019年10月9日更新:

自v7.0开始,Bandizip会发布3种版本

标准版:为大众提供的免费的版本
专业版:为专业用户提供的付费版本
企业版:为企业用户提供的付费版本

自7.0开始,Bandizip将会在软件中加入广告,强制更新,並且不再提供离线安装包。希望广大Bandizip爱好者届时能继续支持这个软件,呵呵。


2019年11月3日更新:

有人说字典大小不同不能比较,那我来一个字典大小相同的比较实验:

zip用32K字典,rar和7z都用1M字典,使用的测试材料是中文小说,结论如下。

压缩耗时比:

zip标准:RAR标准:7z快速:7z标准=1:2.5:4.8:9

最终文件大小的比例是:

zip标准:RAR标准:7z快速:7z标准=120%:1:107%:93%

bandizip很鸡贼,他的「正常压缩」使用的是7-Zip「快速压缩」的参数,他的「最大压缩」使用的是7-Zip「标准压缩」的参数。所以使用bandizip压7z的时候,我们会發现他的压缩速度比较快,但是压缩比不高。


2021年10月10日更新:

「7-Zip 现在会为 UTF-8 编码的文件名写入额外的字段至 zip 压缩包中。

这可以让 zip 压缩包在不同系统中提取时能得到正确的文件名。」

7-Zip终于加入Unicode支持了,版本号是21.02 alpha,更新时间是2021年5月6日。

标准zip加入Unicode文件名的时间是2006年。时隔15年之後,7-zip终于支持这个标准了,真是不容易。

另外bandizip所谓的「高速压缩」实测是假的,宣传口径而已。




  

相关话题

  哥德巴赫的猜想如果被证实,对数学和全人类有什么意义? 
  奇异值的物理意义是什么? 
  若 π 被证明是有理数会对世界有何影响? 
  孩子今年六年级,数学一塌糊涂,作为家长该怎么帮助她提升成绩? 
  这道极限怎么求呢? 
  格林公式为什么不对称啊? 
  如何直观地理解「共轭」这个概念? 
  数学证明题可以这样做吗? 
  预测一下到今年年底本轮中美搏弈的结果大概率是什么? 
  什么叫做泛函空间的大数定律? 

前一个讨论
将傅满洲改造成东方正义英雄,来反文化入侵如何?
下一个讨论
马斯克旗下的脑机接口公司 Neuralink 宣布 2020 上半年将进行人体测试,将带来哪些影响?





© 2025-01-18 - tinynew.org. All Rights Reserved.
© 2025-01-18 - tinynew.org. 保留所有权利