百科问答小站 logo
百科问答小站 font logo



信息熵极低的文字会是什么样子?信息熵极高的文字又是什么样子? 第2页

     

user avatar   a-ke-xi-si-fen-hui-chang 网友的相关建议: 
      

极低的有政治学大佬回答了。我就来个极高的:

你女朋友背着我偷吃。


user avatar   hu-guang-qi-shi-zhu 网友的相关建议: 
      

说一个文字极其简洁,但信息量丰富的例子,出自孔子的《春秋》:

郑伯克段于鄢。

整件事描述只有六个字,郑伯和段是人物,克是行为,鄢是地点。这么看起来平淡无奇的几个字,很多人看一眼就过去了。然而一些学者并不这么认为,他们认为每个字都有巨大的信息量。《春秋》偏偏就是一本这么简洁的书,于是他们特地写了几本书来解释它。


比如《春秋谷梁传》:

克者何?能也。何能也?能杀也。何以不言杀?见段之有徒众也。
段,郑伯弟也。何以知其为弟也?杀世子、母弟目君,以其目君知其为弟也。段,弟也,而弗谓弟;公子也,而弗谓公子。贬之也。段失子弟之道矣,贱段而甚郑伯也。何甚乎郑伯?甚郑伯之处心积虑成于杀也。
于鄢,远也,犹曰取之其母之怀之云尔,甚之也。
然则为郑伯者,宜奈何?缓追,逸贼,亲亲之道也。

这位作者认为用“克”字不用“杀”,表明是战争中击败了对方的军队。段其实是郑伯的弟弟,但不说弟或公子,因为段没有做到一个弟弟应有的德行。而鄢是个离郑国中心比较远的地方,说明是郑伯处心积虑,先放跑了段,然后又前去击败了段。

也就是说,这六个字其实描绘了一段关于兄弟反目的惊心动魄的阴谋。


另一本《春秋公羊传》也给了自己的解释,与《春秋谷梁传》类似:

夏五月,郑伯克段于鄢。克之者何?杀之也。杀之则曷为谓之克?大郑伯之恶也。曷为大郑伯之恶?母欲立之,己杀之,如勿与而已矣。段者何?郑伯之弟也。何以不称弟?当国也。其地何?当国也。齐人杀无知何以不地?在内也。在内虽当国不地也,不当国虽在外亦不地也。

这段文字提到,用“克”字不用“杀”,是为了强调郑伯的恶。还提到是母亲想要立弟弟段,而郑伯先给他封了土地,又杀了他。于是出现了第三个角色,两人的母亲。


尽管上面两段文字都有对文字的解释,相信很多人都还是看得一头雾水。其实,还有一部解释更为详细的著作,并且很可能掺杂了很多想象,以至于让事件看上去像一篇绘声绘色的小说。这个作者是个盲人,叫左丘明,著作叫《春秋左氏传》:

初,郑武公娶于申,曰武姜。生庄公及共叔段。庄公寤生,惊姜氏,故名曰“寤生”,遂恶之。爱共叔段,欲立之,亟请于武公,公弗许。及庄公即位,为之请制。公曰:“制,岩邑也,虢叔死焉,佗邑唯命。”请京,使居之,谓之“京城大叔”。
祭仲曰:“都,城过百雉,国之害也。先王之制:大都,不过参国之一;中,五之一;小,九之一。今京不度,非制也,君将不堪。”公曰:“姜氏欲之,焉辟害?”对曰:“姜氏何厌之有?不如早为之所,无使滋蔓。蔓,难图也。蔓草犹不可除,况君之宠弟乎?”公曰:“多行不义,必自毙,子姑待之。”
既而大叔命西鄙、北鄙贰于己。公子吕曰:“国不堪贰,君将若之何?欲与大叔,臣请事之;若弗与,则请除之,无生民心。”公曰:“无庸,将自及。”大叔又收贰以为己邑,至于廪延。子封曰:“可矣。厚将得众。”公曰:“不义不昵,厚将崩。”
大叔完聚,缮甲兵,具卒乘,将袭郑。夫人将启之。公闻其期,曰:“可矣!”命子封帅车二百乘以伐京。京叛大叔段。段入于鄢。公伐诸鄢。五月辛丑,大叔出奔共。
遂置姜氏于城颍,而誓之曰:“不及黄泉,无相见也。”既而悔之。
颍考叔为颍谷封人,闻之,有献于公。公赐之食。食舍肉。公问之,对曰:“小人有母,皆尝小人之食矣,未尝君之羹。请以遗之。”公曰:“尔有母遗,繄我独无!”颖考叔曰:“敢问何谓也?”公语之故,且告之悔。对曰:“君何患焉?若阙地及泉,隧而相见,其谁曰不然?”公从之。公入而赋:“大隧之中,其乐也融融!”姜出而赋:“大隧之外,其乐也洩洩!”遂为母子如初。
君子曰:“颖考叔,纯孝也。爱其母,施及庄公。《诗》曰:‘孝子不匮,永锡尔类。’其是之谓乎?”

相信很多人已经在语文书中读到过这篇文章。它对整个事情有了详尽的说明,即两人的母亲武姜因为郑庄公难产而讨厌他,而偏心于他弟弟段,以至于多次跟郑武公说改立段为继承人,但武公没同意。后来庄公即位,在母亲请求下,将段封到了一个还不错的地方。段心有不满,搞小动作,大臣于是劝庄公早点灭了段。庄公却说咱们不急,要让他“多行不义必自毙”。在表面的忍让下,段更加胡作非为,在作死的路上越走越远,甚至发起武装叛乱。庄公早有准备,在鄢轻松击败了段。另一方面,他发誓除非下黄泉,绝不和母亲相见。但转眼就表示真香,和母亲在隧道里冰释前嫌。活脱脱一出峰回路转而感人肺腑的故事情节。


这样,整件事背后的权谋就很清楚了。如果庄公直接搞弟弟,大家会觉得庄公无情,母亲那边也说不过去。然而他下了个套,既能完全灭了段,又不会让自己的势力和名声受损。贪心又傻乎乎的段果然钻进去了。在外人看来,情况就变成了:“哎呀弟弟,我明明对你这么好,你为什么非要这样作死逼我搞你”。

当然,对于这些,孔子等史家都清楚地看在眼里。“郑伯克段于鄢”这六个字可谓精准地概括了整件事情。《左传》里说的是郑庄公,但孔子故意说郑伯,按照“公侯伯子男”的顺序,可能还是对他的鄙视。(此处有争议,我是查阅过一定资料,有学者这么认为,所以这么写,不代表事实如此。如果有不同意见,你是对的。)

因为儒家讲究的是“孝悌”的家庭伦理道德,后世史家也对于郑庄公的这个做法持否定态度。他们认为作为兄长,应该对亲弟弟团结和规劝。历史上因为权力斗争,兄弟相残的故事也并不少。


于是大家明白了,这正是《春秋》的风格,微言大义。短短的几个字暗含了对事件的叙述和作者的褒贬态度,每一个字都极其谨慎,所以有“孔子作春秋,而乱臣贼子惧”的说法。这种写法后来被称作“春秋笔法”。当然,现在这种寥寥几个字但信息量巨大的文字已经基本见不到了。


user avatar   shi-yu-67-72 网友的相关建议: 
      

不妨让我们从汉字开始,一步步找到一种信息熵最小的符号表达系统

首先要明确题主的问题,根据描述以及描述中给出的相关问题,我对这个问题的理解是:能否找到这样一套文字系统(符号系统),使得和其他符号系统相比,要想表达相同的含义,这套符号系统所需要用到的符号个数最多。

然后再来明确一下信息熵,这一点我认为

@铜锈锈

已经解释得很好了,这也是我这个答案中唯一用到的公式,我也会尽量用通俗的语言说明它。

关于这个公式的说明(不想看或者看不懂可以跳):

H(x)为信息熵,我们的目的就是让它尽可能小;

n为这一套符号系统中拥有的符号种类的数量,例如对于英语来说,忽略大小写的话(大小写不太影响表意),每个字符可能为a,b,…,z以及空格,至少27个字符,所以英文的n为27。如果要考虑标点符号的话,n可以取得更大一些;

表示这是第i个字符,例如我们可以规定为‘a’,为'b’等等…当然也可以换个顺序,不过不会影响熵的计算结果;

则表示该符号出现的概率,还拿英语举例子,'e'这个字符明显要比'v'出现的多得多,所以对应的概率也会大一些;

b是对数的底数,可以简单理解为得出的这个熵的量纲,取多少不本质,一般取2。


那么要想让熵小的话,需要什么呢?根据这一个公式,得出的结论是有如下方法:

方法一:符号种类数量越小,信息熵越小
方法二:各符号出现的概率越不均等,信息熵越小

=============================================================

OK,我们现在开始寻找一种信息熵极低的符号系统。

首先,对于汉字来说,符号种类即汉字个数,我们光常用字就三千多个,这是在是太大了,难怪汉字言简意赅。

不行,我们需要一个n更小的符号系统。

于是我们把n逐渐减小,寻找到了韩文、日文……英文。这时已经只有27个符号了。然后我们发现英文果然比中文啰嗦了很多。。。

既然n越小熵越小,那我们不如一步到底吧!!

好,那我们让n=0

我们得到了一个没有任何符号的符号系统。

坑爹呢这是!!!!

既然零不行,那么我们让n=1。于是我们得到了一种新的文字系统,这种文字系统只有一种文字,简直碉堡了!接下来让我们用这种文字讲一个故事:

嗯,果然很长。

可是这真的可以吗?如果我们把n=1代入到公式中,会发现其实H=0,也就是说这种文字系统无法携带任何信息。因为不管什么信息用它表示出来都是这一种符号。(也许有人会说烫的个数可以用来表达,其实并不能,详见n=2)

那么我们再让n=2。

好,我们拥有了两个字符:”烫“和”屯“。

显然n=2是可以的,因为把摩斯电码写下来就是一种n=2的文字系统。或者我们可以把空格到z编号为0到26,用他们的5位二进制来表示。如a为烫烫烫烫屯,k为烫屯屯烫烫,……


=============================================================

好,我们已经把n压缩到极限了,方法一不再能使用,接下来只能从方法二继续下手了。

方法二:各符号出现的概率越不均等,信息熵越小

现在我们的语言有两个字符,而且出现的概率相差并不多,考虑到从27到31我们没有编码,和字母本身出现的概率不均匀,可能”烫“比”屯“出现的概率要略微大一些。

不行,两个概率还是太接近了,不如我们让1出现的概率为0吧!!



看来不能为0,那么就让其中一个符号出现的概率非常接近0,另外一个非常接近1不就行了?

没错!现在我们假想这样一种语言,它拥有两个符号:”烫“和”屯“,但表示0到26的不再是二进制编码,而是两个”屯“之间”烫“的个数。这也是n=1的情况不行的原因,因为在”烫“之间必须要有其他什么东西进行划分,才能让我们分清楚究竟有几个”烫“。

所以bad这个单词可以写成001010000(我还是用0和1吧…),而且我还可以用这种文字写出更长的话:

000000000000000010000000000001000001010000000000000000000100000110001000000000000100000000010001000000000001101000000010000000000000000001000001000001

嗯,果然又长了。

=============================================================

接下来让我们来比较一下这些语言

中文:你好(2个符号)

英文:hello(5个符号)

二进制1.0版:01000 00000 01100 01100 01111(25个符号,注:空格仅为看得清楚,实际上并无空格)

二进制2.0版:00000000100000100000000000010000000000001000000000000000(50个符号)

我们已经把两个符号就能表示清楚的意思变成了50个符号才可以表示了!如果继续让1出现的概率更小的话,这个值还可以提高!

=============================================================

那么,还可以从其他方面继续改进吗?

我们还可以引入冗余

通俗来说,冗余就是一些并无意义的编码。例如对于二进制2.0版,我们可以规定隔开那些0的不是1个1,而是10个1,这样的话,诸如001010000这种序列就不再有实际含义,相当于一个本来能表示某种含义的序列被浪费了,所以要表示同样多的含义就需要更多的符号。

这样即使1的概率变得比之前都要高,即使bad这样一个简单的词,都会变成:001111111111011111111110000(27个符号)。。。如果把10个1改成1000个1就更多了,这种冗余的引入其实可以说是无穷无尽的,要多少有多少!!0000011111111110000000000000000000000001111111111000111111111100000000011111111110000000000000000000011111111110000011111111110000!!!!!


user avatar   chang-jiang-zhi-shui-ke-ze-wan-min 网友的相关建议: 
      

我觉得现在来谈赢家还为时过早,因为几个能决定战后格局的重要因素还无法确定。但有两点可以基本确定了:这场战争没三个月无法结束,北约方面不会派兵直接干涉。所以从这两点来看,欧佩克等能源输出国(除了俄罗斯)将肯定是赢家;同时国际资本将向美国回流,美联储终于有了加息的物质基础。

至于未来的国际政治秩序和金融格局等都存在很大不确定性。甚至俄罗斯过两年熬到懂王上台后咸鱼翻身也不是没可能。唯一可以确定被严重打击的就是现有国际秩序将会礼崩乐坏,我们又要回到霍布斯丛林了。


user avatar   huiyi324 网友的相关建议: 
      

领导的讲话。

你浪费了一分钟,就浪费了六十秒。

门外有两棵树,一课是枣树,另一棵也是枣树。

听君一席话,如听一席话。

一日不见,如隔一日。

这么晚还没睡的人应该都还没睡吧。

七日不见,如隔一周。

但凡你这话有点道理,也不至于一点道理也没有。

剥开香蕉后,你会发现一个剥了皮的香蕉。

总而言之,这个事就是这么个情况,具体的大家也都看得到。因为啊,这件事上面有个问题,所以你可能听的不是很明白。但是意思就是这么个意思。至于这件事到底怎么了你不要去猜,这种事情见得多了,我只能说懂得都懂。不懂的也不用多解释,毕竟自己知道就好,细细品吧。

小张上次来华盛顿的时候,还是在上一次。据统计,华盛顿100%的留学生都在华盛顿上学。谁能想到,25岁的小张三年前刚来华盛顿的时候只有22岁。小张做了一场半小时的 presentation,整整用了30分钟。小张上午去 Dunkin 买了两杯冰咖啡,一杯是冰的,另一杯也是冰的。谁能想到,绿线在开得不慢的时候,还是开得挺快的。华盛顿的堵车有多堵车,就是这么堵车。当你在93上堵了60秒,你的生命就流逝了一分钟。华盛顿大学的物理学教授竟然教了一整节课的物理。华盛顿冬天下大雪的时候,没有一片雪花是不下的。如果华盛顿不是那么冷的话,还是挺热的。据统计,每一个从哈佛毕业的学生,都毕业于哈佛。据统计,MIT数学系的学霸,数学成绩都特别好。据统计,华盛顿的第一高楼,竟然比第二高楼要高。据统计,每三个华盛顿人,都有三个人。

下面来看看信息熵高的

今日份仙女营业啦 无语子 今天去买奶茶鸭 救命 我真的哭死 呜呜呜这家店的奶茶真是yyds 啊啊啊啊啊啊蛋糕也是绝绝子鸭 我暴风吸入 好喝到跺jiojio 路上还看见一个普信男 真下头 不管啦 今天跟集美也是在逃公主的一天 好想谈一场双向奔赴的恋爱呜呜呜今天跟集美出去逛街啦,搞点神仙甜品778顺便暴风吸入好喝到剁jiojio的加芋圆加布丁加椰果加芋泥加奥奥碎加脆啵啵加奶盖加花生加燕麦加红豆加砒霜的奶茶最后缓缓口服一片v商购入的三无控糖片,还点了茶百道的分装做了个隐藏甜品吃,茶百道yyds,小狗勾暴风吸入隐藏甜品后好吃到翘jiojio,真的绝绝子 ~还点了茶百道的分装做了个隐藏甜品吃 真的绝绝子啊!!茶百道的分装就是yyds 今天跟集美也是在逃公主的一天 害,明天又得回学校啦好烦啊感觉我的室友们都好土 连live house是什么都不知道也不听落日飞车 不说了,明天又是干饭人干饭魂的一天,集美我在快乐星球得了那个大病,但是我不治,诶就是玩儿,真是绝绝子 ,你寄吧谁啊?这里都是快乐星球的凡尔赛人,你是什么牛马,这里有个人夺笋,但我不说是谁,因为他夺了,但也没完全夺。乌鸡哥乌鸡哥yyds,不传谣,不信谣,坐等团团反转。哦哦哦哦哦哦哦哦!。急了急了,勇敢牛牛不怕困难。危险⚠️!危险⚠️!危险⚠️!好久不见终于等到你出现~雨下整夜eieieieieieieieieieieieieieiei哥们我一直稳定发力⚡⚡⚡这几年犀利又糊涂起起又伏伏感觉像在冲浪 拉长耳朵 提高警觉⚠️ 神经细胞 全面戒备 ‍♀️你的电话☎️绝不漏接 晕啊晕啊晕 危险⚠️!危险⚠️!危险⚠️!好久不见终于等到你出现~雨下整夜eieieieieieieieieieieieieieiei哥们我一直稳定发力⚡⚡⚡这几年犀利又糊涂起起又伏伏感觉像在冲浪 拉长耳朵 提高警觉⚠️ 神经细胞 全面戒备 ‍♀️你的电话☎️绝不漏接 晕啊晕啊晕 危险⚠️!危险⚠️!危险⚠️!好久不见终于等到你出现~雨下整夜eieieieieieieieieieieieieieiei哥们我一直稳定发力⚡⚡⚡这几年犀利又糊涂起起又伏伏感觉像在冲浪 拉长耳朵 提高警觉⚠️ 神经细胞 全面戒备 ‍♀️你的电话☎️绝不漏接 晕啊晕啊晕​

再来个信息量很大的:

床上有两个枕头,一个是我的,另一个是隔壁老王的。


user avatar    网友的相关建议: 
      

黄码管理哪够?“黄码管理+征信档案”配合使用效果最佳,是当前最有效的管理措施。


一些地方把闯红灯、错误垃圾分类、手机声音外放、公交吃东西等等纳入失信行为,这个未参与全员核算检测的,不仅仅要黄码管理,更得上个人征信管理系统,还有啥措施,一并上。

回答完这个,才发现另外一个热点:河南教育厅规定「学生寒假违规补课将计入个人诚信档案 」zhihu.com/question/5126


1:全员核酸急迫性:一个没有大规模新增病例的城市2天内全部核酸的急迫性在哪里?

过往一年黑龙江VS上海市新增病例对比

2:全员核酸必要性在哪里?上海新增病例每天基本没断过,虽然大多是入境者,市区也出现过多次病例情况了,也都没那么紧张。最大规模的也就是迪斯尼那次几万人次核酸,也被人喷不科学。即便是做核酸也在很小范围才有,精确到小区的单元楼。我隔壁先后两个楼被临时封闭2天做核酸,但对其他楼没有任何影响。

3:擅变黄码科学性在哪里:健康码颜色制定本来是从科学范围来预估一个风险可能性,不管三七二十八直接变黄码的操作真是高,实在是高!


user avatar   huang-di-de-xin-zhuang-54 网友的相关建议: 
      

大家知不知道特斯拉每次回应说的“后台系统显示一切正常”、“后台显示踏板踩得清”里面所说的“后台系统”是什么意思?

特斯拉的意思是说,你在特斯拉上面的一举一动,从你说的每一句话,你的每一个动作,你的体重身型,你的每一次油门和刹车踩塌,你用特斯拉听的每一首歌,特斯拉车身上每个录像机的内容,全部上传到特斯拉公司,特斯拉公司可以任意调用。

我在美国大科技公司也做了一段时间,这种监视用户一举一动的烂事也被迫做了不少。我跟你保证,美国没有一个科技公司没有在做侵犯用户隐私的事情。对,一个都没有!


而特斯拉和谷歌之类的普通美国科技公司有什么区别呢?特斯拉和普通美国科技公司的区别是,特斯拉老板马斯克非常受美国统治阶级和军工系统的信任。马斯克的另外一个公司SpaceX是美国航空航天局和美国军方的承包商。马斯克可以说是美国第一大军火商。

也就是说每一个特斯拉用户的性格、习惯,都尽在美军掌握。每一台特斯拉,都可能成为美军在中国的全角度监视摄像头。你买的每一台特斯拉,可能都会变成在中国大地上的一台艾布拉姆斯主战坦克。

抵制特斯拉,人人有责。


对了,忘记说一件事。你们知道为什么刹车踏板“踩不下去”吗?因为很可能刹车踩不踩得下去,踩下去了有没有用,甚至油门踩不踩得下去,方向怎么控制,都是特斯拉的程序决定的。到时候要是美国准备向中国突袭,直接让你们车毁人亡再撞死几个行人都可能。

什么,你说美国不会伤害平民?请问你忘了美国是唯一一个使用核武器的国家吗?请问你忘了美国用核武器一次无差别杀害几十万日本平民了吗?请问美国现在忏悔了吗?现在向原子弹受害者道歉了吗?

什么,你说日本是坏的,中国是好的?很可惜在美国统治阶层的洗脑之下,普通美国人不是这么认为的:


user avatar   Due. 网友的相关建议: 
      

这次舆论的重点在于警察到底是多久赶到的。

没拜码头,收保护费,打砸门面这种原因我们都知道,也不怕;

但是公权力私用或者黑白勾结这种事,就会让人非常害怕;

如果西安公权力真的黑白勾结,还睁眼说瞎话,那就需要处理整顿了。

我朝的治安也不是一直这么好的,人民也不是软弱无比的,60年代西安打的也很凶的。难不成西安各公司以后都要雇佣保安公司保护经营?

这次出警距离1公里,走路10分钟都到了,所以就坐等这次真实的出警时间是多少了。



user avatar   duo-lin-guo-duolingo 网友的相关建议: 
      

共产主义政党长期治理的喀拉拉邦在印度处于人类发展指数的前茅,这就是共产主义对印度的影响。

印度及印占藏南、印占克什米尔的人类发展指数


另外,南亚人是非常非常喜欢取经名的。这也是一个地域特色了。




     

相关话题

  你见过哪些让你瞠目结舌的日语翻译? 
  为什么中国没有大量的出现西方那样的城堡型建筑? 
  中文是否有类似英语的高级词汇与普通词汇之分? 
  如何看待中央网信办进一步规范娱乐明星网上信息,严防违法失德明星艺人「曲线复出」? 
  一个国家里母语不是官方语言的公民有学好官方语言的义务吗? 
  为什么汉语拉丁化改革没有成功? 
  除了汉语以外,还有其他语言用作为天体的「日」「月」来表示时间的吗? 
  为什么欧洲不愿意接纳俄罗斯? 
  明王朝两百七十六年历史里最让你难忘的事件或者细节是什么? 
  “真正的公知”是怎样定义的?是不是有很多人不喜欢“公知”?如果是,为什么?如果不是,为什么有人这么说? 

前一个讨论
南通交警回应「江苏一轿车涂日本 731 部队标志」 人车都已控制,涉事车主需承担哪些责任?
下一个讨论
英国政权为什么能在长期保持理性?





© 2024-11-08 - tinynew.org. All Rights Reserved.
© 2024-11-08 - tinynew.org. 保留所有权利