百科问答小站 logo
百科问答小站 font logo



如何看待70岁老教授花费2年时间让收藏在伯克利的中文古籍善本通过达摩院技术,以数字化方式回归故土? 第1页

  

user avatar   xi-er-weng 网友的相关建议: 
      

这个事儿,得从不同角度来看。

从技术开发的角度来看,阿里开发的这个古籍OCR系统准确率和实用性方面,算是目前市面上比较好的。其实,目前市面上的古籍OCR平台很少,除了书同文有一个付费系统之外,其他很多都还在画饼,比如北大的吾与点。汉典重光的问题还有不少,比如支持的字符集比较小,分区不够准确,对大小字混排的处理也有缺陷。不过毕竟目前免费,也没有限制,所以现在来看是很不错的。

从古籍整理研究的角度来看,其实意义没有那么大。

应当承认,古籍数字化这项工作是有极大意义的,但是这次把加州大学伯克利分校藏的这些宋元版数字化,够不上称为“回归故土”。一方面,这些宋元版早就影印出版了。中华书局2014年出版由周欣平先生主编的《柏克萊加州大學東亞圖書館藏宋元珍本叢刊》,囊括该校馆藏的41中宋元古籍。要是数字化算“回归”,那影印难道算不得回归?另一方面,人家伯克利图书馆早就把这些古籍都扫描放到网上了。国外许多公立高校图书馆和公立图书馆,基本都会将自己馆藏的古籍扫描放到网上公开。国内用户只要能申请到账号,自然可以查看图像,算不算回归?

这里插一句。国外公立图书馆在古籍数字化的态度上跟大陆的公立图书馆完全不一样。咱们的图书馆馆藏古籍,越是珍贵的越是秘不示人。近几年也就国图主持的中华古籍资源库值得称道,可是这个数据库也只能浏览,不提供下载。而且扫描拍照的工序也不够规范。比如日本的国立公文书馆和国立国会图书馆,图像上一定有色标和卡尺。国图的从来没有。这很不利于用户了解古籍原本的纸色、墨色和尺寸。

汉典重光上放出来的扫描图像清晰度一般,也没有色标和卡尺。UI设计得也不够亲切,操作上并不顺畅。而且也没有卷次的书签,不能方便的转跳。古籍介绍上连作者、版本信息、版式信息都没有,简陋得不行。比如《后村居士集》:

啥信息都没有。人家伯克利图书馆网站上的著录信息都比这丰富:

然后这本书的页面被搞得乱七八糟,真不知道是怎么回事。第一二页是莫名其妙地封底,第三、四页则不知道是正文什么地方:

人家伯克利图书馆这本书第一册的浏览界面是这样的:

这不比你达摩院捣鼓出来的玩意儿强多了?讲真,汉典重光数字化的专业性实在是不太够。陈力先生当然是老前辈了,他在文献学上的专业性不必质疑。只是在古籍数字化这一块,估计确实是没怎么接触过,也就任由达摩院自己去乱搞了。




  

相关话题

  有哪些人物在世时就被娘化? 
  「千古完人空一格」是什么梗? 
  为什么土改以前,很多地主的绰号都叫「某善人」? 
  太平天国时期的江南大营和江北大营是种怎样的存在? 
  东北长春能有多冷?一小伙放车里的可乐都冻炸了。还有哪些你经历过的因为「太冷」而发生的趣事? 
  为什么李自成张献忠能与明军长期周旋,却在清军入关后迅速被杀? 
  韩国出土 1000 多个汉字金属活字,会给目前的历史文化研究带来哪些影响和意义? 
  机器学习包含哪些学习思想? 
  大多数对日本有敌意的中国人,是被舆论引导了吗? 
  如果歌德、巴赫、哥德巴赫相遇,他们大概会聊什么? 

前一个讨论
就我一个人觉得《禁忌女孩》三观不正吗?
下一个讨论
如何看待大卫·贝克汉姆正式入选英超名人堂?





© 2025-02-21 - tinynew.org. All Rights Reserved.
© 2025-02-21 - tinynew.org. 保留所有权利