百科问答小站 logo
百科问答小站 font logo



如何看待70岁老教授花费2年时间让收藏在伯克利的中文古籍善本通过达摩院技术,以数字化方式回归故土? 第1页

  

user avatar   xi-er-weng 网友的相关建议: 
      

这个事儿,得从不同角度来看。

从技术开发的角度来看,阿里开发的这个古籍OCR系统准确率和实用性方面,算是目前市面上比较好的。其实,目前市面上的古籍OCR平台很少,除了书同文有一个付费系统之外,其他很多都还在画饼,比如北大的吾与点。汉典重光的问题还有不少,比如支持的字符集比较小,分区不够准确,对大小字混排的处理也有缺陷。不过毕竟目前免费,也没有限制,所以现在来看是很不错的。

从古籍整理研究的角度来看,其实意义没有那么大。

应当承认,古籍数字化这项工作是有极大意义的,但是这次把加州大学伯克利分校藏的这些宋元版数字化,够不上称为“回归故土”。一方面,这些宋元版早就影印出版了。中华书局2014年出版由周欣平先生主编的《柏克萊加州大學東亞圖書館藏宋元珍本叢刊》,囊括该校馆藏的41中宋元古籍。要是数字化算“回归”,那影印难道算不得回归?另一方面,人家伯克利图书馆早就把这些古籍都扫描放到网上了。国外许多公立高校图书馆和公立图书馆,基本都会将自己馆藏的古籍扫描放到网上公开。国内用户只要能申请到账号,自然可以查看图像,算不算回归?

这里插一句。国外公立图书馆在古籍数字化的态度上跟大陆的公立图书馆完全不一样。咱们的图书馆馆藏古籍,越是珍贵的越是秘不示人。近几年也就国图主持的中华古籍资源库值得称道,可是这个数据库也只能浏览,不提供下载。而且扫描拍照的工序也不够规范。比如日本的国立公文书馆和国立国会图书馆,图像上一定有色标和卡尺。国图的从来没有。这很不利于用户了解古籍原本的纸色、墨色和尺寸。

汉典重光上放出来的扫描图像清晰度一般,也没有色标和卡尺。UI设计得也不够亲切,操作上并不顺畅。而且也没有卷次的书签,不能方便的转跳。古籍介绍上连作者、版本信息、版式信息都没有,简陋得不行。比如《后村居士集》:

啥信息都没有。人家伯克利图书馆网站上的著录信息都比这丰富:

然后这本书的页面被搞得乱七八糟,真不知道是怎么回事。第一二页是莫名其妙地封底,第三、四页则不知道是正文什么地方:

人家伯克利图书馆这本书第一册的浏览界面是这样的:

这不比你达摩院捣鼓出来的玩意儿强多了?讲真,汉典重光数字化的专业性实在是不太够。陈力先生当然是老前辈了,他在文献学上的专业性不必质疑。只是在古籍数字化这一块,估计确实是没怎么接触过,也就任由达摩院自己去乱搞了。




  

相关话题

  如何看待一女子带两孩子入住上海一高级酒店后加被子被要求另付 380 元?酒店的要求是否合理? 
  局长出资 20 万买原料在空办公楼制毒,3 人被执行死刑,背后涉及哪些制毒产业链? 
  以色列在研新药 5 天内治愈 90% 新冠重症者,具体情况如何?如何评价以色列在医学领域的成绩? 
  如何看待「反杀霸凌者」陈泗翰被判 8 年出狱,死者家属曾放话称要报复?怎样能有效阻止校园霸凌? 
  西方传说中辉煌的古罗马,明明就是中国的五代十国状态,这也好意思叫帝国? 
  世界历史上,除中国以外有哪些著名的叛国贼? 
  为什么汉唐之前的汉人和汉唐之后的汉人精神面貌区别会这么大? 
  2021年8月3日是萨布林被处死45周年,从现在看来当年萨布林起义可能成功吗? 
  有哪些好看的明清小说? 
  为什么日本原来的军事那么厉害,可以和美国对着打,现在却不行了,感觉像美国的一条狗? 

前一个讨论
就我一个人觉得《禁忌女孩》三观不正吗?
下一个讨论
如何看待大卫·贝克汉姆正式入选英超名人堂?





© 2025-05-19 - tinynew.org. All Rights Reserved.
© 2025-05-19 - tinynew.org. 保留所有权利