百科问答小站 logo
百科问答小站 font logo



做中文 NLP 的时候,大家为啥不用拼音? 第1页

  

user avatar   wu-wo-cao 网友的相关建议: 
      

首先这引入了两个新问题,多音字问题。同音字问题。然后。。。这还是要分词。所以意义在哪里。


user avatar   maigo 网友的相关建议: 
      

该从哪里开始吐槽呢?

  1. 给汉语文本注音本身就是一项颇有难度的NLP课题。
  2. NLP中的通用方法是以「词」为单位的。把汉字转换成拼音之后,如果依然是以字为单位,那么还是没法处理。如果要分词,那么没必要转换成拼音。



  

相关话题

  2022 年人工智能领域的发展趋势是什么?你都有哪些期待? 
  在中文 NLP 等论文中,应该如何翻译 token 这个词? 
  在NLP上,CNN、RNN(认为LSTM等变体也是RNN)、最简单全连结MLP,三者相比,各有何优劣? 
  如何理解Inductive bias? 
  预训练模型的训练任务在 MLM 之外还有哪些有效方式? 
  如果用机器学习的理论来理解人的行为,会有什么发现? 
  如何评价浪潮发布的2457亿参数源1.0智能大模型?与GPT-3相比如何?处于AI模型领域什么水平? 
  如何评价微软机器翻译在 WMT2017 中英翻译达到「人类水平」? 
  如何理解深度学习源码里经常出现的logits? 
  如果推出一款有「滤镜」功能的写作软件,修饰平庸的文字,会有市场吗? 

前一个讨论
虚拟电话号存在的意义到底是什么?
下一个讨论
JavaScript 有必要缓存 for 循环中的 Array.length 吗?





© 2025-06-19 - tinynew.org. All Rights Reserved.
© 2025-06-19 - tinynew.org. 保留所有权利