百科问答小站 logo
百科问答小站 font logo



做中文 NLP 的时候,大家为啥不用拼音? 第1页

  

user avatar   wu-wo-cao 网友的相关建议: 
      

首先这引入了两个新问题,多音字问题。同音字问题。然后。。。这还是要分词。所以意义在哪里。


user avatar   maigo 网友的相关建议: 
      

该从哪里开始吐槽呢?

  1. 给汉语文本注音本身就是一项颇有难度的NLP课题。
  2. NLP中的通用方法是以「词」为单位的。把汉字转换成拼音之后,如果依然是以字为单位,那么还是没法处理。如果要分词,那么没必要转换成拼音。



  

相关话题

  NLP文本分类的本质是不是其实是找相似,对于要分类的句子,在训练集里找最相似的句子? 
  在CV/NLP/DL领域中,有哪些修改一行代码或者几行代码提升性能的算法? 
  为什么Transformer要用LayerNorm? 
  国内外厂商发布的各类 AI 智能音箱,优缺点分别是什么? 
  基于对比学习(Contrastive Learning)的文本表示模型【为什么】能学到语义【相似】度? 
  验证集loss上升,准确率却上升该如何理解? 
  AI领域的灌水之风如何破局? 
  如何评价openai的新工作DALL·E? 
  2021 年了,机器/深度学习还有哪些坑比较好挖? 
  如何看待微软小冰写的诗? 

前一个讨论
虚拟电话号存在的意义到底是什么?
下一个讨论
JavaScript 有必要缓存 for 循环中的 Array.length 吗?





© 2025-05-07 - tinynew.org. All Rights Reserved.
© 2025-05-07 - tinynew.org. 保留所有权利