百科问答小站 logo
百科问答小站 font logo



BERT可以用于文本聚类吗? 第1页

  

user avatar   ceng-guan-rong-72 网友的相关建议: 
      

可以,但是不容易。

得弄清聚类的目标是什么。

众所周知聚类本身是不定项的,于是要把握你的聚类方向,只能靠特征。

聚类所用的特征或者信息是否有与你的聚类目标有关,有没有,有多少,和够不够,另外有多少背离或者影响你的聚类目标。

那么问题来了,bert做向量,聚出来的是啥,心里有数吗,是话题领域?语言风格?还是时间年代?不好说啊。

因此,哪怕是聚类,定义一下你的聚类目标,根据目标设计一些数据集和下游方案,整点finetuning或者套个submodel训一下,再不行加点人工特征,可能更好。




  

相关话题

  在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks? 
  word2vec 相比之前的 Word Embedding 方法好在什么地方? 
  数据挖掘、机器学习、自然语言处理这三者是什么关系?这几个怎么入门啊? 
  准研一,导师NLP方向,导师接下了一个项目让我跟着手工标数据,请问是不是在PUA我? 
  实体提取任务中使用BERT-CRF时,CRF根据数据统计可以得到转移概率,为啥还要训练呢? 
  2021年深度学习哪些方向比较新颖,处于上升期或者朝阳阶段,没那么饱和,比较有研究潜力? 
  有尝试用多层自组织特征神经网络(MLSOM)来代替层次分析法(AHP)的吗?会有哪些问题需要注意? 
  为什么相比于计算机视觉(cv),自然语言处理(nlp)领域的发展要缓慢? 
  在NLP当中,不同的评价指标,BLEU, METEOR, ROUGE和CIDEr的逻辑意义? 
  如何看待微软小冰写的诗? 

前一个讨论
自然语言处理方向研究生好找工作吗?
下一个讨论
大学时在学科排名 A+ 的学院就读是什么体验?





© 2024-11-24 - tinynew.org. All Rights Reserved.
© 2024-11-24 - tinynew.org. 保留所有权利