百科问答小站 logo
百科问答小站 font logo



有哪些利用搜索引擎(Search Engine)辅助自然语言处理任务(NLP)的论文? 第1页

  

user avatar   maplefalls 网友的相关建议: 
      

在Google Scholar搜索"Retrieval Augmented"就能get到一堆用IR技术辅助NLP任务的论文。实际上,所有知识密集型(knowledge-intensive)任务都可以考虑利用IR为模型提供额外知识,比如KILT基准包含的五大知识密集型任务:QA、Dialogue、Fack Checking、Slot Filling、Entity Linking:

QA:Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

Dialogue:Retrieval Augmentation Reduces Hallucination in Conversation

Fack Checking:Improving Evidence Retrieval for Automated Explainable Fact-Checking

Slot Filling:Robust Retrieval Augmented Generation for Zero-shot Slot Filling

Entity Linking:Autoregressive Entity Retrieval

在Summarization、Machine Translation任务上也出现了类似的工作:

Summarization:Retrieval Augmented Code Generation and Summarization

Machine Translation:Nearest Neighbor Machine Translation

而在Language Model上,比较知名的就是谷歌的REALM: Retrieval-Augmented Language Model Pre-Training和Open AI的WebGPT: Browser-assisted question-answering with human feedback,这种重量级工作目前也只有大厂能做出来。

另外最近的一篇综述也对检索辅助生成任务的论文做了一个小结:A Survey on Retrieval-Augmented Text Generation




  

相关话题

  做底层 AI 框架和做上层 AI 应用,哪个对自己的学术水平(或综合能力)促进更大? 
  为什么编程语言语法的设计不往缩小与自然语言的差别的方向发展,或者说在这个方向发展得这么慢呢? 
  为什么编程语言语法的设计不往缩小与自然语言的差别的方向发展,或者说在这个方向发展得这么慢呢? 
  为什么中文 NLP 数据集这么少? 
  知识图谱+nlp,有什么适合硕士独自研究的方向? 
  在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks? 
  实体提取任务中使用BERT-CRF时,CRF根据数据统计可以得到转移概率,为啥还要训练呢? 
  为什么nlp没有像cv四小龙一样的创业公司? 
  如何看待《搜索引擎百度已死》一文?百度沦为百家号的引流工具这一描述是否准确?百度的「护城河」是什么? 
  Transformer是如何处理可变长度数据的? 

前一个讨论
ICLR 2022有哪些值得关注的投稿?
下一个讨论
clickhouse到底有哪些吊炸天的优化?





© 2024-11-09 - tinynew.org. All Rights Reserved.
© 2024-11-09 - tinynew.org. 保留所有权利