百科问答小站 logo
百科问答小站 font logo



有哪些利用搜索引擎(Search Engine)辅助自然语言处理任务(NLP)的论文? 第1页

  

user avatar   maplefalls 网友的相关建议: 
      

在Google Scholar搜索"Retrieval Augmented"就能get到一堆用IR技术辅助NLP任务的论文。实际上,所有知识密集型(knowledge-intensive)任务都可以考虑利用IR为模型提供额外知识,比如KILT基准包含的五大知识密集型任务:QA、Dialogue、Fack Checking、Slot Filling、Entity Linking:

QA:Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

Dialogue:Retrieval Augmentation Reduces Hallucination in Conversation

Fack Checking:Improving Evidence Retrieval for Automated Explainable Fact-Checking

Slot Filling:Robust Retrieval Augmented Generation for Zero-shot Slot Filling

Entity Linking:Autoregressive Entity Retrieval

在Summarization、Machine Translation任务上也出现了类似的工作:

Summarization:Retrieval Augmented Code Generation and Summarization

Machine Translation:Nearest Neighbor Machine Translation

而在Language Model上,比较知名的就是谷歌的REALM: Retrieval-Augmented Language Model Pre-Training和Open AI的WebGPT: Browser-assisted question-answering with human feedback,这种重量级工作目前也只有大厂能做出来。

另外最近的一篇综述也对检索辅助生成任务的论文做了一个小结:A Survey on Retrieval-Augmented Text Generation




  

相关话题

  如果反百度的趋势不断持续,哪个搜索引擎将会取代百度在大陆的地位? 
  如何评价微软机器翻译在 WMT2017 中英翻译达到「人类水平」? 
  预训练模型的训练任务在 MLM 之外还有哪些有效方式? 
  word2vec 相比之前的 Word Embedding 方法好在什么地方? 
  现在的BERT等语言模型,最快训练要多久? 
  实体提取任务中使用BERT-CRF时,CRF根据数据统计可以得到转移概率,为啥还要训练呢? 
  做底层 AI 框架和做上层 AI 应用,哪个对自己的学术水平(或综合能力)促进更大? 
  今日头条的爬虫特征是什么? 
  如果推出一款有「滤镜」功能的写作软件,修饰平庸的文字,会有市场吗? 
  为什么搜索引擎动辄显示找到相关结果约几千万上亿个,但是实际上搜索结果只能翻几十页? 

前一个讨论
ICLR 2022有哪些值得关注的投稿?
下一个讨论
clickhouse到底有哪些吊炸天的优化?





© 2025-06-15 - tinynew.org. All Rights Reserved.
© 2025-06-15 - tinynew.org. 保留所有权利