首页

有哪些利用搜索引擎（Search Engine）辅助自然语言处理任务（NLP）的论文？第1页

1

maplefalls 网友的相关建议:

在Google Scholar搜索"Retrieval Augmented"就能get到一堆用IR技术辅助NLP任务的论文。实际上，所有知识密集型(knowledge-intensive)任务都可以考虑利用IR为模型提供额外知识，比如KILT基准包含的五大知识密集型任务：QA、Dialogue、Fack Checking、Slot Filling、Entity Linking：

QA：Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

Dialogue：Retrieval Augmentation Reduces Hallucination in Conversation

Fack Checking：Improving Evidence Retrieval for Automated Explainable Fact-Checking

Slot Filling：Robust Retrieval Augmented Generation for Zero-shot Slot Filling

Entity Linking：Autoregressive Entity Retrieval

在Summarization、Machine Translation任务上也出现了类似的工作：

Summarization：Retrieval Augmented Code Generation and Summarization

Machine Translation：Nearest Neighbor Machine Translation

而在Language Model上，比较知名的就是谷歌的REALM: Retrieval-Augmented Language Model Pre-Training和Open AI的WebGPT: Browser-assisted question-answering with human feedback，这种重量级工作目前也只有大厂能做出来。

另外最近的一篇综述也对检索辅助生成任务的论文做了一个小结：A Survey on Retrieval-Augmented Text Generation。

有哪些利用搜索引擎（Search Engine）辅助自然语言处理任务（NLP）的论文？的其他答案点击这里

1

相关话题

  为什么 Siri 听懂了我的话，还是不能做出有效的回答或准确的操作？
  如何评价浪潮发布的2457亿参数源1.0智能大模型？与GPT-3相比如何？处于AI模型领域什么水平？
  隐私计算、计算机视觉、自然语言处理三者中，哪个研究起来更有前途？
  主题模型(topic model)到底还有没有用，该怎么用？
  为什么 Bert 的三个 Embedding 可以进行相加？
  深度学习应用在哪些领域让你觉得「我去，这也能行！」？
  有哪些令你印象深刻的魔改transformer？
  有哪些令你印象深刻的魔改transformer？
  为什么计算注意力机制的时候不加偏置项？
  请问有哪些法律和计算机领域结合的例子？

前一个讨论

ICLR 2022有哪些值得关注的投稿？

下一个讨论

clickhouse到底有哪些吊炸天的优化？

相关的话题

  为什么 Google 翻译只重算法不重语言学的语法结构和规则？
  没有顶会的CV/NLP方向的博士生毕业出路在哪里？
  有哪些令你印象深刻的魔改transformer？
  神经网络中 warmup 策略为什么有效；有什么理论解释么？
  预训练模型的训练任务在 MLM 之外还有哪些有效方式？
  实体提取任务中使用BERT-CRF时，CRF根据数据统计可以得到转移概率，为啥还要训练呢？
  如何评价Google最新提出的gMLP：MLP模型在CV和NLP任务上均取得较好的效果？
  如何看待字节跳动全新搜索引擎产品已在今日头条上线，并称将入局全网搜索？
  未来多少年内，互联网有可能出现让普通人觉得比搜索引擎的作用还要大的发明吗？
  自然语言处理怎么最快入门？
  如何看待5月17日百度市值被美团和滴滴超过，只有今日头条估值的60%、阿里及腾讯市值的10%？
  实体提取任务中使用BERT-CRF时，CRF根据数据统计可以得到转移概率，为啥还要训练呢？
  做中文 NLP 的时候，大家为啥不用拼音？
  骂百度的那么多，为什么没有人选择自己研发搜索引擎，然后干掉百度？
  你实践中学到的最重要的机器学习经验是什么？
  如何看待多模态transformer，是否会成为多模态领域的主流？
  百度的使用体验真的有那么糟糕吗？
  在NLP上，CNN、RNN（认为LSTM等变体也是RNN）、最简单全连结MLP，三者相比，各有何优劣?
  为什么 Google 翻译只重算法不重语言学的语法结构和规则？
  刷leetcode使用python还是c++？
  有哪些利用搜索引擎（Search Engine）辅助自然语言处理任务（NLP）的论文？
  word2vec 相比之前的 Word Embedding 方法好在什么地方？
  如何看待百度搜索结果中出现类似网络诈骗的结果？
  社会都已经这么骂百度了，为什么百度还没有做出明显改变？
  Transformer是如何处理可变长度数据的？
  如何理解Inductive bias？
  Transformer是如何处理可变长度数据的？
  在中文 NLP 等论文中，应该如何翻译 token 这个词？
  有哪些特殊的搜索引擎？
  2020-2021年NLP有什么核心技术的更迭吗？或者有什么推动领域发展的paper吗？

© 2025-06-14 - tinynew.org. All Rights Reserved.
© 2025-06-14 - tinynew.org. 保留所有权利