首页

Word2vec 翻译到另一种语言，其向量空间之间的映射会不会是线性的？第1页

1

atom-native 网友的相关建议:

没有完全理解题主想要问什么，如果使用同样的mapping（脱离上下文），那源端语言的一个单词怎样得到目标端语言的不同单词。

你所说的语言之间的映射，取决于语言之间的相似程度，大部分时候都不是线性的。直观上来说，很多中文/英文词都没有对应的翻译，说明他们在各自的语义空间里的分布是不完全相似的（比如，presentation就很难找一个贴切的中文翻译）。但是用线性关系去近似不同语言之间的embedding是比较方便的，同时，虽然整个embedding space可能没有线性映射关系，但是不妨碍局部存在线性映射（e.g. anchor words）。

比如Adversarial Training for Unsupervised Bilingual Lexicon Induction 里的猫马猪（英西）

Unsupervised Alignment of Embeddings with Wasserstein Procrustes里面的水空气土地（英法）

Learning bilingual word embeddings with (almost) no bilingual data 里面的数字

数字好处在于语义明确，通用性强，缺点是样本少。用字典的好处在于样本多，缺点是可能会在通用性上有一定的妥协，同时对于很多语言可能没有办法构造足够多的平行语料对，Word Translation without Parallel Data里面的CSLS一定程度上缓解了对于语言相似性和平行语料的依赖。

当然了，语言自身也是会不断演化的，选用词向量的时候，也要考虑历史的进程（雾

如果你要用的是基于上下文的表示/内容的表示的话，某种程度上已经超出了word embedding的范畴了，不妨考虑一下BERT。

仅为抛砖引玉

Word2vec 翻译到另一种语言，其向量空间之间的映射会不会是线性的？的其他答案点击这里

1

相关话题

  如何评价AWS的图神经网络框架DGL？
  如何评价旷视开源的YOLOX，效果超过YOLOv5?
  有谁给解释一下流形以及流形正则化？
  如何评价亚马逊AI新开源自动机器学习项目AutoGluon?
  用于数据挖掘的聚类算法有哪些，各有何优势？
  即时战略游戏（比如 WAR3）的 AI 是怎样实现的？
  有哪些深度学习效果不如传统方法的经典案例？
  为什么很少人用FFT加速CNN卷积层的运算？
  在中文 NLP 等论文中，应该如何翻译 token 这个词？
  如何理解矩阵相乘的几何意义或现实意义？

前一个讨论

如果李云龙成为五代火影，会怎样？

下一个讨论

如何理解分形的维度？

相关的话题

  如何用简单易懂的例子解释条件随机场（CRF）模型？它和HMM有什么区别？
  请问机器学习中的预测与决策的区别是什么，他们的界限在哪里呢？
  如何看待斯坦福博士生2prime陆一平关于新冠起源的一系列言论？
  有哪些令你印象深刻的魔改transformer？
  r个线性无关n维向量r<n的所有r阶子的平方和等于这r个向量张成平行体的体积的平方吗？怎么证明？
  未来五年，数据科学家（Data Scientist）的岗位需求会如何变化？
  人工智能技术会不会最终赶上微积分的历史地位？
  怎样计算两个服从高斯分布的向量乘积的期望？
  在数据分析、挖掘方面，有哪些好书值得推荐？
  如何看待 Larrabee 之父 Tom Forsyth 重加入 Intel？英特尔为何下注独立显卡？
  TVM 最新发布版本 0.3 有哪些亮点？
  你实践中学到的最重要的机器学习经验是什么？
  PRML为何是机器学习的经典书籍中的经典？
  UCLA 的朱松纯教授是一个什么样的人？
  为什么 BERT 的 intermediate_size 这么大？
  计算机视觉研一，只学过Python基础，目前代码能力很差，要不要换导师，不换的话如何毕业？
  线性代数对于计算机专业的作用是什么呢？
  如何学习视频识别技术？
  算法工程师是否应该持续读论文？
  为何向量没有除法运算？
  如何评价 DeepMind 的新工作 AlphaCode?
  自学深度学习是怎样一种体验？
  2019年，计算机视觉领域，你推荐哪些综述性的文章？
  机器学习相关岗位面试中，有哪些加（zhuang）分（bi）项？
  如何评价贾扬清离职 Facebook？
  pytorch ddp训练中一个node fail，导致整个训练失败，有可能解决吗？
  如何看待多模态transformer，是否会成为多模态领域的主流？
  什么是机器学习？
  2021 年，深度学习方面取得了哪些关键性进展？
  ICLR 2018 有什么值得关注的亮点？

© 2025-05-06 - tinynew.org. All Rights Reserved.
© 2025-05-06 - tinynew.org. 保留所有权利