首页
查找话题
首页
请问下大家训练 SimCSE 时, loss 有没有这样的情况?
请问下大家训练 SimCSE 时, loss 有没有这样的情况? 第1页
1
qiu-ming-shan-lao-si-ji-2-9 网友的相关建议:
谢邀
我才刚大二,不搞深度学习呀(。•́︿•̀。)
请问下大家训练 SimCSE 时, loss 有没有这样的情况? 的其他答案 点击这里
1
相关话题
为什么要压缩模型,而不是直接训练一个小的CNN?
目标检测中的mAP是什么含义?
如何开发一个自己的 TensorFlow?
如何看待NVIDIA 即将开源的DLA?
transformer 为什么使用 layer normalization,而不是其他的归一化方法?
搞机器学习的生环化材是天坑吗?
深度学习领域有哪些瓶颈?
为什么 Google 翻译只重算法不重语言学的语法结构和规则?
如何评价MXNet发布的1.0版本?
如何理解attention中的Q,K,V?
前一个讨论
被跳蚤咬的全身都是包是什么样的感受!?!?
下一个讨论
2024年的出生人口会是多少?
相关的话题
如何看待阿里巴巴提出的 FashionAI 比赛?
人工智能会是泡沫吗?
如何看待 Richard Sutton 说的「人工智能中利用算力才是王道」?
深度学习图像处理什么时候用到GPU?
NTIRE2017夺冠的EDSR去掉了Batch Normalization层就获得了提高为什么?
大家推荐一下,哪些学校的导师有在做量化交易、股票预测的?
不觉得最大熵原理很奇怪吗?
预训练模型的训练任务在 MLM 之外还有哪些有效方式?
NLP文本匹配问题的本质是不是 对于要预测的句子,遍历候选句子 从训练数据集里寻找最相似的pair?
类似AlphaGo一样的人工智能什么时候才可以击败RTS(如星际)顶级选手?
为什么读论文最好打印出来读?
消融实验是什么?
目标检测算法中Two-stage算法速度慢,到底在哪里?
现代人工神经网络是不是一个死胡同?这个技术是不是骗人的?
如何评价Yann LeCun 说的「要研究机器学习,本科应尽量多学物理和数学课」?
研一,在学机器学习和深度学习,为什么感觉越学越不会,怎么解决这个问题?
如何看待多模态transformer,是否会成为多模态领域的主流?
如何评价Google最新提出的gMLP:MLP模型在CV和NLP任务上均取得较好的效果?
BERT中,multi-head 768*64*12与直接使用768*768矩阵统一计算,有什么区别?
多任务学习中loss多次backward和loss加和后backward有区别吗?
深度学习到底是「实验科学」还是「理论科学」?能否称为「算法」?
ICLR 2019 有什么值得关注的亮点?
为什么机器学习解决网络安全问题总是失败?
深度学习中,模型大了好还是小了好呢?
如何评价 DeepMind 公司?
医学生学习机器学习该如何入门?
机器学习能否用于综合评价?具体怎么操作?
在CV/NLP/DL领域中,有哪些修改一行代码或者几行代码提升性能的算法?
有哪些令你印象深刻的魔改transformer?
transformer 为什么使用 layer normalization,而不是其他的归一化方法?
服务条款
联系我们
关于我们
隐私政策
© 2025-05-04 - tinynew.org. All Rights Reserved.
© 2025-05-04 - tinynew.org. 保留所有权利