首页
查找话题
首页
请问下大家训练 SimCSE 时, loss 有没有这样的情况?
请问下大家训练 SimCSE 时, loss 有没有这样的情况? 第1页
1
qiu-ming-shan-lao-si-ji-2-9 网友的相关建议:
谢邀
我才刚大二,不搞深度学习呀(。•́︿•̀。)
请问下大家训练 SimCSE 时, loss 有没有这样的情况? 的其他答案 点击这里
1
相关话题
有哪些令你印象深刻的魔改transformer?
为什么计算注意力机制的时候不加偏置项?
如何评价 PyTorch 团队推出的推荐系统库 TorchRec?
Yoshua Bengio为什么能跟Hinton、LeCun相提并论??
为什么小模型已经可以很好地拟合数据集了,换大模型效果却要比小模型好?
如何看待学霸君的高考机器人 Aidam 高考全国文科数学卷考了 134 分?
有哪些利用搜索引擎(Search Engine)辅助自然语言处理任务(NLP)的论文?
ICLR 2022有哪些值得关注的投稿?
FPGA做深度学习能走多远?
对于多指标评价,BP神经网络评价和TOPSIS有什么区别呢?
前一个讨论
被跳蚤咬的全身都是包是什么样的感受!?!?
下一个讨论
2024年的出生人口会是多少?
相关的话题
基于深度学习的自然语言处理在 2016 年有哪些值得期待的发展?
deepmind发表的neural processes(神经过程),这个是怎么实现的呢?
机器学习中的机器是如何分辨哪些是有用的知识,哪些是没用的信息呢?
深度学习工作站中使用AMD的CPU会有问题吗?
为什么中文 NLP 数据集这么少?
隐私计算、计算机视觉、自然语言处理三者中,哪个研究起来更有前途?
NIPS 2018 有什么值得关注的亮点?
如果你是面试官,你怎么去判断一个面试者的深度学习水平?
国内做NLP业务的香侬科技值得去吗?
如何评价基于游戏毁灭战士(Doom)的AI死亡竞赛大赛结果?
为什么现在的CNN模型都是在GoogleNet、VGGNet或者AlexNet上调整的?
能否使用区块链的算力来解决深度学习训练?
如何评价MSRA最新的 Relation Networks for Object Detection?
如何理解 Swin Transformer 和 Vision Transformer不同任务上的差异?
人工智能就业前景越来越严峻了,你还在坚持吗?
深度学习中Attention与全连接层的区别何在?
在CV/NLP/DL领域中,有哪些修改一行代码或者几行代码提升性能的算法?
如何评价最近火热的对比学习,会引领预训练模型新的范式嘛?
有哪些令你印象深刻的魔改transformer?
如何看待 TI7 上与 Dendi solo 的 OpenAI?
2017年1月18日Facebook发行的PyTorch相比TensorFlow、MXNet有何优势?
对自己深度学习方向的论文有idea,可是工程实践能力跟不上,实验搞不定怎么办?
基于对比学习(Contrastive Learning)的文本表示模型【为什么】能学到语义【相似】度?
如何看待KDD'21的文章,异质图神经网络的效果不如简单的GCN、GAT?
有哪些深度学习效果不如传统方法的经典案例?
如何看待 TI7 上与 Dendi solo 的 OpenAI?
为什么很少人用FFT加速CNN卷积层的运算?
实体提取任务中使用BERT-CRF时,CRF根据数据统计可以得到转移概率,为啥还要训练呢?
为什么有些学数学的看不惯甚至鄙视 Deep Learning?
如果不按套路下棋是不是就能赢 Alpha Go 了?
服务条款
联系我们
关于我们
隐私政策
© 2025-06-15 - tinynew.org. All Rights Reserved.
© 2025-06-15 - tinynew.org. 保留所有权利