首页
查找话题
首页
请问下大家训练 SimCSE 时, loss 有没有这样的情况?
请问下大家训练 SimCSE 时, loss 有没有这样的情况? 第1页
1
qiu-ming-shan-lao-si-ji-2-9 网友的相关建议:
谢邀
我才刚大二,不搞深度学习呀(。•́︿•̀。)
请问下大家训练 SimCSE 时, loss 有没有这样的情况? 的其他答案 点击这里
1
相关话题
编程达到什么水平才能编写出像caffe这样的深度学习框架?
为什么中文 NLP 数据集这么少?
马上计算机研一,想问一下机器学习、深度学习…大家都是怎么入门的?
如何理解深度学习源码里经常出现的logits?
2017年1月18日Facebook发行的PyTorch相比TensorFlow、MXNet有何优势?
深度学习和强化学习之间的差别有多大?
CPU和GPU跑深度学习差别有多大?
为什么编程语言语法的设计不往缩小与自然语言的差别的方向发展,或者说在这个方向发展得这么慢呢?
阿里的TDM树深度模型为什么很少有人用,是有哪些问题吗?
如何评价最新的Octave Convolution?
前一个讨论
被跳蚤咬的全身都是包是什么样的感受!?!?
下一个讨论
2024年的出生人口会是多少?
相关的话题
为什么强大的 MXNet 一直火不起来?
中科院某所研一新生,小样本学习、数据融合、强化学习、图神经网络、资源受限的计算这几个方向选哪个更好?
给男友配置一个适合做深度学习的电脑要多少钱?
验证集loss上升,准确率却上升该如何理解?
deepmind发表的neural processes(神经过程),这个是怎么实现的呢?
如何看待 Richard Sutton 说的「人工智能中利用算力才是王道」?
多模态训练,怎么解决不同模态之间差异的问题?
OpenCV已经将图像处理(识别)的算法写成函数了,那我们还有必要去学习这些算法不?
为什么图形学的会议siggraph的论文代码很少会开源?好像视觉如CVPR、ICCV开源的更多一些。
为什么yolov5从零开始训练(不在ImageNet上预训练)能够达到如此高的性能?
如何理解Inductive bias?
如何看待阿里巴巴提出的 FashionAI 比赛?
测试集在构造的时候需要人为控制其中应该正确的和应该错误的数据比例吗?
基于深度学习的自然语言处理在 2016 年有哪些值得期待的发展?
国内做NLP业务的香侬科技值得去吗?
有哪些深度学习效果不如传统方法的经典案例?
类似AlphaGo一样的人工智能什么时候才可以击败RTS(如星际)顶级选手?
为什么多标签分类(不是多类分类)损失函数可以使用Binary Cross Entropy?
为什么机器学习解决网络安全问题总是失败?
深度学习对图像的处理,为什么大多基于RGB,而没有其他色彩空间,比如HSV?
如何评价MSRA最新的 Relation Networks for Object Detection?
有哪些比较好的元学习(meta learning)领域的学习资源?
如何评价剑桥,腾讯, DeepMind以及港大团队新作 SimCTG ?
为什么编程语言语法的设计不往缩小与自然语言的差别的方向发展,或者说在这个方向发展得这么慢呢?
如果用机器学习的理论来理解人的行为,会有什么发现?
上学和读书有什么区别?
为什么Bert中的CLS在未fine tune时作为sentence embedding性能非常糟糕?
为什么deep lab v3起,输出不再接 DenseCRF了?
为什么现在不看好 CV 方向了呢?
对自己深度学习方向的论文有idea,可是工程实践能力跟不上,实验搞不定怎么办?
服务条款
联系我们
关于我们
隐私政策
© 2025-04-14 - tinynew.org. All Rights Reserved.
© 2025-04-14 - tinynew.org. 保留所有权利