首页
查找话题
首页
请问下大家训练 SimCSE 时, loss 有没有这样的情况?
请问下大家训练 SimCSE 时, loss 有没有这样的情况? 第1页
1
qiu-ming-shan-lao-si-ji-2-9 网友的相关建议:
谢邀
我才刚大二,不搞深度学习呀(。•́︿•̀。)
请问下大家训练 SimCSE 时, loss 有没有这样的情况? 的其他答案 点击这里
1
相关话题
基于计算机视觉从一张图片重建人体的三维网格,能否获取腰围、胸围、臂长、腿长等数据?
深度学习在生物信息领域有什么应用?
如何看待谷歌公开 tensorflow 专用处理器 TPU?
如何看待 Google 既可以作 Inference,又可以作 Training 的新一代 TPU?
如何看待多模态transformer,是否会成为多模态领域的主流?
什么时候对数据进行[0,1]归一化,什么时候[-1,1]归一化,二者分别在什么场景?
深度学习在信息安全的应用有哪些可以关注的人或论文?
梯度下降法的神经网络容易收敛到局部最优,为什么应用广泛?
为什么 MobileNet、ShuffleNet 在理论上速度很快,工程上并没有特别大的提升?
神经网络为什么可以(理论上)拟合任何函数?
前一个讨论
被跳蚤咬的全身都是包是什么样的感受!?!?
下一个讨论
2024年的出生人口会是多少?
相关的话题
人工智能可以为人类找寻他们心目中的另一半吗?
TensorFlow 中 padding 的 SAME 和 VALID 两种方式有何异同?
为什么Transformer适合做多模态任务?
如何评价旷视开源的YOLOX,效果超过YOLOv5?
AMD的CPU是否适合搭建深度学习主机?
如何评价何恺明等 arxiv 新作 Rethinking ImageNet Pre-training?
机器学习中有哪些形式简单却很巧妙的idea?
为什么Transformer要用LayerNorm?
深度学习领域,你心目中 idea 最惊艳的论文是哪篇?
如何看待知乎的AI答主「四十二」?人工智能有可能理解生命的意义是什么吗?
2022 年人工智能领域的发展趋势是什么?你都有哪些期待?
2021 年了,TensorFlow 和 PyTorch 两个深度学习框架地位又有什么变化吗?
为什么这么多 NLP 大牛硕士毕业去企业不留在学术界?
GAN生成的数据没有标签怎么用来训练分类模型?
为什么说大模型训练很难?
Word2vec 翻译到另一种语言,其向量空间之间的映射会不会是线性的?
计算机视觉中,目前有哪些经典的目标跟踪算法?
多模态方面,有哪些牛组值得我们follow他们的工作?
wasserstein 距离的问题?
为什么强大的 MXNet 一直火不起来?
计算机视觉顶级会议论文中比较适合初学计算机视觉的人做的复现实验有哪些?
神经网络中 warmup 策略为什么有效;有什么理论解释么?
人是如何做黑盒优化的?
DL框架的未来发展,TensorFlow/MXNet/PyTorch, 选哪个?
如何看待马毅老师深度学习第一性原理的文章在 ICML 四个审稿人一致接收的情况下被 AC 拒了?
土木和机器学习/深度学习/算法的交叉岗位在哪里找呀? 在哪找都找不到招聘公司?
机器学习如何才能避免「只是调参数」?
如何评价MSRA视觉组最新对spatial attention mechanism分析论文?
行人轨迹预测有哪些有效的方法和普遍的base方法?或者public dataset?
pytorch ddp训练中一个node fail,导致整个训练失败,有可能解决吗?
服务条款
联系我们
关于我们
隐私政策
© 2024-09-19 - tinynew.org. All Rights Reserved.
© 2024-09-19 - tinynew.org. 保留所有权利