首页
查找话题
首页
请问下大家训练 SimCSE 时, loss 有没有这样的情况?
请问下大家训练 SimCSE 时, loss 有没有这样的情况? 第1页
1
qiu-ming-shan-lao-si-ji-2-9 网友的相关建议:
谢邀
我才刚大二,不搞深度学习呀(。•́︿•̀。)
请问下大家训练 SimCSE 时, loss 有没有这样的情况? 的其他答案 点击这里
1
相关话题
如何看待NLP领域最近比较火的prompt,能否借鉴到CV领域?
如何看待微软小冰写的诗?
如何评价Momenta ImageNet 2017夺冠架构SENet?
计算流体力学(CFD)里应用注意力机制(attention)是否可行?
多模态方面,有哪些牛组值得我们follow他们的工作?
为什么 Google 翻译只重算法不重语言学的语法结构和规则?
不觉得最大熵原理很奇怪吗?
如何评价 7 月 31 日一流科技开源的深度学习框架 OneFlow?
如何评价 BERT 模型?
如何看待何恺明最新一作论文Masked Autoencoders?
前一个讨论
被跳蚤咬的全身都是包是什么样的感受!?!?
下一个讨论
2024年的出生人口会是多少?
相关的话题
如何看待 TI7 上与 Dendi solo 的 OpenAI?
分类机器学习中,某一标签占比太大(标签稀疏),如何学习?
如何评价移动端吊打一切万众期待的商汤深度学习推理框架PPL开源了却没有支持移动端?
如何评价Google最新提出的gMLP:MLP模型在CV和NLP任务上均取得较好的效果?
如何评价Kaiming He的Momentum Contrast for Unsupervised?
为什么有些学数学的看不惯甚至鄙视 Deep Learning?
如何看待FAIR提出的8-bit optimizer:效果和32-bit optimizer相当?
新手如何实现个简单AutoML框架。有参考的github开源项目介绍吗?
为什么现在不看好 CV 方向了呢?
如果人工智能迎来下一个寒冬,你认为会是卡在什么问题上?
NLP 中 prompt learning 有哪些可能的天生缺陷?目前有什么样的方法来解决这样的缺陷?
如何评价移动端吊打一切万众期待的商汤深度学习推理框架PPL开源了却没有支持移动端?
为什么最近几年 FPGA 变得越发受大家重视了?
Graph Attention Network的本质是什么?
土木和机器学习/深度学习/算法的交叉岗位在哪里找呀? 在哪找都找不到招聘公司?
如何评价微软亚洲研究院提出的LightRNN?
除了深度学习,机器学习领域近年来还有什么热点吗?
NLP文本分类的本质是不是其实是找相似,对于要分类的句子,在训练集里找最相似的句子?
如何评价浪潮发布的2457亿参数源1.0智能大模型?与GPT-3相比如何?处于AI模型领域什么水平?
transformer中的Q,K,V到底是什么?
如何评价Google最新提出的gMLP:MLP模型在CV和NLP任务上均取得较好的效果?
如何看待华为 4 月 25 日发布的盘古智能大模型?在这个行业处于什么水平?
DeepMind 研发的围棋 AI AlphaGo 是如何下棋的?
2021年了,如何评价微软亚研提出的对偶学习(Dual Learning)?
你见过最差的算法工程师能差到什么程度?
机器学习如何才能避免「只是调参数」?
深度学习中,模型大了好还是小了好呢?
基于深度学习的自然语言处理在 2016 年有哪些值得期待的发展?
attention跟一维卷积的区别是啥?
验证集loss上升,准确率却上升该如何理解?
服务条款
联系我们
关于我们
隐私政策
© 2025-03-23 - tinynew.org. All Rights Reserved.
© 2025-03-23 - tinynew.org. 保留所有权利