首页
查找话题
首页
请问下大家训练 SimCSE 时, loss 有没有这样的情况?
请问下大家训练 SimCSE 时, loss 有没有这样的情况? 第1页
1
qiu-ming-shan-lao-si-ji-2-9 网友的相关建议:
谢邀
我才刚大二,不搞深度学习呀(。•́︿•̀。)
请问下大家训练 SimCSE 时, loss 有没有这样的情况? 的其他答案 点击这里
1
相关话题
如何评价最近火热的对比学习,会引领预训练模型新的范式嘛?
如何看待Jeff Dean&Hinton投到ICLR17的MoE的工作?
adversarial training为什么会起作用?
为什么现在的CNN模型都是在GoogleNet、VGGNet或者AlexNet上调整的?
全连接层的作用是什么?
2021年,作为算法工程师的你们会在CV业务落地上用Transformer吗?
Transformer在工业界的应用瓶颈如何突破?
GAN:固定训练好的判别器网络,去指导训练生成器为什么不可以?
Graph Attention Network的本质是什么?
如何看待最近一段时间旷视科技Face++、阿里、小米、京东、科大讯飞和地平线等相继在南京建立研发中心?
前一个讨论
被跳蚤咬的全身都是包是什么样的感受!?!?
下一个讨论
2024年的出生人口会是多少?
相关的话题
计算商品embedding然后平均得到用户embedding,会不会存在这种问题?
2019年,计算机视觉领域,你推荐哪些综述性的文章?
基于对比学习(Contrastive Learning)的文本表示模型【为什么】能学到语义【相似】度?
有哪些令你印象深刻的魔改transformer?
为什么相比于计算机视觉(cv),自然语言处理(nlp)领域的发展要缓慢?
国内 top2 高校研一在读,为什么感觉深度学习越学越懵?
为什么deep lab v3起,输出不再接 DenseCRF了?
国内做NLP业务的香侬科技值得去吗?
国内较强的NLP高校实验室有哪些?
NLP文本匹配问题的本质是不是 对于要预测的句子,遍历候选句子 从训练数据集里寻找最相似的pair?
为什么很少人用FFT加速CNN卷积层的运算?
如何看待微软小冰写的诗?
如何评价Hinton组的新工作SimCLR?
如何评价deepmind最新在nature上发表的论文《在人工网络中用网格样表征进行基于向量的导航》?
NLP领域,你推荐哪些综述性的文章?
如何看待旷视科技新产品监视学生上课?
深度学习对图像的处理,为什么大多基于RGB,而没有其他色彩空间,比如HSV?
计算流体力学(CFD)里应用注意力机制(attention)是否可行?
BERT模型可以使用无监督的方法做文本相似度任务吗?
2020-2021年NLP有什么核心技术的更迭吗?或者有什么推动领域发展的paper吗?
人工智能 CV 岗位是不是现在供严重大于需?
Batch Normalization 训练的时候为什么不使用 moving statistics?
《人工智能训练师国家职业技能标准》发布,有哪些值得关注的信息?
基于对比学习(Contrastive Learning)的文本表示模型【为什么】能学到语义【相似】度?
使用pytorch时,训练集数据太多达到上千万张,Dataloader加载很慢怎么办?
如何看待NIPS2017图灵奖得主贝叶斯网络之父Judea Pearl讲座无人问津?
做中文 NLP 的时候,大家为啥不用拼音?
类似AlphaGo一样的人工智能什么时候才可以击败RTS(如星际)顶级选手?
国内做NLP业务的香侬科技值得去吗?
人工智能就业前景越来越严峻了,你还在坚持吗?
服务条款
联系我们
关于我们
隐私政策
© 2024-11-24 - tinynew.org. All Rights Reserved.
© 2024-11-24 - tinynew.org. 保留所有权利