百科问答小站 logo
百科问答小站 font logo



深度学习对图像的处理,为什么大多基于RGB,而没有其他色彩空间,比如HSV? 第1页

  

user avatar   whatlas 网友的相关建议: 
      
  1. 其他领域,比如学术圈打榜用的数据集都已经是处理完毕的rgb数据了,所以没办法研究用别的颜色格式或者色彩空间能否提升效果,毕竟很简单的数学道理,你用公式从rgb空间把数据转换到yuv/hsv等只会损失信息量而不能增加,没太大可能有更好的效果。
  2. 然而最起码在自动驾驶领域,现在大家的趋势就是把深度学习模型做到isp里面甚至isp前面去,原因也跟之前有些类似,拿到的数据离sensor越近,原始数据的信息量越多,理论上模型的上限也就越高,尤其是对于挑战极大的弱光强光过曝欠曝等场景,如果模型一直在吃下过了isp调教然后又被yuv2rgb一通压缩的数据,那对这些极端场景基本上是无能为力,只能寄希望于雷达或者毫米波了。
  3. 按照特斯拉宣传的,特斯拉目前车端的深度学习模型,输入数据都是sensor raw,有没有isp都是要怀疑下的,这也是特斯拉认定自己可以靠纯视觉搞定自动驾驶的底气之一,毕竟原始数据的信息量有可能就比别家多几十倍啊

user avatar   gao-han-86-32 网友的相关建议: 
      

这也是我最近萌生的一个想法,上网查了查还没找到相关内容,似乎使用RGB就是理所当然的。RGB转HSV涉及到取最小值操作,所以应该算不上是线性变化。

个人认为:因为HSV颜色模型将色调单独提出来作为一个维度,所以HSV对于颜色的变化敏感,如果分割或分类任务对于颜色变化更为敏感的话也许使用HSV更为合情合理。

###############################################################

再来谈一谈为什么都用RGB颜色模型:

大家都是从MNIST过来的,在最初识别二值图或者灰度图的时候(此时饱和度为0)应该没人考虑用HSV模型吧,所以理所当然在处理彩图时就使用RGB了。

另外HSV空间本身也存在局限性,根据《OpenCV轻松入门面向Python》这本书中的内容,如果该颜色的饱和度S很低时,那么所计算出来的色调H就是不可靠的。至于为什么不可靠,个人分析如下:

根据RGB转HSV的转换公式,假设保持亮度V不变,如果饱和度S越小,则V-min(R,G,B)越小。同时,色调H的分母也是V-min(R,G,B),分母变小就导致色调H对分子的变化更为敏感,所以当饱和度较小时,色调H的计算往往带有很大的“跳变”。这可能就是书中所说的“不可靠”。直观理解就是比较淡的颜色我们就难以分辨了。

而我们一般能获得的原始图像就是RGB图像,所以直接使用RGB来识别就不存在“不可靠”这一说法了。




  

相关话题

  计算流体力学(CFD)里应用注意力机制(attention)是否可行? 
  深度学习到底是「实验科学」还是「理论科学」?能否称为「算法」? 
  如何评价Yann LeCun宣称『他已经做好放弃概率论的准备』? 
  如何看待FAIR提出的8-bit optimizer:效果和32-bit optimizer相当? 
  2020到2021年小样本学习取得重大进展了吗? 
  NTIRE2017夺冠的EDSR去掉了Batch Normalization层就获得了提高为什么? 
  在推荐系统中,如何较好的采用深度学习方法获取用户长短期兴趣? 
  如何看UCBerkeley RISELab即将问世的Ray,replacement of Spark? 
  TensorFlow的自动求导具体是在哪部分代码里实现的? 
  如何评价最新的Octave Convolution? 

前一个讨论
Resnet到底在解决一个什么问题呢?
下一个讨论
你认识的热爱技术的人都有哪些特点?





© 2025-04-25 - tinynew.org. All Rights Reserved.
© 2025-04-25 - tinynew.org. 保留所有权利