百科问答小站 logo
百科问答小站 font logo



差分隐私中敏感度如何计算? 第1页

  

user avatar   kyon-3 网友的相关建议: 
      

卸腰。

1. 敏感度的计算就是按定义的那样,对任意一个数据集,你改变数据集中的一项,求这个函数的输出所发生的变化的最大值。一般这个敏感度是可以根据你的函数推出来的,如果推不出来,起码也可以求一个上界。比如你的函数如果是有界的 ,那你的敏感度最多也就是 ,当然你这个上界越紧越好。

2. 我觉得很多人对DP有些误解。DP关心的永远只是隐私,如果我设计一个算法,不管你输入是什么,我总是输出数字0,那这个算法也是满足DP的,因为它的输出跟输入压根没关系,当然不会泄露隐私。大家真正关心的,是如何设计一个好的DP,也就是如何让一个满足DP的算法具有可用性。而且“利用差分来加噪”本身这个说法就是不准确的,应该是反过来“利用噪声去实现差分隐私”。那么什么算法都可以用加噪声来实现DP么?答案是:是的,无论你有什么算法,你总是可以加足够多的噪声(一个极端的例子,让它只输出噪声)让它满足差分隐私,但结果可能是你的算法不再具有可用性,或者可用性非常差。

3. DP作为一个theoretical privacy guarantee,这方面的paper必然会变成一个证明题。这方面的paper思路永远都是:我设计一个加噪声的方法,我证明这个方法能让我的算法变成DP的,我验证这样加噪声后的算法依旧有很好的utility。至于加噪声有没有套路,要说有也算有,无非就是把别人已有的DP算法拿过来改造一下。最经典的比如Laplace Mechanism,很多paper都是在这个算法上设计出来的。为什么这样做?因为证明题并不简单,不是每个人都能无中生有地拿一个算法并证明它满足DP的,所以更多的是用别人证好的东西进行改造。如果想要学套路,唯一的方法就是多看paper。




  

相关话题

  开源精神是否可能应用到别的领域? 
  深度学习在信息安全的应用有哪些可以关注的人或论文? 
  0.0.0.0和255.255.255.255这两个IP地址到底有啥用? 
  什么叫做学计算机有天赋? 
  学习编译原理有什么好的书籍? 
  Python中 __init__的通俗解释是什么? 
  中国内地的iCloud服务转由云上贵州运营意味着什么? 
  如果黑客拥有一台算力无限的主机,他能做什么? 
  准大学生在知乎上看大学专业时,发现所有专业都存在大量劝退,如何在其中筛选出哪些是有用的,哪些是牢骚? 
  「贝塞尔曲线」有哪些作用和特点,该如何正确使用? 

前一个讨论
JDK 源码中 HashMap 的 hash 方法原理是什么?
下一个讨论
你认为你看到过的颜值最高的人是谁?





© 2025-06-22 - tinynew.org. All Rights Reserved.
© 2025-06-22 - tinynew.org. 保留所有权利