百科问答小站 logo
百科问答小站 font logo



差分隐私中敏感度如何计算? 第1页

  

user avatar   kyon-3 网友的相关建议: 
      

卸腰。

1. 敏感度的计算就是按定义的那样,对任意一个数据集,你改变数据集中的一项,求这个函数的输出所发生的变化的最大值。一般这个敏感度是可以根据你的函数推出来的,如果推不出来,起码也可以求一个上界。比如你的函数如果是有界的 ,那你的敏感度最多也就是 ,当然你这个上界越紧越好。

2. 我觉得很多人对DP有些误解。DP关心的永远只是隐私,如果我设计一个算法,不管你输入是什么,我总是输出数字0,那这个算法也是满足DP的,因为它的输出跟输入压根没关系,当然不会泄露隐私。大家真正关心的,是如何设计一个好的DP,也就是如何让一个满足DP的算法具有可用性。而且“利用差分来加噪”本身这个说法就是不准确的,应该是反过来“利用噪声去实现差分隐私”。那么什么算法都可以用加噪声来实现DP么?答案是:是的,无论你有什么算法,你总是可以加足够多的噪声(一个极端的例子,让它只输出噪声)让它满足差分隐私,但结果可能是你的算法不再具有可用性,或者可用性非常差。

3. DP作为一个theoretical privacy guarantee,这方面的paper必然会变成一个证明题。这方面的paper思路永远都是:我设计一个加噪声的方法,我证明这个方法能让我的算法变成DP的,我验证这样加噪声后的算法依旧有很好的utility。至于加噪声有没有套路,要说有也算有,无非就是把别人已有的DP算法拿过来改造一下。最经典的比如Laplace Mechanism,很多paper都是在这个算法上设计出来的。为什么这样做?因为证明题并不简单,不是每个人都能无中生有地拿一个算法并证明它满足DP的,所以更多的是用别人证好的东西进行改造。如果想要学套路,唯一的方法就是多看paper。




  

相关话题

  如何看待大量国产输入法被下架? 
  如何评价StackOverflow有半数以上程序员为非科班出身? 
  如何看待赵盛烨这篇《云与地震的相关性研究及其实践成果综述》? 
  如何看待 2021 年图灵奖授予美国计算机科学家 Jack J. Dongarra? 
  垄断性的互联网基础设施是否应该是公有制? 
  文件体积达到 1 GB 甚至 1 TB 的图片会呈现何种内容? 
  CPU 的指令集存放在什么地方? 
  就代码能力和开发经验来说,姚期智是不是根本就不如稍微有三到四年开发经验的程序员? 
  为什么现代电脑游戏无法对cpu的多核充分利用? 
  为什么人会有不吃东西会死这个概念?这是上帝给我们订的预设条件吗? 

前一个讨论
JDK 源码中 HashMap 的 hash 方法原理是什么?
下一个讨论
你认为你看到过的颜值最高的人是谁?





© 2025-04-26 - tinynew.org. All Rights Reserved.
© 2025-04-26 - tinynew.org. 保留所有权利