百科问答小站 logo
百科问答小站 font logo



有哪些「神奇」的数据获取方式? 第1页

  

user avatar   yiqin-fu 网友的相关建议: 
      

导师是研究非洲经济的,分享过两个故事:

他一个同行去乌干达找数据,某次从政府大楼出来的时候,发现工作人员在把大量纸张送到附近的垃圾场。他跑到垃圾场一看,居然是乌干达的历史数据!工作人员说这些没什么用,所以领导叫扔了。导师的同行及时抢下,后来组织当地人和他的学生扫描清洗,现已做成世界上最大的乌干达数据库。

第二个故事更厉害。导师的导师很想研究竞选口号对投票结果的影响。在穷国家,我们担心竞选人为了讨好民众,会承诺“私人物品”而非惠及所有百姓的福利(比如承诺“当选后给你这个村修条路”、“当选后招你这部落的人进内阁”)。

要想研究“承诺私人物品”会不会赢得更多票数,你不可能让竞选人赌上自己的职业生涯来帮你做实验,所以传统的研究方法是“事后观察”。

运气好的话,竞选口号播出的电视信号是逐步在全国开通的,那你可以比较先收到和后收到电视台信号的区域。运气好的话,电视信号在某个地方突然断了一个月,那你可以比较一直有信号的和信号断了的区域。这些方法都需要很多其他条件成立,还需要很多后期统计处理。更重要的是,穷地方多半没有收视率和民调数据,所以研究基本没戏。

不过导师的导师非常神奇。他出生在非洲国家贝宁,国家动乱后辗转去了美国西北大学读博,贝宁局势稳定后他成了贝宁新领导层的朋友。有了前述研究想法后,他居然说服了贝宁各个派别的总统候选人帮他做这个实验。


2001 年各家的竞选口号,一半讲“私人好处”(“选上了我给你这个村子修路”),一半讲“公共利益”(“选上了我会进行全国改革”)。

当然了,各派系只同意在自身优势较大的选区做这个实验,所以实验结果也有局限性。其他技术细节(例如溢出问题)这里不再展开。

论文:nyu.edu/gsas/dept/polit

普通人想做实验也不是不可以,只是要冒生命危险。有斯坦福和达特茅斯教授 2014 年向美国蒙塔娜州选民随机邮寄印有竞选人信息的传单,不过传单设计很容易让人以为是官方资料,所以教授和所在大学被政府以“企图影响竞选结果”为由而严重警告,面临罚款。研究当然也就此结束。

导师本人没什么故事。不过他有一回去非洲某国家机关要历史数据,对方找给他一沓册子,说咦这里还真有一套,你可以拿走了。导师说,既然册子只有这么一套,我还是借阅几天、扫描完归还。对方说,我们留着也没用,你就拿走吧。

导师就拿回国了...


user avatar   metrodatateam 网友的相关建议: 
      

把这个问题吵火了,然后让微信部门的人看到。然后等待版本更新。


user avatar   datacastle-90 网友的相关建议: 
      

这是我看到的最准确的总结。

总的来说,就是中国的高考相对公平,所以性价比极高,所以其他活动都可以适当让步。




  

相关话题

  为什么玻尔兹曼熵要对状态数取自然对数? 
  最大似然估计和最小二乘法怎么理解? 
  如何通俗地理解概率论中的「极大似然估计法」? 
  主成分分析的缺点,为什么要有因子分析?谁能清楚的讲讲? 
  机器学习里的 kernel 是指什么? 
  大数据显示美国新冠「零号病人」大概率 2019 年 4 月出现,有哪些科学依据?如果被证实意味着什么? 
  如何分析找出知乎的潜在的热门问题? 
  如果有第谷的数据,现在的机器学习,深度学习有办法学出开普勒三定律吗? 
  如何在一晚内速成概率论与数理统计? 
  如何看待 CityDo 杭州城市大数据运营有限公司 HR 称「考不上二本的都是智商有问题」? 

前一个讨论
马克思对中国是否了解,有在文章中提到过中国吗?
下一个讨论
中国首个地下云图网开建 预报地震能否实现?





© 2024-11-21 - tinynew.org. All Rights Reserved.
© 2024-11-21 - tinynew.org. 保留所有权利