这篇文章阐述我的一个想法:发布到互联网上的信息,一旦发布就很难全网抹除,发布时间越长越难抹除。这是因为信息特殊的性质——可读=可复制副本=拥有。
#预言故事:诽谤如随风飘飞的鸡毛
有这样一篇预言故事《捡起鸡毛》,很短,我翻译一下:
一位妇女忏悔自己诽谤他人。告解神父,一位睿智的老者,他慈爱地听着,赦免了她的罪,并指定给了她一项奇怪的悔罪行为——他让她回家找一只母鸡然后回来,当她沿街走时要拔掉母鸡的羽毛。当她回来时,神父说: “现在请回家去,边走边捡起你在路上拔下的每一根羽毛。”妇女告诉他这是不可能的,因为几乎可以肯定的是,风已经把它们吹走了。神父告诉她:" 你看,就像风吹散了羽毛就不可能再捡起来一样,流言蜚语和诽谤一旦从我们嘴里说出来,就不可能再收集起来。"
#公开发布的信息一如风中鸡毛
公开发布的信息就像在风中撒手的鸡毛,不管自愿与否都实际放弃了控制权。就像公共场合说出的话,不知道谁会听到,不知道听到的人中有多少人会记住,也不知道记住的人中多少人会把这个话传给其他不在场的人。信息的传递方式在现实和网络上分毫不差。
有人会感叹互联网信息的可用性差,比如老平台被公司关闭、域名到期或服务器下线导致的网站下线、磁力链接失效……或许信息还躺在世界上某个硬盘中,甚至在私有域中,只是不可公开读取。如果时光能倒流,回到还能读取信息的时候,任何人都可以将其备份并永久保存到本地。不知浏览器何时拥有的“脱机可用”这功能,大概很久前就有。即使没保存,这不是还有回忆吗,也是信息特性的证明,没人能抹除你的记忆。
如果你当时忘了备份,可能有其他网民或系统帮你备了份。比起讨厌更应该感谢保存互联网信息的系统,不管是用自动爬虫的搜索引擎还是接受快照请求的存档网站,毕竟它们将保存的信息公开给了所有人,分享和开放是好事。另外我们永远不可能知道某个已经不可访问的信息在全球有多少个离线备份。
#非公开上传的信息也难逃一劫
并非信息设置为非公开就万事大吉。信息被联网上传到另一个地方,都或多或少暴露在风险下。
#信息被主动出卖
公司利用用户协议,用你产生的信息赚钱(“如果你免费使用某个公司提供的服务,那么你输入上传的一切都可以是公司的商品”)(当然公司要想办法赚钱)。不一定是公司本身,可能是公司内碰巧同时有坏心思和你的信息的访问权限的员工。
软件业务流程设计中有个概念叫“数据的软删除(soft delete, logical delete)”,即不真正删除信息,而是标记为“不可用”。这个技术本来是用在比如“操作记录审计”,“误删除可恢复”等合适的地方,但现在被越来越多滥用在保存可牟利的用户信息、用户内容上。告诉用户手机号修改成功,但偷偷留着老的;告诉用户误发的推文删除成功,但其实没删——我不知道这算不算欺骗。
这类最糟的情况目前仍是最常见的情况,真令人伤心。
#信息被骇客偷走
欧盟发布的GDPR保护了用户对个人数据的控制权(也许算只保护了欧盟网民),也推进了公司业务方面许多好的数据隐私改进。假如你所使用的平台是一家遵守 GDPR 的“好”公司,你可以随时删除你上传的任何数据,没有软删除的欺骗。或者你信不过公司,使用非盈利组织的服务或干脆自己搭建服务。服务器背后的人不会主动出卖你的信息,现在信息安全了吗?
呃,还不安全。你看,当你还没删除时,信息仍留在服务器上。你是否记得,有一类不会遵守规则法律的人行网络行窃之事……对,骇客(cracker)。骇客攻入服务器,把数据偷走(拷一份)拿去卖钱。在这个(信息不会被主动出卖的)情况里,你的信息是否安全=平台的安全防护工作做得好不好。除了自建平台外你无法控制这点,只得信任和期待。至于自建平台,服务器安全维护这份工作……至少我个人能力做不到让我自己信服。
#如何保存非公开信息?离线和加密
“这样我就能安全分享(公开)信息了?” 你不能分享了,因为信息的特性,看过的人会记住(Who’s Lila?),再写到互联网上,不就又变成数字备份了……保密协议是个可选方案,寄希望于对方是遵守规则的人。
于是你咬咬牙决定不分享信息了,只有自己能查看。如果你决定只在一台设备上查看,把数据放在本地就足够安全,至少现在这个时代骇客比起有杀毒软件有防火墙的个人电脑,更倾向于捣鼓错误配置的服务器。如果你想借助平台在多个设备间传输信息,或想让保存在本地的数据更安全,你应该使用加密技术加密你的信息。
#相关想法
-
信息尤其个人信息,公开状态就是0和1,一旦上传过,默认算作(被出卖或攻击)公开,没有后悔药。要么永远捏得死死的不上传到公共领域(许多麻烦);要么坦然面对,亡羊补牢,预防之后可能出现的身份盗用、骚扰等情况。我没足够地位和资源做到前者,只好选择后者。也可以准备很多套可弃用的身份,比如在中国手机号是网络身份证,可购买各运营商的虚拟手机号。
-
还是劝大家不要在网上公开透露个人信息,包括和网友聊天或推文发送自己的生活工作细节,和你共享生活(同城)或工作(同行)的网友真的从寥寥几句知道很多事,因为你们共享经验和上下文,相同信息量能触发更多关联知识。万一网友有坏心思,麻烦很大。
-
信息传递的本质不知道能否用熵增原理解释——质能守衡但信息熵不会减少。扯远了。