1200万部手机,500亿位置数据,出卖隐私的营销能走多远?

WechatIMG72_meitu_1

【猎云网(微信号:)】12月22日报道(编译:柠萌)

编者注:本文原作者为Stuart A. Thompson和Charlie Warzel。全文揭示了位置数据公司过度获取用户隐私数据并滥用以实现盈利的行业乱象,旨在引起公众关注,并呼吁政府介入完善制度保障。

每一天的每一分钟,在地球上的每一个地方,都有几十家公司(基本上不受监管,而且很少受到审查)用手机记录数千万人的活动,并将信息存储在巨大的数据文件中。据悉,外媒获取了迄今为止规模最大、最为敏感的文件。文件内包含超过500亿个定位ping信号,涉及在华盛顿、纽约、旧金山和洛杉矶等几个主要城市的1200多万美国人。

该文件中的每一条信息都代表了2016年和2017年几个月期间一部智能手机的精确位置。

在花了几个月的时间筛选数据、跟踪全美各地用户的活动,并与几十家研究这一领域的数据公司、技术人员、律师和学者交谈之后,我们感到了同样的担忧。在数据文件覆盖的城市中,它追踪了几乎每个社区、每条街道的居民。无论他们是住在弗吉尼亚的移动房屋里,还是住在曼哈顿的豪华大厦里,都免不了被追踪。

在一次数据搜索中,我们发现有十几个人参观了花花公子大厦,有些人是在夜间到访的。我们还很容易地发现有访客来到强尼·戴普、泰格·伍兹和阿诺德·施瓦辛格的庄园。

如果你住在数据集覆盖的城市之一,并使用共享位置的应用,比如天气应用、本地新闻应用以及优惠券存储应用,那么你也可能出现在其中。

如果你能看到全部的文件内容,你可能再也不会以同样的方式使用你的手机了。

据悉,这份文件中的数据并非来自电信或大型科技公司,也不是来自政府的监控行动,而是来自于一家位置数据公司,该公司是几十个利用移动应用软件悄悄收集精确位置的公司之一。大多数公司你可能都从未听说过,但对任何能接触到这些数据的人来说,你的生活就像是一本打开的书。他们可以看到你每天每时每刻去的地方,你与谁见面或与谁过夜,你在哪里祈祷。无论你去的是美沙酮诊所、精神病医生办公室还是按摩院,无一例外。

众多新闻媒体过去也曾报道过智能手机追踪问题,但从来没有出现这么大的数据集。尽管如此,这些文件只是位置跟踪行业每天收集和出售的信息中的一小部分——位置跟踪在我们的数字生活中无处不在,而且现在似乎任何人都无法避免被追踪。

在美国,如果试图强制要求所有12岁以上的公民每天24小时随身携带一个追踪装置,以显示他们的位置,公民们肯定会群情激愤。然而,自苹果的App Store创建以来的十年间,面对一款又一款的应用软件,美国人选择了同意私人公司运营这样一个系统。如今,这十年走到尽头,数千万的美国人,包括许多儿童,发现自己白天在口袋里装着间谍,晚上在床边还被监视。

“这些消费产品的诱惑力如此强大,以至于蒙蔽了我们,让我们看不到这样一种可能性,即有另一种方式可以在不侵犯隐私的情况下从技术中获益。但是这确实存在,”堪萨斯大学监视研究中心的创始主任William Staples说。“所有收集位置信息的公司都使用各种数据海绵进行日常监控。”

在这篇文章中,我们将揭示我们的发现,解释这一发现让我们感到震撼的原因。我们会要求你考虑到这种数据的存在所带来的国家安全风险,以及这种精确的、永远在线的人体追踪在企业和政府手中可能意味着什么。我们还会研究这些公司收集我们的精确位置的法律和道德依据,以及他们用来引诱我们分享这些信息的欺骗技术。

今天,收集和出售所有这些信息是完全合法的。在美国,就像在世界上的大多数地方一样,没有联邦法律限制人体追踪这一庞大而且有利可图的行业。只有公司内部政策和员工个人的正派行为,才能阻止那些能够接触到数据的人做出过分行为,比如跟踪分居的配偶,或者把情报官员的晚间通勤时间卖给敌对的外国势力。

这些公司表示,数据只与经过审查的合作伙伴共享。作为一个社会,我们选择了相信他们的话,这表现出我们对某些企业的盲目信任,然而我们却不会将这种信任延伸到干预少得多、但监管更严格的行业。即使这些公司按照可以想象得到的最健全的道德准则行事,他们最终也没有万无一失的办法来保护数据不落入外国安全机构之手。在一个更小但同样令人不安的范围内,通常很少有保护措施能阻止拥有这些数据的个人分析师追踪他的前任情人或受虐者。

记录一举一动

收集你所有这些活动信息的公司们有三个理由来证明他们的行为是合理的:一是人们同意被跟踪;二是数据是匿名的;三是数据是安全的。然而,根据我们获得的文件和我们对这些公司行为的审查,这些理由都站不住脚。

位置数据包含数十亿个数据点,而且没有姓名或电子邮件地址等可识别信息,但是把真实的名字和地图上的点联系起来就是小孩子的游戏了。

在大多数情况下,确定一个家庭位置和一个办公室位置就足以确定一个人的身份。想象一下你的日常通勤:有没有其他的智能手机每天直接往返于你的家和办公室之间?

乔治城大学法律中心的法学教授和隐私研究员Paul Ohm表示,将位置数据描述为匿名是“完全错误的说法”,这一说法已经在多项研究中被揭穿。“真正精确、纵向的地理位置信息绝对不可能匿名,”他补充说道。“DNA可能是唯一比精确的地理位置信息更难匿名化的东西。”

然而,这些公司仍继续声称这些数据是匿名的。在营销材料和贸易会议上,匿名仍是一个主要的卖点——这是减轻人们对这种侵入性监控的担忧的关键。

为了评估这些公司给出的理由,我们将大部分注意力转向了那些处于权力位置的人。在诸如家庭住址等公共信息的帮助下,我们很容易地识别并跟踪许多名人。我们跟踪了那些有安全许可的军方官员晚上开车回家的情况;跟踪了执法人员送孩子上学的情况;我们还看到位高权重的律师和他们的客户用私人飞机前往度假房产。

这个数据集非常大,肯定会揭露某些丑闻和犯罪,但我们的目的不是挖出它们,而是记录下监管不足的风险。

观察圆点在地图上的移动有时会发现婚姻破裂的迹象、吸毒成瘾的证据以及心理治疗的记录。通过时间和地点,把经过处理的ping信号连接到一个真实的人身上,感觉就像在读别人的日记。

在一个案例中,我们找到了Mary Millben,她是弗吉尼亚州的一名歌手,曾为包括特朗普总统在内的三位总统表演过。她被邀请参加总统就职典礼次日上午在华盛顿国家大教堂举行的仪式。那也是我们第一次发现她的位置。她还记得,在政要们和第一家庭的簇拥下,当两党成员一起祈祷时,大教堂壁龛里回荡的音乐让她深受感动。与此同时,她手机上的应用也一直在监控这一时刻,细致入微地记录着她的位置和停留时间。对于那些可能购买数据访问权的广告商来说,这种祈祷服务很可能提供一些有利可图的营销洞见。

“知道你有一个我去过的所有地方的清单,而且我的手机与之相连,这很可怕,”Millben告诉我们。“知道我在哪里,公司就能从中受益,这对我来说有点危险。”

和我们在数据中找到的许多人一样,Millben说,她对限制自己分享位置的方式很谨慎。然而,和其他大多数人一样,她也说不出可能收集了她隐私数据的应用的名字。我们的隐私就像我们设备上最不安全的应用一样不安全。

“这让我很不舒服,”她说。“我敢肯定,其他所有人也一样感到不舒服,因为不管我们用的是什么应用,公司都可以随意获取我们的数据和位置。这令人不安。”

总统就职典礼的那个周末产生了大量的个人故事和经历:典礼上的精英出席者、教堂礼拜上的宗教观察员、聚集在国家广场上的支持者。所有这些都被严密地监视和记录了下来。

除此之外,这些公司对抗议者们的行为也进行了同样严格的跟踪记录。周五晚上,沉浸在胜利喜悦中的特朗普支持者们的ping信号从国家广场消失,几个小时后,近50万涌向首都参加女权运动游行的民众的ping信号被记录了下来。如果只看游行现场的照片,你可能很难把一张脸和一个名字联系起来。但在我们的数据中,对抗议活动的ping信号通过数据与清晰的轨迹相连,记录了抗议活动前后几个月抗议者的生活情况,他们的生活场所和工作地点都包含在内。

那天下午,我们看到国防部的一位高级官员在游行的人群中穿过,从国家广场开始,经过史密森尼国家历史博物馆。那天他的妻子也在国家广场,我们跟踪他到他在弗吉尼亚的家后发现了这一点。她的手机也在源源不断地发送位置数据,还有几个邻居的手机也是如此。

这名官员的数据轨迹还包括一所高中、几位朋友的家、安德鲁斯联合基地的访问、在五角大楼度过的工作日,以及2017年与美国总统奥巴马在迈尔·亨德森联合基地举行的仪式。在那里,还有近12部电话被追踪到了。

总统就职日的周末也发生了其他的抗议和骚乱。那个周五,数百名抗议者聚集在国家广场以北,其中一些人戴着黑色帽子和面具,最终在富兰克林广场附近点燃了一辆豪华轿车。这些数据也记录了那些暴徒的行为。根据精确的时间和地点,我们对数据进行了过滤,还找到了一些在现场的人。许多警察的脸被防暴装备遮住了。这些数据指引我们找到了至少两名在现场的警察的家。

尽管我们对华盛顿这一个城市的搜索结果已经很能说明问题,但我们所依赖的还只是一小部分数据。这部分数据仅来自一家公司,聚焦于一个城市,覆盖时间也不到一年。地理位置数据公司每天收集的信息要比这多出几个数量级。

数据公司通常也会利用我们没有使用过的其他信息来源。比如,我们缺乏移动广告ID或其他标识符,而广告商常常将这些信息与人口统计信息(如家庭邮政编码、年龄、性别、甚至电话号码和电子邮件)结合起来,以创建用于定向广告的详细受众信息。当数据集被合并时,隐私风险会被放大。位置数据集中的所有保护措施都可能因为添加了一两个其他源而崩溃。

全世界每天都有几十家公司从这类数据中获利。它们直接从智能手机上收集数据,创造新技术来更好地捕捉数据,或者为定向广告创建受众档案。

所有公司的数据收集都让人眼花缭乱,因为它不断变化,似乎不可能固定下来。许多人使用的技术和微妙的语言可能会让普通智能手机用户感到相当困惑。

虽然许多公司多年来一直在跟踪我们,但大多数美国人对这些公司并不熟悉。这些公司可以处理来自GPS传感器、蓝牙信标和其他来源的数据。并非所有从事位置数据业务的公司都收集、购买、销售或使用粒度位置数据。

地理位置数据公司通常会淡化大规模收集此类信息的风险。许多公司还表示,他们并不十分担心潜在的监管或软件更新会增加收集位置数据的难度。

“这真的不至于让我们夜不能寐,”其中一家公司的首席营销官Brian Czarny说。“Factual网站不会转售详细数据,包括我们审查过的信息等。我们觉得没有人应该这么做,因为这对整个行业都有风险。”

在联邦隐私法缺位的情况下,该行业很大程度上依赖于自我监管。一些行业组织提供了旨在加强管理的道德准则。Factual网站和其他许多数据定位与营销公司加入了移动营销协会,起草了一份旨在改善自我监管的承诺书。这一承诺书将于明年公布。

各州正开始出台自己的法律作为回应。《加州消费者隐私保护法案》将于明年生效,并为当地居民增加了新的保护措施,比如允许他们要求公司删除他们的数据或阻止其出售。但除了一些新的要求外,该法律可能在很大程度上对该行业的侵犯隐私行为产生不了什么影响。

隐私和数据保护公司VeraSafe的律师Calli Schroeder说:“如果一家私人公司合法地收集位置数据,他们就可以自由地传播或分享这些数据。”

法律对这些公司公开自己的数据收集行为的要求很少。根据法律,公司只需要在隐私政策中阐述自己的做法,但这些隐私政策往往是晦涩难懂的法律文件,很少有人阅读,能真正理解的人更是少数。

万物皆可黑

你的数据到底是不是匿名的真的重要吗?位置数据公司辩称,你的数据是安全的,不会构成真正的风险,因为数据存储在受保护的服务器上。然而,这一保证已经被公开报道的数据泄露事件破坏了,更不用说那些没有公开报道的各类数据泄露事件了。事实上,敏感信息很容易被转移或泄露,下面这个故事就是很好的例子。

我们不断地留下数据,例如,在上网或使用信用卡购物时会留下数据。但是位置数据不同。我们的精确位置只会在瞬间被用于推送广告或通知,但随后被用于更有利可图的目的,比如把你的购买行为与你在高速公路上驶过的广告牌联系起来。许多使用你的位置信息的应用,比如天气服务,即使在没有你的精确位置信息的情况下也能工作得非常好,但是收集你的位置信息可以为分析、授权和将信息传递给第三方提供一个利润丰厚的第二业务。

对于许多美国人来说,他们面临的唯一真正的风险是他们的信息被曝光会带来尴尬或不便。但是对于其他一部分人来说,比如虐待案件的幸存者,风险可能是巨大的。谁又能说得清,某一个特定的个体可能想要保持什么隐私,不让朋友、家人、雇主或政府知道?我们在清真寺、教堂、堕胎诊所、同性恋场所和其他敏感地区发现了数百个ping信号。

在一个案例中,我们观察到一位微软工程师的日常活动发生了变化。一个周二的下午,他参观了微软的竞争对手亚马逊在西雅图的主要园区。接下来的一个月,他在亚马逊开始了一份新工作。我们花了几分钟才确定他是Ben Broili,他现在是亚马逊Prime Air无人机送货服务的经理。

“说我不惊讶是假的,”Broili在12月初告诉我们。我们很容易就能看出他是在参加一个工作面试,这引发了一些显而易见的问题,比如:对高管和员工的内部位置监控会成为企业的标准做法吗?

Broili并不担心应用会记录他的一举一动,但他说,他不确定这些应用提供的服务是否值得我们牺牲隐私。“这是一大堆可怕的数据,”他说。“我仍然不明白它是如何被使用的。我得看看其他公司是如何将其作为武器,或帮助盈利的。”

如果这类位置数据能让监视员工变得容易,跟踪名人也就变得简单了。他们的私人行为——不论是在深夜,在他们自己的住宅里,还是已经远离了狗仔队——都可能会受到更严密的审查。

希望通过与消息人士亲自见面来逃避其他形式监视的记者们,可能需要重新考虑这种做法的可行性。数据覆盖的每个主要新闻编辑室都包含数十个ping信号。通过弗吉尼亚州的阿灵顿,我们很容易就找到了《华盛顿邮报》的一名记者。

在一些案例中,他们会绕道去酒店,或是深夜探访知名人士的家。有一个人几乎是随机从洛杉矶的数据中挑选出来的,被发现多次往返于路边的汽车旅馆,每次只停留几个小时。

虽然这些ping信号本身并不能展现出一幅完整的画面,但通过研究每个点的日期、时间等,我们可以收集到很多信息。

像Foursquare这样的大数据公司(也许这是人们在位置数据业务方面最熟悉的一个名字)说他们不会出售详细的位置数据,而是用它来进行分析,如确定你是否是在手机上看到了一个广告之后进入商店的。

但一些公司确实出售详细的数据。买家通常是数据经纪人和广告公司。但其中一些与消费者广告无关,包括金融机构、地理空间分析公司和房地产投资公司,他们可以处理和分析如此大量的信息。据一名同意匿名发言的前位置数据公司员工说,买家可能会为购买一批数据支付100多万美元。

位置数据还与移动广告ID一起收集和共享。移动广告ID是一个大约30位数字长的匿名标识,允许广告商和其他企业通过应用将活动联系在一起。该ID还可以用来将位置轨迹与其他信息结合起来,比如你的姓名、家庭地址、电子邮件、电话号码,甚至是与Wi-Fi网络绑定的标识符。

数据几乎可以实时交换,速度非常之快。在几毫秒内,你的位置数据就可以从智能手机转移到应用服务器,再导出到第三方。举个例子,你可能会在经过一家汽车经销店后就在手机上看到一则新车广告。

这些数据可以被转售、复制、盗版和滥用。而且,你还没有办法追回它们。

位置数据的意义远不止是让消费者看到一些更相关的广告。这些信息为大型企业提供了关键的情报。例如,由《纽约时报》相关报道引发的一起洛杉矶的诉讼案件表明,Weather Channel应用的母公司分析了对冲基金用户的位置数据。Foursquare在2016年受到了广泛关注,因为它利用自己的数据预测,在一场大肠杆菌危机之后,Chipotle的销售额在未来几个月将下降30%。最终的数据是Chipotle的销售额下降了29.7%。

人们对位置数据的担忧主要集中在Verizon和AT&T等电信巨头身上,他们多年来一直向第三方出售位置数据。去年,Vice的科技网站Motherboard发现,一旦这些数据被出售,它们就会被共享,以帮助赏金猎人实时找到特定的手机。由此产生的丑闻迫使电信巨头们承诺,他们将停止向数据经纪人出售用户的位置移动数据。

然而,目前没有法律条文明确禁止他们这样做。

位置数据是通过软件开发工具包或SDK从你的手机传输的。这些工具包是一些小程序,可用于在应用中构建功能。它们让应用开发人员很容易就能添加位置跟踪功能,这是天气应用等服务的一个有用组件。因为它们很有用,使用起来也很容易,所以SDK被嵌入到成千上万的应用中。例如,Facebook、谷歌和亚马逊都有非常受欢迎的SDK,允许较小的应用连接到大公司的广告平台,或帮助提供网络流量分析或支付基础设施。

但它们也可以安静地呆在一个应用上,悄悄收集位置数据,而不需要向应用提供任何实际服务。位置数据公司可能会为这些应用付费——收集有价值的数据,然后将其货币化。

数据市场公司VenPath的首席执行官Nick Hall说:“如果你有一个经常收集位置数据的SDK.,你的数据很可能会在整个行业中被转售。”

营销人员的“圣杯”

既然这些信息如此敏感,为什么还要收集它们呢?

对于品牌来说,了解目标客户的精确数据是理解“客户旅程” ——从看到广告到购买产品的每一步——的关键。一位营销人员说,这是广告的圣杯,是把客户所有的兴趣、在线活动和现实世界的行为联系起来的完整画面。

一旦他们有了完整的客户旅程,公司就会知道我们想要什么,我们买了什么,以及我们为什么要买。其他组织也已经开始寻找使用这些数据的方法。政治竞选可以分析集会参加者的兴趣和人口统计,并利用这些数据来塑造他们的信息,试图操纵特定的群体。

不过,位置数据对社会也有一些明显的好处。研究人员可以利用原始数据为交通研究和政府规划者提供关键的见解。俄勒冈州波特兰市议会一致批准了一项通过监控数百万部手机来研究交通和运输状况的协议。联合国儿童基金会宣布了一项计划,使用汇总的移动位置数据来研究流行病、自然灾害和进行人口统计。

但是,对于个人消费者来说,持续跟踪的价值还不太明显。广告和科技行业透明度的缺乏引发了更多的担忧。

一款优惠券应用是否需要将用户每时每刻的位置数据出售给其他公司才能盈利?这真的证明允许公司追踪数百万人并可能暴露我们私生活的行为是合理的吗?

数据公司表示,当用户同意分享他们的位置时,他们也就同意了被跟踪。但这些协议条款很少清楚地向用户显示数据的打包和出售方式。如果公司能更清楚地展示他们是如何使用这些数据的,人们会愿意分享自己的位置吗?

在黑客入侵和泄密事件发生之后,隐私才成为了一个重要问题。那么,多年前收集的数据又该如何处理呢?应该继续使用,还是应该永远删除?

如果今天安全存储的数据还可能很容易就被黑客攻击、泄露或窃取,那么这种数据值得冒这样的风险吗?

如果只是为了让我们能看到更相关的广告,或者为了让对冲基金经理变得更富有,所有这些监视和风险是否值得?

我们不能指望那些从我们的一举一动中获利的公司会自愿约束自己的行为,所以国会必须介入,以保护美国人作为消费者的需要和作为公民的权利。在那之前,有一件事是肯定的:我们生活在世界上最先进的监视系统之下。这个系统不是谁故意创建的,它是在技术进步和利润动机的相互作用下建立起来的,目的是为了赚钱。科技公司曾经耍的最大的把戏就是说服社会来监视自己。