博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据时代我们没有藏身之处
阅读量:6225 次
发布时间:2019-06-21

本文共 2737 字,大约阅读时间需要 9 分钟。

假设两个人想要秘密幽会,他们会怎么做?首先,他们不会随身带手机,因为他们知道,通过分析手机的位置数据,就很可能发现他们当天在同一时间、同一地点的行踪。于是,他们商量好在距离某个街区、某个位置的时候关闭手机,来给这次见面“加密”。但是,在那几个小时内同时消失而后又出现的手机追踪信息,恰恰可能成为一项可疑点,暴露出两人见面的时间和地点。

前亚马逊首席科学家安德雷斯·韦思岸(Andreas Weigend)举了这个例子来向《陆家嘴》记者阐述了他的观点:大数据时代下,我们没有藏身之处。

数据预测的力量

“我们发现人们比想象中更具备可预测性。” 韦思岸说道,在作决定的时候,人们往往想要有一种独特性。但事实上,数据往往能非常准确地预测人们的行为。

在预测的过程中,最重要的部分是好的变量,因为预测客户行为的准确性取决于导入算法模型中的数据。然而,令人惊奇的是,人们的购买记录所发挥的作用往往比不上人们在购买时所处的情境重要。

“举个例子来说,如果你在亚马逊搜索数码相机,那么在购物的过程中,也就是一个在你脑海中不断创建和保留想要的产品的过程,对于预测消费行为是非常有价值的。” 韦思岸谈道。他举了一个例子,在购买过程中,如果用户有同时点击两件相似产品的行为,这两件产品就会被标记成替代商品。若是用户有同时购买两件商品的行为,这两件商品就会被标记为互补商品。基于这些汇总点击和购买数据,亚马逊就能更好地预测用户的行为,来为其进行相对应的商品推荐。

在韦思岸看来,用户不仅应该有创造数据的权利,还应该有修改数据的权利。当用户把某样东西标注成礼物的时候,就等于告诉了亚马逊不要把它算在购买数据内,并通过预测模型来推荐相关的购买物。如果用户在亚马逊上创造一份愿望清单,对于用户来说,他不只是把物品(数据)放进购物车,还能够修改它。

“在我们的生活中,可能会出现比如我和我的朋友出去吃了一顿饭,他托我帮他买了一本关于婴儿游泳的书。然而,对于我来说至少在明年一年的时间里,我都不想要亚马逊向我推荐关于婴儿游泳的书籍。所以在这个时候,如果用户可以说‘我是帮别人买的’,就可以避免这种情况。”韦思岸讲道,“如果我很想收到关于大数据的书的推荐,我甚至可能通过某种方式来更强调它。赋予用户修改数据的权利对于他们表现出真正的偏好是至关重要的。”

如果修正数据能够使人们从中受益,那么他们修改数据的积极性就会很高。韦思岸继续提出了他的看法,“如果我修改了一些数据,结果是我收到了大数据类书籍的推荐,那么我就会被鼓励去继续修改数据。但是,如果我修改了数据之后没有看到结果,那么我为什么要再花时间去修改?”因此,用户修改数据的积极性与他们从系统中得到的利益也是相辅相成的。

当《黑镜》照进现实

当下炙手可热的黑科技电视剧《黑镜》在第三季第一集中设计了一个以社交印象评分系统为核心的社会。韦思岸认为,它不仅“把隐性的东西显性化(make the implicit explicit)”,还在一定程度上诠释了征信机构的信用评分。

什么是“把隐性的东西显性化”?

“首先,你思考一下自己到底想要什么,通过把真实的想法说出来,你把隐性的思维显性化了。如果你说,我确实不想要投资美国股票,因为我不知道特朗普上台之后会发生什么。在这个事情上,你的表达把隐性的想法显性化了。另一方面来说,假设你在约会网站上找对象,中国人有些眼睛大,有些眼睛小,你喜欢眼睛小的男生你却不知道,但是约会网站能够把你隐性的偏好显性化,因为它知道每一个你点击的男生都是小眼睛的。”韦思岸举了一个非常形象的例子。

那么,当人们把“隐性的东西显性化”之后,也就是不再能藏住自己的感受的时候,社会会受到什么影响?

韦思岸告诉《陆家嘴》记者,他并不知道人们的行为会发生什么样的变化,但是《黑镜》中有几个令他印象很深刻的场景可以为我们带来一些有趣的启发。比如,在一个机场的场景中,女主人公需要出席一场婚礼,工作人员看了她的评分后,告诉她没有可用的航班,因为他们不能让一个像她这样评分的人上那架飞机,她气急败坏。人们看了她的表现后,都给她评了更低的分数。随后,机场安保人员来了,并给予了她暂扣1分,24小时后恢复,在此期间所有低分评价双倍计算的处罚。

另一方面,女主人公后来被一个卡车司机接走了,让人庆幸的是,这个女人是世界上最自由的女人,因为她能让自己的内心达到平和,就像是在冥想或是佛教中的打坐,你不会去追赶下一个想法,你只是让想法自然地出现,而后消失。很有趣的是,她找到了方法走出了原来的世界,从此引领着自己的生活。

“我认为,芝麻信用评分是我在过去一年半中接触到的最有趣的事情。” 韦思岸说,“从概念上,我会很坚持地为它说话,因为中国政府在2020蓝图的社会信用部分中,提到在有这么多电子化手段的世界里,我们需要一些告诉人们去相信谁的方法。”可能的话,芝麻信用评分需要更多的维度,因为只有一个评分是不够的,就像人们在需要医药方面建议和购物建议的时候往往会找不同的朋友咨询一样。

然而,在现实中也会遇到问题,是谁来决定什么事项会被计入评分?什么是芝麻信用分的决定因素?这些问题如果没有清楚的答案的话,有可能会导致一些人社会权利的降低。如果有人因为某种原因不喜欢另一个人,在他拥有了那些数据的时候,他就可以找到一些针对这个人的方法。

每一个人都可能在不经意间或多或少地破坏法律规定,比如有时候在没有红绿灯的情况下,不知道哪条马路能过还是不能过。我们的生活中有很多数据点,包括人脸识别、监控录像等等,现在的问题是那些拥有了数据的人会如何使用这些数据。如果他不喜欢一个人或者一个群体,就有可能会使用一些手段来歧视一部分人。

“如果99%的人会因为芝麻信用评分过上更好的生活,然而1%的人生活的更不好,就会造成问题。哪99.99%的人会过得更好呢?你可能会说,有这个积分是很好的,然而关键的问题是,这个分数不能取决于创造它的人们,而是应该取决于社会。” 韦思岸说,“培养数据素养是很重要的,人们知道数据,人们创造他们想要分享的数据,所以我希望人们来决定分享哪些数据,并且知道什么是结果和代价。”

韦思岸认为,人们需要很清楚代价,如果冒了更大的风险,会期待一个更高的回报。“当有人问我要了他们不需要的数据,我会不高兴。但如果有人不想分享数据,导致数据精炼后的产品和服务不能带来他们需要的东西,这也不会是他们想要的结局。”他说道。

韦思岸认为,在大数据由取之于民、归之于民演变为用之于民的状态下,人们迫切地需要培养一种数据素养,包括了解数据服务商的工作机制、可改变的参数、可纠正的错误、不确定的因素以及预测分享数据可能带来的结果等等。

本文转自d1net(转载)

你可能感兴趣的文章
PCB的初次窥探
查看>>
如何巧妙的使用ArrayList的Clone方法
查看>>
[转] 基于NodeJS的前后端分离的思考与实践(五)多终端适配
查看>>
Oracle 查看表结构视图
查看>>
Virtual servers on a Raspberry Pi with the light weight OS virtualization system Docker!
查看>>
一起学Android之Intent
查看>>
day1作业二:多级菜单操作
查看>>
php 构造函数 __construct()
查看>>
1117 Eddington Number
查看>>
图片加载之AFNetwork(上)
查看>>
递归和尾递归
查看>>
MongoDB--副本集基本信息
查看>>
sublime text 3安装
查看>>
UIViewController的生命周期
查看>>
[jzoj 5230] 队伍统计(状压DP)
查看>>
第一套面试题
查看>>
10个流行的JavaScript面试题
查看>>
演好你的角色
查看>>
javascript高级
查看>>
iOS下JS与OC互相调用(五)--UIWebView + WebViewJavascriptBridge
查看>>