游戏传奇首页
游戏我的天下首页
最好看的新闻,最实用的信息
05月11日 15.2°C-16.6°C
澳元 : 人民币=4.79
悉尼
今日澳洲app下载
登录 注册

中投张一清:大数据与社会公平

2017-09-15 来源: 财新网 原文链接 评论0条

文|张一清

中投董事总经理

数据时代下没有隐私

数据被称为数据时代下的“新能源”,在新的商业竞争环境下对各公司的发展有举足轻重的作用。在互联网领域,我们已经见证了多家“大数据”平台的崛起,在海外有Google、Amazon、Facebook、Apple、Microsoft等,在国内有腾讯、阿里巴巴、百度等。这些公司不断搜集积累海量用户数据,并通过对数据的挖掘提高运营效率,为消费者提供了跨领域的、定制化的产品,吸引消费者在其平台上停留更长时间,进而积累更多的数据。通过这样的过程,打造了一套用户、产品、数据的循环生态,不断强化平台在市场上的影响力,提高竞争壁垒,在一些领域几乎形成了自然垄断,并在整个国家的经济中占据重要位置,有极大的影响力。

与此同时,对每个消费者而言,在各大平台垄断的领域内基本只能遵照各平台的规则,在消费和享受服务的同时把自己的数据留在平台上。早些年,很多公司并不知道如何利用这些数据,只能从中提取简单的信息。但今天,随着数据算法、机器学习算法等的进步,数据公司已经能够从海量的数据中提取越来越多的有用信息,并对每一个消费者进行尽可能全面的理解,进行所谓的“用户画像”:小到你的家庭和工作地址、起床时间、出行习惯,大到你的消费产品、账户存款、朋友圈子甚至是你的个人健康状况、潜在疾病等。如果这些信息是分散的,任何人依据单个信息或许很难进行画像,但现实情况是,这些信息大都掌握在几个大平台上,这些平台已经有能力对用户进行全方位的画像。基于当下的数据分析能力,大平台对每个人的了解应该已经远远超过了政府对个人的了解(如果不调用平台的分析数据,政府恐怕只有你登记的几页信息无非就是你的地址、年龄、银行账户等),甚至超过你的家人,乃至超过你对自己的了解。可以说,数据时代下每个人都是透明的。

大数据可能带来不公平

必须承认,大数据的使用在很多方面提升我们社会的运作效率。但任何一个社会发展过程中,效率和公平往往都是一个硬币的两面,是需要平衡的,过分的追求效率导致的不公平反过来也可能使单纯追求高效付出代价。当下,对于大数据,整个社会似乎更多地都在关注如何用其提升效率,而没有注意到大数据可能带来的不公平。

大数据是一门统计学问,需要通过对历史数据的搜集整理,并通过统计模型得到一个结果,而这个结果一般来说是在一定的概率下成立的,可能是60%,也可能是90%或者更高。在商业领域,保持大概率判断正确对应的期望回报,高于小概率判断错误带来的期望亏损,即可通过大数定律实现稳定回报。但是,如果把这个统计概率应用到对人的评价中,就可能带来小概率错误导致的不公平,而整个社会提倡和保障的正是少部分群体免于被歧视和遭遇不公平。比如,为盲人建立盲道,在马路边沿为轮椅专门开的缺口都是为了保障少数群体的利益,其实际使用者占总人群的比例可能连0.01%都不到,但我们仍然有必要提供上面的设施保障少数全体的利益。更不用说在大数据判断的上亿人中,即使有不到1%的判断失误,被误判的人数也是数以十万计的。因此,大数据误判造成的不公平带来的社会伤害不能用简单的商业逻辑来衡量。

举例来说,一家旅游或者餐饮平台通过分析客户过往的消费数据可以很快判断客户的消费水平,在推荐关联产品时就有可能基于客户画像对于同一款产品推送不同的价格,因信息不透明产生价格歧视,这对消费者是否公平?在这种情况下,不再是少数人利益受损,大多数人利益都会受损,只有少部分平台获益。

再者,如果把大数据应用到应聘层面,公司能够了解到每位员工的家庭背景、过往经历和朋友圈等,是否可能会因此拒绝一些过往家境贫寒、朋友圈小的应聘者从而限制了其未来发展空间?再如当下流行的 “信用评级”:当一个孩子出生在富裕家庭,进行过大量的高消费,是否就应该获得比出生在一个贫困家庭没有消费记录的孩子更高的“信用评级分”呢?统计学给出的答案:是的。但这个信用评级体系公平吗?

进一步地,如果未来我们的基因数据能够被精确测量和理解,或者通过其它对生活习惯数据的监督能够预测一个人患某种疾病的概率,保险公司是否就应该因人设定保费,对那些有遗传疾病基因、大概率得病的人设定高额保费甚至不给予投保机会呢?这一天也许离我们并不远,已经有保险公司提供买保险提供基因检测服务(目前大多保险公司还是承诺不会因为基因测序结果作为定价依据,长期看几乎是不可能的,否则会造成消费者和保险公司的信息不对称而给保险公司造成损失),也有保险公司与手环公司合作以获得投保者的部分生活行为数据(每天运动的人患病率按多数人理解是低于每天不运动的人)。

大数据是机器的产物,机器在对人进行评判时是基于算法的,是机械的。而人类哪怕是动物不同与机器的地方就在于,人类是有同情心、怜悯和宽容的,而机器使用的优化算法追求的是效率最大化,这个过程很可能造成不平等的结果。当我们沾沾自喜地宣称用大数据“精确地”抓取欺诈事件时,是否想到同样的方法如果被应用在保险行业就可能“精确地”抓取社会上的“弱者”,为追求经济利益违背保险行业的初衷?

数据成为能源,具有公共事业的特征,需要被监管

当一种资源成为社会发展的必需品,容易具有垄断特性,就应该成为一种公共事业,需要被监管。因为这种必需品深刻影响着整个社会的发展,并关系到每位公民的利益,如果没有监管就可能出现漫天定价,挤压其它行业利润,甚至影响整个经济发展的情况。历史上来看,每种有垄断属性的必需品都被严格监管,且大都成为了公共事业:19世纪末石油是必需品,标准石油垄断了石油市场因而被监管和分拆;电力革命带来的必需品是电,所以电力公司要被监管,电力成为公共事业;信息革命时代,电话和网络讯号是必需品,AT&T因为垄断而被监管和分拆,通信也成为公共事业。

今天,我们可能需要对公共事业有一个新的理解:在信息和数据时代下,又有新的产品成为了生活中的必需品,例如电商、社交、搜索、云计算、分享经济等都成为了当下人必不可少的工作和生活工具,也可以算是新的公共事业。为什么现在这些平台公司没有被政府严厉监管呢?很重要的一个原因是在互联网时代大多公司利用互联网这个免费的渠道(如果不免费,互联网必须被监管并成为公共事业)提供服务。但在新的数据时代,这些少数的平台作为必需品,成为了大部分数据的产生渠道,开始具备垄断的特征,能够对社会发展和每个人的切身利益产生重要影响。因此,相应的监管也应该跟上,掌握大量数据的渠道也应该被近似看作公共事业。

那么如何进行监管?

划定数据的获得、搜集和使用的边界

数据时代的监管应该关注在数据资源的获取和使用边界,在这个边界外对个人的隐私需要有立法保护。

举例来说,当消费者在共享平台进行打车时,平台会实时获取用户的地址信息,但这个信息在使用后是否应该被平台留存甚至进一步开发?实际上,这个信息就包含用户潜在住址、工作地址、消费地址等信息,进一步挖掘可能会了解用户的消费能力,收入水平等,对于提供打车服务的公司是否应该挖掘数据并获取以上这些信息?再比如,在社交网络上留存的聊天信息,每个人的朋友圈子和连接关系是否应该被挖掘进而判断一个人的工作、朋友圈子乃至一个人的信用?保险公司可以搜集人的哪些健康数据?进一步,整合的用户画像是否可以共享,在涉及教育、招聘、婚姻、医疗、金融等场景下是否可以使用?

每个消费者在平台面前都是弱势方:如果你不接受平台获取你的信息就没办法使用产品,因没有其它选择而被迫接受自己信息被无限制获取和使用。这时候,就需要平衡效率和公平的监管方介入,对信息获取方进行监管,可能包括以下几个方面:

对哪些信息是与服务相关的进行界定,判断哪些信息可以被搜集;

哪些信息可以在平台内甚至跨平台、跨公司流通,哪些信息不能够进行分享;

哪些信息不能被二次挖掘;

在数据挖掘过程中的算法是否可能造成不公平的结果,需要企业公开并透明化;

在什么场景下,是否可以获取或使用某些数据信息。

大数据的使用对于提升社会效率有巨大贡献,但大数据的滥用和没有边界的使用带来的社会不平等和个人隐私被严重侵犯的问题应该引起关注和重视。在追求效率的同时要时刻警醒不公平结果的出现,需要通过监管,把大数据的使用圈定在一个特定的范围内,既有利于大数据使用的规范化进而促进其发展,也能兼顾社会公平和对个人的保护。

任重道远,砥砺前行。■

今日评论 网友评论仅供其表达个人看法,并不表明网站立场。
最新评论(0)
暂无评论


Copyright Media Today Group Pty Ltd.隐私条款联系我们商务合作加入我们

分享新闻电话: (02) 8999 8797

联系邮箱: info@sydneytoday.com 商业合作: business@sydneytoday.com网站地图

法律顾问:AHL法律 – 澳洲最大华人律师行新闻爆料:news@sydneytoday.com

友情链接: 华人找房 到家 今日支付Umall今日优选