你的隐私,大数据怎知道?我们又该如何自我保护?******
在网络上,每个人都会或多或少,或主动或被动地泄露某些碎片信息。这些信息被大数据挖掘,就存在隐私泄露的风险,引发信息安全问题。面对汹涌而来的5G时代,大众对自己的隐私保护感到越来越迷茫,甚至有点不知所措。那么,你的隐私,大数据是怎么知道的呢?大家又该如何自我保护呢?
1.“已知、未知”大数据都知道
大数据时代,每个人都有可能成为安徒生童话中那个“穿新衣”的皇帝。在大数据面前,你说过什么话,它知道;你做过什么事,它知道;你有什么爱好,它知道;你生过什么病,它知道;你家住哪里,它知道;你的亲朋好友都有谁,它也知道……总之,你自己知道的,它几乎都知道,或者说它都能够知道,至少可以说,它迟早会知道!
甚至,连你自己都不知道的事情,大数据也可能知道。例如,它能够发现你的许多潜意识习惯:集体照相时你喜欢站哪里呀,跨门槛时喜欢先迈左脚还是右脚呀,你喜欢与什么样的人打交道呀,你的性格特点都有什么呀,哪位朋友与你的观点不相同呀……
再进一步说,今后将要发生的事情,大数据还是有可能知道。例如,根据你“饮食多、运动少”等信息,它就能够推测出,你可能会“三高”。当你与许多人都在独立地购买感冒药时,大数据就知道:流感即将暴发了!其实,大数据已经成功地预测了包括世界杯比赛结果、股票的波动、物价趋势、用户行为、交通情况等。
当然,这里的“你”并非仅仅指“你个人”,包括但不限于,你的家庭,你的单位,你的民族,甚至你的国家等。至于这些你知道的、不知道的或今后才知道的隐私信息,将会把你塑造成什么,是英雄还是狗熊?这却难以预知。
2.数据挖掘就像“垃圾处理”
什么是大数据?形象地说,所谓大数据,就是由许多千奇百怪的数据,杂乱无章地堆积在一起。例如,你在网上说的话、发的微信、收发的电子邮件等,都是大数据的组成部分。在不知道的情况下被采集的众多信息,例如被马路摄像头获取的视频、手机定位系统留下的路线图、驾车的导航信号等被动信息,也都是大数据的组成部分。还有,各种传感器设备自动采集的有关温度、湿度、速度等万物信息,仍然是大数据的组成部分。总之,每个人、每种通信和控制类设备,无论它是软件还是硬件,其实都是大数据之源。
大数据利用了一种名叫“大数据挖掘”的技术,采用诸如神经网络、遗传算法、决策树、粗糙集、覆盖正例排斥反例、统计分析、模糊集等方法挖掘信息。大数据挖掘的过程,可以分为数据收集、数据集成、数据规约、数据清理、数据变换、挖掘分析、模式评估、知识表示等八大步骤。
不过,这些听起来高大上的大数据产业,几乎等同于垃圾处理和废品回收。
这并不是在开玩笑。废品收购和垃圾收集,可算作“数据收集”;将废品和垃圾送往集中处理场所,可算作“数据集成”;将废品和垃圾初步分类,可算作“数据规约”;将废品和垃圾适当清洁和整理,可算作“数据清理”;将破沙发拆成木、铁、布等原料,可算作“数据变换”;认真分析如何将这些原料卖个好价钱,可算作“数据分析”;不断总结经验,选择并固定上下游卖家和买家,可算作“模式评估”;最后,把这些技巧整理成口诀,可算作“知识表示”。
再看原料结构。大数据具有异构特性,就像垃圾一样千奇百怪。如果非要在垃圾和大数据之间找出本质差别的话,那就在于垃圾是有实体的,再利用的次数有限;而大数据是虚拟的,可以反复处理,反复利用。例如,大数据专家能将数据(废品)中挖掘出的旅客出行规律交给航空公司,将某群体的消费习惯卖给百货商店等。总之,大数据专家完全可以“一菜多吃”,反复利用,而且时间越久,价值越大。换句话说,大数据是很值钱的“垃圾”。
3.大数据挖掘永远没有尽头
大数据挖掘,虽然能从正面创造价值,但是也有其负面影响,即存在泄露隐私的风险。隐私是如何被泄露的呢?这其实很简单,我们先来分解一下“人肉搜索”是如何侵犯隐私的吧!
一大群网友,出于某种目的,利用自己的一切资源渠道,尽可能多地收集当事人或物的所有信息;然后,将这些信息按照自己的目的提炼成新信息,反馈到网上与别人分享。这就完成了第一次“人肉迭代”。
接着,大家又在第一次人肉迭代的基础上,互相取经,再接再厉,交叉重复进行信息的收集、加工、整理等工作,于是,便诞生了第二次“人肉迭代”。如此循环往复,经过多次不懈迭代后,当事人或物的画像就跃然纸上了。如果构成“满意画像”的素材确实已经证实,至少主体是事实,“人肉搜索”就成功了。
几乎可以断定,只要参与“人肉搜索”的网友足够多,时间足够长,大家的毅力足够强,那么任何人都可能无处遁形。
其实,所谓的大数据挖掘,在某种意义上说,就是由机器自动完成的特殊“人肉搜索”而已。只不过,这种搜索的目的,不再限于抹黑或颂扬某人,而是有更加广泛的目的,例如,为商品销售者寻找最佳买家、为某类数据寻找规律、为某些事物之间寻找关联等。总之,只要目的明确,那么,大数据挖掘就会有用武之地。
如果将“人肉搜索”与大数据挖掘相比,网友被电脑所替代;网友们收集的信息,被数据库中的海量异构数据所替代;网友寻找各种人物关联的技巧,被相应的智能算法替代;网友们相互借鉴、彼此启发的做法,被各种同步运算所替代。
各次迭代过程仍然照例进行,只不过机器的迭代次数更多,速度更快,每次迭代其实就是机器的一次“学习”过程。网友们的最终“满意画像”,被暂时的挖掘结果所替代。之所以说是暂时,那是因为对大数据挖掘来说,永远没有尽头,结果会越来越精准,智慧程度会越来越高,用户只需根据自己的标准,随时选择满意的结果就行了。
当然,除了相似性外,“人肉搜索”与“大数据挖掘”肯定也有许多重大的区别。例如,机器不会累,它们收集的数据会更多、更快,数据的渠道来源会更广泛。总之,网友的“人肉搜索”,最终将输给机器的“大数据挖掘”。
4.隐私保护与数据挖掘“危”“机”并存
必须承认,就当前的现实情况来说,大数据隐私挖掘的“杀伤力”,已经远远超过了大数据隐私保护的能力;换句话说,在大数据挖掘面前,当前人类有点不知所措。这确实是一种意外。自互联网诞生以后,在过去几十年,人们都不遗余力地将碎片信息永远留在网上。其中的每个碎片虽然都完全无害,可谁也不曾意识到,至少没有刻意去关注,当众多无害碎片融合起来,竟然后患无穷!
不过,大家也没必要过于担心。在人类历史上,类似的被动局面已经出现过不止一次了。从以往的经验来看,隐私保护与数据挖掘之间总是像“走马灯”一样轮换的——人类通过对隐私的“挖掘”,获得空前好处,产生了更多需要保护的“隐私”,于是,不得不再回过头来,认真研究如何保护这些隐私。当隐私积累得越来越多时,“挖掘”它们就会变得越来越有利可图,于是,新一轮的“挖掘”又开始了。历史地来看,人类在自身隐私保护方面,整体处于优势地位,在网络大数据挖掘之前,“隐私泄露”并不是一个突出的问题。
但是,现在人类需要面对一个棘手的问题——对过去遗留在网上的海量碎片信息,如何进行隐私保护呢?单靠技术,显然不行,甚至还会越“保护”,就越“泄露隐私”。
因此,必须多管齐下。例如从法律上,禁止以“人肉搜索”为目的的大数据挖掘行为;从管理角度,发现恶意的大数据搜索行为,对其进行必要的监督和管控。另外,在必要的时候,还需要重塑“隐私”概念,毕竟“隐私”本身就是一个与时间、地点、民族、文化等有关的约定俗成的概念。
对于个人的网络行为而言,在大数据时代,应该如何保护隐私呢?或者说,至少不要把过多包含个人隐私的碎片信息遗留在网上呢?答案只有两个字:匿名!只要做好匿名工作,就能在一定程度上,保护好隐私了。也就是说,在大数据技术出现之前,隐私就是把“私”藏起来,个人身份可公开,而大数据时代,隐私保护则是把“私”公开(实际上是没法不公开),而把个人身份隐藏起来,即匿名。
(作者:杨义先、钮心忻,均为北京邮电大学教授)
网络平台可建谣言联合惩戒机制******
调查动机
“德尔塔奥密克戎共循环”“一景区6名阳康游客心衰死亡”“北京自来水阳了”“由于疫情原因快递业1月8日停业”……一段时间以来,涉疫网络谣言四起,歪曲国家防疫政策,消解群众抗疫信心,严重危害社会稳定,人民群众深恶痛绝。
近日,中央网信办通报涉疫谣言典型案例,相关负责人表示,将持续坚决打击造谣传谣行为,从严查处发布谣言的账号主体,同时欢迎有关部门和网民积极参与举报,提供有关线索,合力铲除网络谣言生存土壤。
涉疫谣言为什么屡禁不绝,一些谣言为何辟谣后又卷土重来,如何开展有效整治净化网络空间?带着这些问题,记者进行了深入调查采访。
漫画/李晓军
□ 本报记者 张守坤 文丽娟
“阳康,不等于健康了,昨天老君顶滑雪的死好几个,都是阳康的,一剧烈运动突然心衰了。”近日,网传“秦皇岛老君顶景区的‘阳康’游客心衰死亡6人”的信息引发关注。后经调查,该消息为虚假信息。目前,造谣女子马某已被警方行政拘留。
从“今晚全城大消杀”到“自来水加大氯气注入”,从“核酸采样有毒”到“口罩原料会导致肺结节”,从“一阳性男子被吊车转移”到“某地用集装箱运转阳性患者”,从“自来水阳了会传播病毒”到“可以挑个温和毒株感染产生抗体”……
《法治日报》记者在调查中发现,每过一段时间,网上流传的各种涉疫谣言都会“更新换代”,他们有的是故意歪解、虚构防疫政策,有的是打着科学的幌子进行伪科普。因为和疫情相关,这些谣言很容易迅速吸引眼球,获得大量关注和转发,导致不少人因此产生疑惑、焦虑、恐慌等情绪,甚至干扰了正常的疫情防控工作。
多位受访专家表示,整治网络谣言、净化网络空间,必须进一步压实平台责任,完善信息审查和研判机制,源头控制涉疫谣言发布;要依法严惩造谣者,造成严重后果的,予以刑事打击。
网络涉疫谣言不断
造谣者靠引流赚钱
今年元旦,一早打开社交软件的江苏省连云港市市民尹康发现,自家社交群和朋友圈中又出现了好几个已经连续被辟谣的谣言。
假期结束上班时,还有同事拿着一瓶二锅头“神秘兮兮”地对尹康说,高度酒可以预防新冠感染,你要不要来点。更让尹康烦心的是,原本肝肺不好已戒烟戒酒的爷爷看到这些消息后,立马向家人闹着要抽烟喝酒……
尹康说,像这样的谣言虽然多,但明眼人一看就知道是假的,可由于传播速度太快、范围太广,还是有部分人,特别是不少老年人愿意相信。此外现在还有很多谣言都是披着科学的外衣,语气言之凿凿,一般人很难分辨。
前不久,微信安全中心公布了2022年朋友圈流传最广的十大谣言,其中多条与疫情有关,比如“采样棉签”上有试剂有毒、疫情期间每天可领取补贴、千金藤泡水喝可预防新冠病毒等。对江苏省南通市的潘莹来说,这些谣言她再熟悉不过。
“这十大谣言,我家里长辈都往群里转发过,这几年我一直走在辟谣的路上,费尽口舌告诉家人这些都是假的,但谣言一直都有,尤其是有关疫情的,这个被辟谣了那个又来了,一些被辟谣的谣言过一段时间还会卷土重来,而且每个谣言不管多离谱家里人总有相信的。”潘莹说。
近段时间以来,有关新冠病毒奥密克戎变异株XBB的消息甚嚣尘上。最新消息显示,上海已经监测到新毒株XBB.1.5传入。目前,网络上关于XBB.1.5的传言很多,尤其是互联网平台流传一张截屏称,目前在我国流行的毒株都是XBB.1.5的弟弟,XBB.1.5主攻心脑血管,并会引发拉肚子,建议公众准备蒙脱石散、诺氟沙星、补液盐、益生菌等。上海辟谣平台表示,该截屏夸大了XBB.1.5的致病性,而且不排除别有用心者借此推销产品。已有多名医生提醒,不要随意服用截屏里所称的蒙脱石散、诺氟沙星等药物。
记者在调查中发现,自疫情防控工作开展以来,有关防治新冠感染的各类信息,总是会占据社交App、网站等网络平台醒目的位置,其中也包括不少新老谣言,而且涉疫谣言在疫情发展的不同阶段呈现不同分布特征,反映公众情绪和需求的变化,可能让大家对新冠感染产生错误认识,在预防、治疗新冠过程中采用错误手段,进而影响到正常的疫情防控工作。
法治网舆情中心曾对高热涉疫网络谣言进行舆情分析,发现社交平台成为涉疫谣言“培养皿”,多数涉疫谣言来源于社交平台,主要通过聊天群、朋友圈、公众号、视频号等方式扩散,其中聊天群和朋友圈为传播主阵地。这是因为“强关系”社交圈具有私密性、封闭性、集聚性等特质,熟人关系链传播的私密性,使得信息生产、转发的过程难以被追踪,同时谣言可信度和转发量大大增加,进而实现跨群、跨平台传播。此外,各类短视频平台成为网络谣言新的“策源地”,短视频拥有的在场感和真实性增加了谣言的说服力,常常误导公众信以为真。
一些发布者为何热衷编造谣言?公安部网安局曾对此揭秘,造谣者发布的内容下方或留言评论区,都会有广告插入。流量广告主曝光和点击量越多,收益就会越多。“可以说,你的每一次点击,造谣者都能赚钱。”
尹康说,他的不少朋友和家人,都觉得随手转发这些信息可以提醒更多人,是一种正能量行为,即使是假的也不会给他人造成什么损失,结果自己不知不觉间已经成了让谣言范围扩大的传播者。
假借官方名头发出
平台负有治理责任
近日,一条声称来自“常州红十字会会长”的通知传播很广。该通知称,将红糖、生姜、大葱白、大蒜等熬水喝,感染病毒的概率几乎为零,山东省菏泽市的李磊也收到了家中老母亲发来的“抗疫良方”。但李磊上网核查发现,该截图早在2020年2月就已在网络传播,当时常州红十字会工作人员就对外辟谣表示,该机构以及会长都没有发布过以上信息。
“大多数都是一眼就能看出是谣言,甚至有很大一部分是官方已经辟谣过,被证实就是谣言,很疑惑为什么很多谣言却屡禁不止,而且明明已经辟谣过的谣言还是有人对此深信不疑。”李磊说。
潘莹说,她看到很多谣言,都是假借官方机构的名头发出的。“我之前经常收到通知核酸检测、健康码变红等短信,上面写着由疾控中心发送还留有电话,他们有些是真的,有些是假的,很多人因此被骗,导致我现在只要看到涉疫短信都会怀疑其真实性。”
“谣言实在太多了,辟谣后可能会记住一段时间,但我们都不是专业人士,大多数人可能一两个月就会忘记,类似谣言再来时又难以分辨。”潘莹说。
在中国政法大学知识产权研究中心特约研究员李俊慧看来,涉疫谣言屡禁不止主要有三方面原因,一是涉疫信息是公众关注的焦点,这背后与个体对如何避免被感染、感染后如何处理等方面的关注有关;二是与部分地区涉疫信息的发布不充分、不及时和不全面有关,因为真实信息不能满足或解决公众关注,自然就会被一些虚假信息所吸引;三是涉疫谣言信息形式上具有证实、例证或难辨真伪的特征,使得相关信息很容易被误信及进一步误传。
散布涉疫谣言,造谣者可能承担何种责任?
北京京师(泉州)律师事务所律师艾泓强告诉记者,根据治安管理处罚法,散布谣言,谎报险情、疫情、警情或者以其他方法故意扰乱公共秩序的,将面临拘留、罚款处罚。如果因散布谣言而侵犯了公民个人名誉权的,依据相关规定,侵权者将承担停止侵害、恢复名誉、消除影响、赔礼道歉及赔偿损失的责任。此外,制造、传播疫情谣言还可能要承担刑事责任。
去年11月底,中央网信办就曾通报,针对近期疫情防控、突发案事件、社会民生等领域谣言问题,督促指导网站平台加强监测查证,重点网站平台共处置传播网络谣言账号5400余个,第一时间溯源并关闭首发账号。
接受记者采访的专家认为,网络平台对于涉疫信息的治理负有不可推卸的责任。
李俊慧认为,网络平台要对信息进行分类,明确哪些属于单纯的个体经验分享,哪些属于可能产生误导的信息发布。对于用户在平台上发布的各类信息,应及时建立审核和研判机制,加强信息内容相似比例高的经验分享类审核,避免造成虚假涉疫信息传播,引发公众恐慌。对于救助类信息发布,既要保障救助类信息可以正常发布,也要避免不法分子简单抄袭套用他人求助信息进行发布,影响公众判断。
抖音平台相关工作人员向记者介绍,近期,平台在例行巡查中发现,有极少数用户发布毫无医学根据的内容,例如“新冠退烧偏方——黄豆煮水喝”“艾叶和艾条熏烟可以消灭新冠病毒”“发烧时千万不能吃的食物,包括鸡蛋、牛奶”等。上述内容先后被权威媒体和医学专家辟谣。对此,平台给予了持续打击与处理。2022年11月至今,平台共处理与疫情相关不实视频33.26万条,打标20余万条存疑内容。
及时发布权威信息
依法打击涉疫谣言
近日,上海辟谣平台梳理了近期热传的谣言,按照“预防篇”“症状篇”“治疗篇”“生活篇”4大主题分类,并同时附上医学专家、权威机构的建议和意见,希望能为公众呈现一份实用的“防治宝典”。
记者发现,用户通过搜索“疫情”或者抖音主页切换到“抗疫”专栏,就能进入抖音的防疫辟谣专区,查看相关知识;在百度以“新冠”“疫情”等关键词进行搜索时,还会出现辟谣专区和全国防疫热搜榜,给用户更科学的指引。
打击治理涉疫谣言,相关部门一直在行动。
通过网络发布、传播虚假涉疫信息,蓄意制造传播涉疫谣言,严重影响了正常公共秩序,湖北公安机关依法严厉打击,严肃追究发布者、转发者、群主、管理员等人员的相关法律责任。
2022年10月8日,湖北省监利市市民黄某在多个社交群散布涉疫谣言,该市市民胡某在未经核实的情况下,转发到个人短视频账号再次扩散。两人的行为引发当地居民恐慌,造成恶劣影响。监利市红城派出所组织警力进行调查,迅速找到传播者黄某和胡某,对其开展普法教育,二人对该谣言进行了澄清。最终,违法行为人黄某被依法处以行政拘留五日的处罚,胡某被依法处以罚款200元的行政处罚。
去年11月,中共榆林市委网信办、陕西榆林市公安局发布《关于依法打击整治涉疫情网络谣言的通告》,严禁编发不实信息,坚决抵制网络谣言,各网站平台、自媒体人、互联网群组管理员要从严审核涉疫信息来源及内容,对通过网络发布、传播虚假信息,造成严重社会影响的,网信、公安机关将依法依规予以打击,对相关网站、平台和互联网账号进行依法处置,并依法追究发布者等相关人员的法律责任。
近日,江西省九江市官方发布通告,涉疫相关信息以全市各级疫情防控指挥部官方发布信息为准,对未经官方证实的涉疫信息做到不发布、不传播、不评论、不信谣、不造谣、不传谣。已发布的应立即予以删除,主动消除不良社会影响。无法删除的要及时辟谣,主动向公众说明情况。
在中国互联网协会法工委副秘书长胡钢看来,目前,我国已经构筑了传染病防治法、突发公共卫生事件应急条例等为主的疫情报告、通报和公布的法律体系,民法典、刑法、治安管理处罚法、电子商务法、网络安全法、互联网信息服务管理办法等为主的网络谣言治理的法律体系,并持续开展了“清朗·打击网络谣言和虚假信息”等专项行动,督导网站平台切实履行信息内容管理主体责任,及时处置相关违法违规信息和账号,共同营造清朗网络空间。
如何才能够让涉疫谣言不再“露头”?
李俊慧说,对涉疫虚假或谣言信息的精准打击和治理,需要具备真实、科学信息发布主体或监管部门与平台加强联动,具有信息甄别能力和条件的主体参与到各类平台信息发布的审核中,从源头控制谣言信息发布。此外,要加强对用户发布信息的大数据分析,提炼用户关注焦点,及时发布权威信息予以回应,解除或降低公众担忧。对于涉嫌故意制造传播虚假信息的,要依法追究相关人员法律责任。
胡钢建议,完善传染病疫情预警制度和传染病疫情信息公布制度,由中国疾控中心定期公布全国法定传染病疫情信息,县级以上疾控机构定期公布本行政区域法定传染病疫情信息。传染病暴发、流行时,由县级以上地方人民政府卫生健康主管部门公布本行政区域内疫情信息;传染病出现跨省暴发、流行时,由国务院卫生健康主管部门负责公布。同时,提升网站平台涉疫网络谣言精准治理能力,互联网行业协会可构建信息共享和联合惩戒机制,对于屡次恶意发布谣言者,可进行信息限时发布或者禁止发布的惩戒。