基于个人数据的推论属于个人数据论文_彭超

基于个人数据的推论属于个人数据论文_彭超

(四川大学,四川 成都 610207)

摘要:为了确定数据是否为“个人数据”,应当从三个方面出发进行判断,即数据处理的内容,目的或结果,这三个方面必须直接或间接与可识别的人有关。通过这种判断允许通过与已识别的个人的联系将非个人数据转换为个人数据。“结果”是推断法律地位的关键。笔者认为,数据“可能对某人的权益产生影响”就足够将其视为个人数据。在如今数据时代对数据进行保护的复杂性在于确保匿名并不容易,此外,在不同的时间点和情境下使用这样的数据,很难获得人们的同意。因此,应在适当的保障下使用某些数据。监管机构应为用户建立基本规则,以评估潜在危险并确定减轻其影响的方法。因此,必须将保护隐私的责任转移给数据使用者。

关键词:大数据立法;个人数据;数据权;信息财产

1.前言

随着大数据与人工智能的应用越来越广泛,数据的使用与监管已经成为国家立法工作的重中之重,全国人大常委会法工委在2019年12月20日也表示将于2020年制定《个人信息保护法》、《数据安全法》等数据保护法律。结合中外对个人数据的立法及研究情况,目前国内外的数据保护立法尚处在侧重于保护人们的隐私,身份,声誉和自主权的基础上,但未能保护数据主体免受推理分析的新风险。如果个人数据的广义概念可以解释为包括涉及或影响个人的推论,预测和假设。如果将其视为个人数据,则数据保护法将授予个人许多新的权利。但是,推论的法律地位在法律学术上存在很大争议,推论是否是个人数据这一问题涉及到个人对推论是否拥有权利,并且会引起对个人数据使用的合理边界的讨论。[1]本文将主要论述,基于个人数据的推论应当被视作个人数据。

2.推论的应用方式

由于传统上需要花费数年才能捕获的数据现在可以快速获得,因此探索它们的效用就变得极为重要。从历史上看,人们已经意识到人类发展对数据的需求,及数据化管理的必要性。而随着计算机数据的发展,利用数据的范围已经大大增加,并且将其成功使用带来的效益也很明显。例如,淘宝网不仅记录客户购买的商品,还记录客户浏览的其他商品。这些信息帮助淘宝网向客户建议合适的商品,结果,增强了客户体验。同样,特斯拉为电动汽车用户开发了预测模型,模型包含有关电池,汽车位置,一天中的时间和使用历史记录等数据,模型可指导用户确定最佳时间点,并结合相关信息为电池充电。

除了利用数据之外,重要的是使用创新的方法来释放其力量。为了有效地实现这一目标,已经发展出了三种类型的大数据公司,每种类型的公司都侧重于不同的专业领域。第一类是指那些拥有数据或可以随时访问的数据。第二类与利用此类数据以提供分析的公司有关。最后,第三类公司致力于为他人使用这些数据提供构想。对于数据的利用重要的是要认识到整个价值链的力量。例如,航空公司提供出售给售票软件的机票信息,后者分析了购买方式,以帮助客户计划购买时间。 售票软件与航空公司分担了佣金,导致了双赢。但是这也要求致力于使用数据的数据主体没有偏见,否则可能会造成价格歧视等不公现象并且妨碍商业机会的发现。

3.推论与个人信息的分类

这里将推论定义为与通过推论或推理而不是仅仅从数据主体进行观察或收集而创建的与已识别或可识别自然人有关的信息。此处讨论的推理类型是由数据控制器或第三方创建或使用的“高风险推理”,是侵犯隐私或损害声誉的,或者将来很有可能是这样的,或者可验证性很低。在推论的法律地位相关的个人数据“类型”之间的区别在欧盟目前已颁布的《一般数据保护条例》(GDPR)中显而易见。GDPR第4条将个人数据定义为“与已识别或可识别的自然人有关的任何信息。”GDPR第9条第1款进一步区分了正常或不敏感的个人数据,以及与“种族或族裔血统,政治见解,宗教或哲学信仰或工会会员身份有关的个人数据,以及为唯一识别自然人的目的而进行的基因数据,生物特征数据的处理,与健康有关的数据或与自然人的性生活或性取向。”[2]如果推断是个人数据,则应当区分敏感类型和非敏感类型以对敏感类型个人数据提供更高的保护标准,并对敏感的个人数据进行的处理施加以额外的限制。另外GDPR将个人数据进一步区分为提供的数据和观察到的数据,以及导出的数据和推断的数据。提供的数据包括数据主体直接提供给数据控制者的任何数据,例如用户名或电子邮件地址。观察到的数据也由数据主体“提供”,但是通过间接地或被动地方式,包括诸如位置数据,点击活动或人的行为的独特方面(例如手写,击键或特定的步行方式)之类的东西。相反,数据主体未“提供”的派生数据(例如,从消费者的邮政编码得出的居住地)和推断数据(例如,信用评分,健康评估结果,个性化或推荐过程的结果)。主动或被动地,而是由数据控制者或第三方根据数据主体提供的数据以及某些情况下的其他背景数据创建的,例如“通过观察用户的行为而产生的数据”,包括点击或浏览行为以及从中得出的推论。此外,GDPR的配置文件和自动化决策指南认为,“配置文件通过创建有关个人的派生或推断数据的工作而得出的数据主体本身未直接提供的新个人数据。”[3]显然,如果推论可被视为个人数据,则属于派生或推断的数据类型。

期刊文章分类查询,尽在期刊图书馆

4.推论应当视作个人数据

为了确定数据是否为“个人数据”,应当从三个方面出发进行判断,即数据处理的内容,目的或结果,这三个方面必须直接或间接与可识别的人有关。通过这种判断允许通过与已识别的个人的联系将非个人数据转换为个人数据。“结果”是推断法律地位的关键。笔者认为,数据“可能对某人的权益产生影响”就足够将其视为个人数据。实际上,这意味着即使数据没有直接描述可识别的人(即内容),还是没有被使用或可能被使用以某种方式评估,或影响数据主体状态或其行为目的和结果(即目的),但根据其对可识别的人的权益的潜在影响(即结果),仍可以归类为“个人数据”。但是也有很多观点认为由于技术上的支持,可能很难找到潜在地无法转化为个人数据的数据,但是此种技术上的理由并不足以推翻应当在法律上把推论视作个人数据进行保护和监管的必要性。下面笔者将从推论的主观性及不可验证性出发对推论的个人数据进行论述。

对个人信息做出的推论通常是第三方通过不仅仅是观察数据主体而创建的这些类型的主观且不可验证的“信息,意见或评估”。在此提供了此类主观或不可验证的个人数据的几个示例。关于主观性,笔者在此提供几个主观评估的例子:在银行业中,评估借款人的可靠性(“甲是可靠的借款人”);在保险(“乙预计不会很快死亡”)或就业(“丙是一名好员工,并应当得到晋升”)方面。[4]这种主观的第三方评估可以被视为一种推论,因为评估涉及推论从已经拥有的数据中获得的对象的未观察到的特征或主观意见;关于不可验证性,这里提供另一个示例,一个孩子关于其家庭的绘画作品,不仅描绘了她的家庭也可以表现出孩子其家人的心情。尽管这幅图画是由孩子创建的,但可以允许推断有关孩子父母行为的信息。结果,绘图本身以及由此推断出的有关其父母行为的任何信息都被归类为父母的个人数据。因为,此类推论并不一定是可验证的,并且由于需要进行解释才能得出有关父母行为的信息,因此其得到的信息具有浓厚的主观色彩。另外,在此理解为推论的观点和评估不需要经过客观的验证的才被视为个人数据,因为,在进行预测或推论时无法对其结论进行验证,但尽管如此,其推论仍然已经描述了一个已识别或可识别的人,并且对可识别的人的权益存在着潜在影响,因此任何对个人信息进行的主观的不可验证的推论均应当视作个人数据。

5.对推论的监管困境

近年来,为解决算法决策系统中的问责问题而进行的大量工作主要涉及算法的解释。这项工作采取了多种形式,包括要求开发者解释进行推论的技术方法和审核机制。这些多样化的工作对于提高AI问责制至关重要。然而,每个问题仍然有一个共同的盲点:需要法律或道德依据来证明对解释的要求,并确定其要求的内容。因此,有关解释方法,标准和其他学术研究的许多先前工作将在学术或发展意义上是有价值的,但实际上无法帮助算法责任制的预期受益者:受算法决策影响的人。[5]不幸的是,除非有必要,否则没有理由假设数据使用者组织会自愿提供完整的解释,这要求涵盖算法决策的过程,理由和准确性。这些系统通常非常复杂,涉及(敏感)个人数据,并使用被认为是商业秘密的方法和模型。[6]因此,提供说明会给组织带来额外的成本和风险。如果不存在用于解释算法决策的一般法律或道德依据,则请求将需要其他理由才能成功。但是,给予解释只是使算法决策负责的一种可行方法。解释可以提供有效的事后补救措施,但只有在做出决定后才能告知个人有关结果或决定以及导致该结果或决定的基本假设,预测或推论。但是,它不能确保决策,假设,预测或推论是合理的。简而言之,对决策的解释并不等于推理或决策的合理性。因此,对于推论的过程既需要事前补救也要事后补救。最重要的仍然是对个人级别的权限赋予,该权限将使数据主体能够管理如何绘制侵犯隐私的推理,并在创建或用于做出重要决策时寻求与数据主体的协商并提供对不合理推理的补救。

参考文献

[1]孟天广.政治科学视角下的大数据方法与因果推论[J].政治学研究,2018(03):29-38+126.

[2]王灏晨.《通用数据保护条例(GDPR)》的实践评价及启示[J].中国物价,2019(12):79-81.

[3]Guidelines 2/2019 on the Processing of Personal Data Under Article 6(1)(b)GDPR in the Context of the Provision of Online Services to Data Subjects (Apr.8,2019).

[4]潘文全.大数据推理的归纳逻辑基础[J].哲学分析,2016,7(06):104-112+194.

[5]Science - Scientific and Industrial Research; New Findings Reported from King Khalid University Describe Advances in Scientific and Industrial Research (Privacy Preservation In Big Data With Data Scalability and Efficiency Using Efficient and Secure Data Balanced Scheduling Algorithm)[J].Science Letter,2019.

[6]杨雄文,黄苑辉.论大数据的商业秘密保护——以新浪微博诉脉脉不正当竞争案为视角[J].重庆工商大学学报(社会科学版),2019,36(04):138-145.

作者简介:彭超(1995.08—),男,河南省信阳市人,成都市双流区四川大学经济法学专业,硕士研究生。

论文作者:彭超

论文发表刊物:《知识-力量》2019年12月60期

论文发表时间:2020/3/4

标签:;  ;  ;  ;  ;  ;  ;  ;  

基于个人数据的推论属于个人数据论文_彭超
下载Doc文档

猜你喜欢