此图像的alt属性为空;文件名为image.png

作者:Larry Wang

最近对个人隐私数据保护及相关各国合规法规比较感兴趣,在某东上搜了下相关书籍,发现讲的比较深入的书籍不多,一共买了四本目录内容看起来还不错的,第一本就是《数据治理与数据安全》这本书,这本书是2020年3月人民邮电出版社出版的图书,作者是张莉。该书以“数据治理与数据安全”为主题展开论述。首先对数据治理的对象、主题、框架和方式等进行分析,使读者认识到数字经济时代数据流动的重要性和巨大意义。
然后,从国内、国际两个方面进行阐述,力图为政府和企业开展个人信息保护、推进数据开放共享及跨境流动战略出谋划策。最后,基于我国的实际情况,借鉴国际经验,针对数据开放共享中存在的问题提出了具体落地的数据治理策略。

此图像的alt属性为空;文件名为image.png

第一章:

数据具有两个特征,差异性规律性。因为差异性才有必要对数据进行研究和分析;因为存在规律性,对其研究才有价值。

数据和大数据是有区别的。Gartner对大数据的定义是:大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量高增长率多样化信息资产

大数据具有四大特征4个V:

  1. 海量规模(Volume),
  2. 快速流动(Velocity),大数据的处理需要符合‘秒级定律’,一般要在一秒内给出对数据的处理结果。
  3. 类型多样(Variety),
  4. 价值巨大(Value)。

数据发展的三个阶段:

数据资源->数据资产->数据资本

数据治理是政府、企业、个人、非政府组织等主体为了管理共同事务,以正式制度、规则和非正式安排的方式相互协调并持续互动的一个过程。

治理具有四个特征:

  1. 治理不是一套规则条例,也不是一种活动,而是一个过程
  2. 治理的建立不以支配为基础,而以调和为基础
  3. 治理同时涉及公共和私营部门
  4. 治理并不意味着一种正式制度,而有赖于持续的相互作用

数据分析时指用适当的统计方法对数据进行分析,把它们加以汇总和理解并消化,以求最大化地开发数据功能。而机器学习是数据分析的工具,主要分为监督学习、无监督学习、强化学习。

监督学习分为回归和分类两种类型,包括线性回归、Logistic回归,CART,朴素贝叶斯、KNN等几种算法,回归是精确值预测,例如跟据历史价格和销售,预测新价格下的销售。

无监督学习主要有关联、群集、维度降低三种类型。跟据特征进行分类和预测。

强化学习是让机器不断测试,在环境里取得高分。譬如Alpha Go

数据之间的关系有因果关系和相关关系。

数据的价值在于流动,阻碍数据流动的最主要因素有两个,一个是数据权(国内叫数据产权,国外叫数据主权),第二个是数据安全问题

第二章数据开放和共享

数据开放主要是指政府数据面向公众开放。主要适用于非敏感、不涉及个人隐私的数据,并且需要保证数据经过二次加工或者聚合分析后仍不会产生敏感数据。

数据交换主要是政府部门之间、政府与企业之间通过签署协议或合作等方式开展的非营利性数据开放共享。目的是打通政府各部门之间的数据壁垒,让数据流动而不是人们跑动。

数据交易主要是对数据标价进行买卖。如2015年成立的北京大数据交易服务平台

第三章数字产权

数据产权的三大争议:所有权、使用权、收益权

国内立法还不健全,很多有争议的地方和空白。

第四章数据滥用和安全事故

认同是指个体对比自己成就高的人的肯定,以消除个人现实生活中因无法获得成功或满足时产生的挫折和焦虑。

偏见时对某一个人或团体所持有的一种不公平、不合理的消极否定的态度,时人们脱离客观事实而建立起来的对人和事务的消极认识。

从众时指个人的观念和行为由于群体的引导和压力,不知不觉或不由自主地与多数人保持一致的社会心理现象。参考勒庞的《乌合之众》

算法有一个局限性:就是只是让人们看到认同的内容

算法歧视:算法的输出可能具有不公平性,甚至歧视性。譬如微博抽奖里将很多用户标记为“机器人”,排除在抽奖之外。

Garbage In, Garbage Out(GIGO); Bias In, Bias Out(BIBO).

大数据时代,价格操纵越来越成熟,因为1)个人数据收集渠道越发广泛而且用户画像技术越来越进步,企业容易判断用户的支付能力、偏好等 2)互联网行业数据垄断和资本垄断现象不断加重,行业马太效应明显,垄断者具备价格操纵的能力3)互联网注重粘性,锁定客户,削弱了用户更换消费平台的意愿。

大数据杀熟至少违法了三部法律的条款,《价格法》第14条和41条,《消费者权益保护法》第29条,《反垄断法》第17和47条

用户画像:腾讯透露每个用户人均可打2000个标签,通过标签来识别用户特征

用户标识有很多种:如浏览器的cookie,注册ID,Email,帐号,移动设备表示,MAC地址,手机号,身份证等

2016年泄漏的个人信息维60.5一条,平均每人有4条信息被泄露。

根据调查80%的数据泄露时企业内部人员所为,黑客仅占20%。

托库:是指黑客入侵有价值的网站和信息系统,以TXT/XLS等格式从数据库中导出数据的行为。但这些信息可能加密难以直接使用,就需要使用‘撞库’的方法对数据进行清洗。

‘撞库’时指黑客通过收集整理互联网上已泄露的用户名密码等信息对应的字典标准,尝试对其他网站进行批量登录,以得到可登录的有效用户名和密码等过程。

第五章数据跨境流动

数据主权(Data Sovereignty):对数据主权的界定主要从三个角度入手:

  1. 跟据国家主权的相关概念,对数据主权做出界定。
  2. 从数据主权内容入手,对数据主权做出界定。
  3. 从数据主权的权责内涵分析做出界定。

截至目前,没有一个统一的国际协议来规定云服务中的数据主权问题,各国依据的还是本国指定的各类数据保护法。

按照各国不同法案,同一数据的管辖权和归属权不同,导致各国司法管辖产生争议。2013年美国政府要求微软提供用户资料,但是保存这些数据的服务器在爱尔兰的都柏林,按照美国的《云法案》美国政府对服务商的数据有无限管辖权,但是这却和GDPR产生冲突。

之前美国一直推动数据自由跨境流动,奥巴马的“跨太平洋伙伴关系协定”TPP,其核心原则时支持数据跨境自由流动,反对他国设限,反对他国的数据本地存储要求。

欧盟以充分性保护水平作为数据跨境流动的基本要求。

俄罗斯则主要倾向于推动数据本地化存储,限制数据跨境流动。

三个级别:

  • 完全禁止本国数据出境
  • 禁止本国特定数据出境
  • 有条件出境

中国数据跨境要求:2017年的《网络安全法》规定,关键信息基础设施的运营者在中国境内运营收集到的个人信息和重要数据应当在境内存储。因业务需要,确需向境外提供的,应当按照国家网信部门会同国务院有关部门指定的办法进行安全评估;法律、行政法另有规定的,依照其规定。除此之外,我国现行的数据本地化存储的规定主要分布在金融、卫生、医疗及交通领域。

第六章数据开放与保护:全球在行动

数据经济时代,各国政府认识到开放政府数据的重要性,随之而来的是个人隐私保护问题也日益凸显。世界基本形成两种立法模式,以隐私权为基础的美国模式和以人格权为基础的欧盟模式。美国模式的特点为分散立法、分业监管、偏重对信息使用的规制,注重产业利益等。欧盟模式的特点为统一立法,全面加强个人对信息的控制权,严格处罚机制等。

联合国2009年启动了全球脉动‘Global Pulse’项目,目的在于推动大数据对全球可持续发展和人道主义发挥作用。各国的政府公开数据在data.gov网站上。

美国联邦层面,拥有近40部关于个人信息保护的法律。1973年美国卫生教育福利部的《录音、计算机与公民权利》报告提出了“公平信息实践法则”,确定了美国个人信息保护的基本原则。1974年《隐私法案》时美国个人信息保护的综合性法律,明确规范了联邦政府机构处理个人信息行为。同时美国跟据不同领域特点,制定了各领域的个人信息保护规范如:

1984年《有线通信政策法》:禁止闭路电视经营者未获得用户同意时利用有线系统收集用户个人隐私

1984年《电视隐私保护法》:归档录像带销售或租赁公司消费者的隐私权里

1986年《电子通信隐私法》:不仅禁止政府部门未经授权的窃听,而且禁止所有个人和企业对通信内容的窃听

1996年《监控保险携带和责任法》:规定个人健康信息保护规则,如只能被特定的,法案中明确的主体使用

1996年《电信法》:规定电信营业者要保守客户的财产信息秘密

1998年《儿童网上隐私权保护法案》:规范网站等运营者对13岁以下儿童个人信息的收集和处理行为

1999年《金融服务现代化法案》:规定金融机构处理个人私密信息的方式

2018年《加州消费者隐私法》:赋予消费者更完整的个人信息控制权

美国个人信息保护的特点:

  1. 采取分散的立法保护模式,美国没有一个集中的法律,它强调个信息保护的灵活性策略。
  2. 跟据个人信息的具体内容进行分业监管,包括针对政府、金融、教育、税务、通信等各个部门
  3. 专门保护特殊数据主体,譬如对儿童的保护
  4. 坚持以隐私权为中心的保护理念
  5. 偏重对信息使用的规制

欧盟的GDPR有以下特点:

  1. 同意立法模式
  2. 人格权保护模式
  3. 采用公法路径
  4. 采取‘域外适用’的情形
  5. 采用‘原则指引’+‘高额罚款’的策略
  6. 赋予公民广泛的个人信息权利,以实现数据全生命周期的可控
  7. 由隐私保护升级到个人数据保护
  8. 设定‘遗忘权’
  9. 设立完善的数据保护监管机制
  10. 建立完善的救济机制

美国数据跨境流动:

美国推行宽松的数据跨境流动政策,在确保国家安全利益的前提下最大程度的促进数据自由流动。通过TPP环太平洋协议在全球宣扬数据自由流动理念。

欧盟需求个人数据保护与数据自由流动的平衡。三个场景:

  1. 白名单
  2. 采用欧盟委员会通过的标准数据保护条款或经监督机构认可的合同条款
  3. 指定具有约束力的企业规章制度(通过欧盟数据保护监管机构的审核)

第七章数据治理策略基于四个维度

本章讲的比较泛泛,没有太多有价值的内容

By larryonaws

10多年大型企业软件研发管理经验,曾就职于爱立信、汤森路透、甲骨文、亚马逊AWS等公司。丰富的企业软件项目管理、架构设计、开发测试、交付运维、客户成功、大客户销售等职业经历。 有多年管理PeopleSoft/Fusion SaaS ERP套件研发工作的经历,对大型ERP软件有深刻的理解和丰富的经验。 AWS解决方案专业架构师,致力于推动AWS创新技术赋能企业软件的云转型。

发表评论

邮箱地址不会被公开。 必填项已用*标注