# 数据伦理
# 基本概念
伦理是建立在是非观念上的行为准则。伦理准则通常侧重于公平、尊重、责任、诚信、质量、可靠性、透明度、信任等方面。数据伦理处理指如何以符合伦理准则的方式获取、存储、管理、使用和销毁数据。数据处理伦理问题比较复杂,不过主要集中在几个核心概念上:
- 对人的影响。由于数据代表个人的特征,可被用于各项决策,从而影响人的生活,因此必须保证其质量和可靠性。
- 数据的滥用。滥用数据会对人和组织造成负面的影响,所以需要有伦理准则对人或组织有一个基本的约束。
- 经济的价值。数据存在经济价值,需要规定数据所有权,既谁可以去使用数据及如何使用数据。
许多组织未能认识到数据管理伴随着的伦理义务并对其做出响应。他们往往采用传统的技术观念和方式,声称不会去理解这些数据,他们认为只要遵守法律相关规定,就不会有数据处理相关风险,这是一个危险的假设。虽然法律规定了一些伦理准则,但立法远跟不上数据生态变化所带来的风险。组织必须认识并响应其伦理义务,深化信息处理伦理价值观文化来保护托付给他们管理的数据。
参考生物伦理学,在信息管理中应遵循的准则有:
- 尊重他人。这个准则反映了对待人类最基本的伦理要求,即尊重个人尊严和自主权。在人们处于“弱势群体”的情况下,应格外注意保护他们的尊严和权力。个人数据不同于如石油或煤等其他原始“资产”,不论理的使用个人数据会直接影响人们之间的相互交往。
- 行善原则。这条准则包含两个要素:第一,不伤害;第二,将利益最大化,将伤害最小化。数据从业者应该识别利益相关方,并考虑数据处理工作的结果,以最大限度的提高效益并最大限度的降低设计过程造成伤害的风险。
- 公平公正。这一准则主要指待人的公平和公正。比如现在基于机器学习的推荐算法,是否会带来流量和利益分配不均的情况。
# 违背伦理进行数据处理的活动
大部分与数据打交道的人可能都知道,利用数据歪曲事实是很容易的。我们可以通过主观的数据选择、数据范围的操控、关键数据点遗漏等方法来创造一个事实虚假的表象。以下这些场景描述了违反这些伦理原则的数据实践活动:
- 通过时机选择误导用户。很多组织有可能通过遗漏或根据时间,将某些数据点包含在报告或活动中误导用户。例如,我们常常会看到金融机构发布理财产品的收益率在某一时间点发布最近7天收益率>6%,但是实际这款产品年均收益仅有3%。
- 可视化误导。有些图形和图表可用于误导的方式去呈现数据。例如修改图形或图表的比例尺,会让整体图形看起来更漂亮。
- 定义不清晰的比较误导。在展示信息时,符合伦理的做法是交代清楚事情的背景及意义,例如人口普查数据,如果省略了相关背景信息,呈现处理后数据的表面现象就是,误导人们对数据有一种错误的解读。
- 预设结论的数据采集偏差。分析师可能会处于某种目的或压力,进行数据采集是为了证明一个预先定义好的结论。
- 预感和搜索偏差。分析师或者决策者有某种预感,且想满足这种预感而进行数据采集、搜索和分析,以证明预感的结论。
- 片面的抽象方法。分析师或决策者,采用片面的数据来进行分析,通过片面的数据证明自己的观点,或产生一个有误导的结论。
# 建立数据伦理文化
建立一个符合伦理的数据处理文化需要理解现有规范,定义预期行为,并将这些编入相应制度和伦理规范中,并提供相应的培训和监管以强制推行预期行为。数据的伦理处理应该明确重视伦理行为的组织文化中不仅要有行为准则,而且要建立明确的沟通和治理控制,以支持员工提出疑问和适当的升级路径。建立数据伦理文化分为如下四步:评审现有数据处理方法,识别原则、实践和风险因素,制定合乎伦理的数据处理策略和路线图,采用对社会负责的伦理风险模型。
# 第一步:评审现有处理方法
改善的第一步就是了解组织现在所处的状态。
- 其目的是:为了理解这些方法在多大程度上直接且明确的与伦理、合规性驱动相关。
- 其应该包括:员工如何理解现有做法在建立和维护客户、合伙人和其他相关方之间的伦理影响。
- 其范围包含:评审的交付物需要记录整个数据生命周期,包括数据共享活动中的收集、使用和监督数据所依据的伦理准则。
# 第二步:识别原则、实践和风险因素
使数据处理的伦理规范化的目的在于降低数据被滥用,从而降低给客户、雇员、供应商、其他利益相关方甚至整个组织带来风险。原则应于风险和实践保持一致,通过控制来支持实践,如下是一个基本示例:
- 指导性原则:患者拥有健康隐私权,因此健康数据除非被授权,则其他人不允许访问。
- 风险:如果可以广泛的访问患者数据,那么这些数据将会变成公共资源,从而危及个人隐私。
- 实践:只有医生、护士处于护理的目的才能使用病人健康数据。
- 控制:对这些疏忽进行年度、月度审查,以确保只有需要时,需要的额才能访问患者健康数据。
# 第三步:制定合乎伦理的数据处理策略和路线图
在评审当前状态并开发了一系列原则后,组织可以通过正式制定策略来改善其数据处理方法,这些策略必须同时包含伦理准则和预期行为,以价值陈述和伦理行为准则来表达。这样的策略包含如下组成部分:
- 价值观声明:描述组织的信仰、愿景。这些声明提供了一个符合伦理规则的数据处理和决策制定框架。
- 符合伦理的数据处理原则:符合伦理的数据处理原则描述了一个组织如何处理数据所带来的挑战。例如,如何尊重个人的隐私权,原则和预期行为可以概括为行为准则,并通过伦理制度加以支持。
- 合规框架:合规框架包含驱动组织义务的因素。符合伦理的行为应使组织能够满足合规性要求。
- 风险评估:评估组织内部特殊问题出现的可能性及影响。这些应用于确定于缓解措施有关的优先行为。
- 交流和培训:需要不间断的培训,以确保员工熟悉响应准则并了解违背伦理的数据处理所造成的影响。
- 路线图:路线图应包含可由管理层批准的活动时间表。活动包括执行培训和沟通计划、差距分析、风险缓解和监控计划,在报表中要体现出目标定位、参与人、角色、职责等关键信息。
- 审计和监测方法:以审计的形式,检测具体活动,以确保这些活动符合伦理规则。
# 第四步:采用对社会负责的伦理风险模型
使用个人信息资料的项目应该有一套严格的资料使用规则。需要说明:
- 如何选择自己的群体进行研究(箭头1)。
- 如何获取数据(箭头2)。
- 活动分析的重点是什么(箭头3)。
- 如何使结果更易于理解(箭头4)。
风险模型可以被用于决定项目是否被执行,也会影响着项目怎样实施。