作者: Irina Bolychevsky、Simon Worthington

翻译: 陈俊

日前,ArcBlock 区块基石加入了非营利机构 MyData Global,与全球 100 多位会员伙伴一起努力通过提升个人数据的自决权来赋权个人。通过个人数据存储(PDS)、用户自主身份(DID)和去中心化应用开发平台(ABT 节点)三项技术的探索研发,ArcBlock 努力为建设去中心化的万维网奠定基石。

PDS 目前在国内交流探讨不多,ArcBlock 翻译发布此文,为更多开发者及用户关注这一新兴技术添砖加瓦。

cover 本文评估的个人数据存储提供商

我们已经听闻大规模个人数据挖掘的严重后果。公司继续其围绕跟踪用户和出售数据的业务模型。数据泄露和对所有这些信息的不合理使用明显侵犯了个人隐私,但是除了成为一名永不上网的隐士之外,还有什么选择?

一种经常谈论的方法是个人数据存储(PDS)模型。本文探讨了一些领先的解决方案并评估了其前景。

我们的假设

当我们开始研究时,有许多担忧和假设我们需要检验。我们担心的是 PDS:

  • 没有市场,采用率很低。
  • 工作负担太辛苦了(无论是对于非技术用户还是在时间和精力上要成为自己的数据代理人)。
  • 除了隐私 保护之外,没有为用户提供超过现有模型的任何优势。
  • 不能与人际网络所在的现有社交平台集成。
  • 模型并不现实,而且未来不能对主要的隐私和数据控制进行更改。

我们的发现

个人数据存储市场还不成熟,而各种称自己为“个人数据存储”、“个人数据市场”以及与此主题相关的其他变体的产品和框架却四处泛滥。它们的功能千差万别,但是有一个概念将它们链接在一起——它们提供了存储用户的个人数据并允许用户对其他机构提供受控访问的功能。

这不同于“个人云”,后者专注于存储数据供用户单独使用。本文不会讨论个人云,因为它们不能解决机构收集有关你的数据供他们自己使用的问题。目前个人云的市场已经很成熟,例如 Cozy, Freedom Box, NextCloudMy Cloud

个人数据存储如何工作?

PDS 承诺将控制权交还给用户,让他们能够“拥有”自己的数据并通过细化权限控制访问权限,而不是将我们的数据归为分裂割据、各自为战的互联网平台所拥有垄断。所谓“所有权”的确切概念各不相同,并非所有提供者都提供清晰的法律框架。除了存储自我声明的数据外,有些还从现有公司(类似于“个人云”模型)中复制数据。其基本思想是,你输入有关你的数据和身份证明(使用护照和银行对帐单),你可以让他人访问或间接使用这些证据来为你提供服务。

PDS 市场有两个重要方面:作为数据主体的用户,以及想要使用数据(并且目前正在收集和控制它)的机构。为了理解这一点,我们研究了每个 PDS 提供商声称要解决的问题,它们对用户和公司的卖点,以及在业务模型和采用数据方面可以找到的所有内容。

盘点 PDS 供应商

1. SoLID

SoLiD 是一套建议的协议和工具,用于基于 Linked Data (链接数据)原理构建去中心化 Web 应用。

他们要解决的问题: 帐户数量激增、数据锁定、应用之间没有互操作性。

向个人提供: “真正的数据所有权”——选择存储数据的位置以及谁可以访问它。通过能够更改提供者并保留对数据的访问来避免锁定。

向机构提供: 作为应用开发者,你可以从用户已经创建/存储的现有数据中受益——从而拥有一个可寻址的市场,而无需首先建立网络。

商业模式: Tim Berners-Lee 2018 年宣布了一项商业投资来支持 Solid。 商业模式和定价尚未公布。Code for Solid 是开源的,并且已经开发了 3 年多。

2. MyDex

MyDex 是“一个高度安全的存储区域和服务,因此你可以从生活的各个方面以自己的方式管理你的个人数据。”

他们要解决的问题: 没有明确表述。

向个人提供: 存储属性,而不是随机数据。个人数据被“安全”保存,保持私有状态,用户可以使用他们的数据来获得有用的洞察。个人可以在有限的时间和目的情况下为他人提供数据或“证明”。个人数据随时可以提供给用户。

向机构提供: 机构可以访问有关如何收集数据的信息。他们可以信任数据,因为 MyDex 会验证其来源。机构可以交换已验证数据来增加客户的便利性。

商业模式: 个人免费。对于机构而言,安装费用为 1 万英镑,每个连接的个人费用为 15 便士,第一年之后增加 25%,另加个人为访问所支付的费用的 4%。

3. Digi.me

Digi.me “让你导入和使用你散布在各个应用和网站中的数据”,并且“控制为你的数字生活提供动力的数据”。

他们要解决的问题: “我们不是竞争收集数据的能力,而是让第三方能够以透明和互惠互利的方式使用他们的数据,从而为他人带来价值的竞争”

向个人提供: Digi.me 不会访问或保存个人数据,而是帮助他们跨许多帐户(包括社交媒体、医疗健康、金融财务等)复制数据。导入后,他们可以搜索和浏览该数据,并允许集成 Digi.me 的应用访问。

向机构提供: 创建数据驱动的应用,可以访问用户直接提供的数千个准确且标准化的数据字段。符合 GDPR 允诺要求以进行数据处理。通过采用新的以用户为中心的数据共享和隐私规则来差异化显示你的可信赖性。在设备上或会话期间安全地访问和处理数据,以避免风险和存储原始敏感数据的成本。

商业模式: “对于募集资金少于 1000 万美元或收入少于 100 万美元的初创企业,可以免费使用 Get Data 服务。 数据传输费用:每笔数据传输,最少 0.1 美元,最高每笔每用户每应用每年 3 美元,以较低者为准;或你为应用或与应用相关的服务收取的费用中的 7.5%收益分成。每月有超过 25 万名用户有资格享受折扣。”

4. Hub of all Things

“借助 Hub of All Things,一个人可以合法拥有其个人数据的权利,并受益于从他们的所有个人信息中提取的许多应用和个人 AI 工具,无论这些信息在何处创建。”

他们要解决的问题: 机构拥有所有控制权。用户协议太难理解。人们无法拥有自己的数据,因为他们没有自己的数据库。

向个人提供: HAT 让个人可以从其数据中获得价值(可能是作为一个集体)。效率:一次收集数据,随处使用。不再需要时可以撤消访问权限。

向机构提供: 避免保护/共享个人数据的风险。通过使用身份验证和帐户创建来减少开发时间。通过使用 HAT API 而不是数据库来减少开发时间。获得进入 HAT 生态系统的用户的访问权限。 利用用户对 HAT 生态系统的信任。

商业模式: 个人每月 4.99 英镑或以后每年 50 英镑。

5. OpenPDS

Open PDS with SafeAnswers 是一个允许用户收集、存储和细粒度访问其数据,同时保护其隐私的框架。

他们要解决的问题: 个人希望管理和理解他们的个人数据但做不到,因为他们无权访问。技术上的互操作性还不够,因为有太多不同的数据源。并非所有想要访问数据的人都具有利他动机,因此需要确保个人免受伤害。“汇总和匿名位置数据可以极大地改善社会。” 粗略或模糊的数据集几乎没有匿名性/在保留价值的同时对数据进行匿名化非常困难。

向个人提供: 主体需要获得数据所有权的新权利。个人可以控制数据,通过该数据 PDS 给出的答案以及向谁提供。

向机构提供: 没有为数据消费者/机构提供方案。

商业模式:GitHub 仓库很久未更新。没有产品可以注册使用,但是以前有人显然已经考虑了它的想法。

6. Meeco

Meeco “是为了让人们能够拥有自己的个人数据并直接从中受益而创建。报酬不只是金钱。这对你很重要。Meeco 致力于帮助你获得洞察力,并为你和你的家人提供可协商的更好结果的数据。”

他们要解决的问题: 个人数据可能带来的潜在利益/利润仅适用于企业,而不适用于数据主体。 我们真实的喜好和偏好勾勒不完整,会导致定制不当或不相关的内容/广告。

向个人提供: “安全管理你的所有个人数据并按照你的条款进行交换”。你的个人数据很有价值——一种“货币”。 数据准确无误,对他人而言最有价值。Meerco 不会出售你的数据,但会帮助你出售数据/从中获取价值。 “到目前为止,企业、政府和社交网络都拥有捕获、分析个人数据并从中获利的能力。 如果你和我拥有相同的权力怎么办?”

向机构提供: 消费者对机构保护其数据的信任度很低,Meeco 能够恢复这种信任。监管让数据收集变得更加困难,而 Meeco 使其变得更加容易。Live API 支持“直接与客户一起双向访问数据和经过验证的属性”。

商业模式: 对消费者免费,对企业可付费使用 API /实验室。

分析

共同的思路是,PDS 将确保你的个人数据:

  • 在公司进行转型、被收购、破产或决定删除或暂停你的帐户(因为你维护该帐户)时不会丢失。
  • 由于你拥有数据并可以撤消访问权限,因此不会受到滥用、剥削或数据泄露的威胁。
  • 可以从一个中心位置保持准确且更轻松地更新。

最终还可能带来好处,因为你可以查看哪些数据被访问(尤其是与银行、政府、保险、广告等相关的数据),因此对自己如何做出决定更加透明。

顾虑

其中一些项目自发布以来已经有很多年了,尽管人们对在线隐私保护问题越来越感兴趣,但没有任何个人数据存储产品服务能够在大众市场上获得广泛的接受。总的来说,我们发现了采用率数字很小。那么,什么不起作用?

我们的假设有两个方面:首先,新技术是由它们如何为用户提供新功能来驱动的,但是 PDS 似乎并没有提供实质性的新功能。它们可以提供额外的隐私保护,但是以让现有工作流程更困难为代价。对于大众市场用户选择产品和服务时,没有足够的证据表明隐私保护比其他功能重要。

同时,还不清楚这一隐私保护功能如何执行。如果将用户的数据副本识别为权威来源,则数据所有权才有意义,并且他们可以控制如何使用数据的每个副本。在当今已经有无数公司拥有关于我们的数据的世界中,这将意味着转向新服务并说服现有公司改变战略。

其次,市场正在满足机构的需求——很少有 PDS 为公司和机构集成和使用 PDS 提供了令人信服的理由。到目前为止,成为 PDS 生态系统一部分的机构所获得的关键价值是对信任系统的用户的访问权限,但是如果用户使用量很少,则机构几乎没有参与的动力。

我们看到的经典的采用问题是:用户不会采用,因为他们无法做任何有用的事情,而机构不会采用,因为没有用户,他们也无利可图。

什么有可能推动 PDS 普及?

最近有许多发展可以推动 PDS 的采用。

GDPR 之类的法规提供了潜在的诱因,因为它给处理(收集、存储、使用)个人数据的公司带来了沉重负担和限制,而使用 PDS 来处理个人数据可以减少负担、绕开限制。

随着越来越多的交易和传统服务变得数字化,需要以一种标准且毫不费力的方式来验证用户的身份和属性,例如地址、年龄和偿付能力,将推动身份服务的采用。这是许多 PDS 服务可以增加的功能。 KYC/AML(身份认证/反洗钱)和越来越多的标准需要满足法律要求,因此身份验证很可能会商品化,公司将寻求集成外部解决方案而不是自己开发解决方案。

问题与建议

PDS 需要关注个人和公司这两种类型用户的需求。这个市场的两方面都必须有令人信服的产品和服务提供。

我们没有测试设置上述 PDS 并将其用于实际服务或针对个人用户的难易程度。下一步将是对个人和公司进行用户研究。这应该探索上手如何工作,以及个人和公司在使用 PDS 时存在哪些痛点和机会。

一些需要考虑的问题:我们如何才能真正利用 PDS 提供的潜在隐私利益和数据所有权?过去,立法者一直是公民隐私的推动者——我们今天可以制定什么样的政策?现有哪些法规和政策可以用来推动 PDS 普及?最后,PDS 可以满足哪些实际需求?

原文: Are Personal Data Stores about to become the NEXT BIG THING?