# 数据作为产品
# 数据产品的定义
数据产品不是信息化时代才有的产物。从狩猎时代开始,就有数据加工品,如古代人绳结记事的那根绳子,既是数据的承载体,也是数据的加工品,由于受限于记录工具比较贫乏,社会产生的数据量小,数据加工品的交易也少,所以就没有数据产品的概念。
随着近年工业化和电子产品的技术变革,记录数据的工具能力持续增强,数据被加工成产品的情况经常发生,也出现了数据加工品的交易,在这个过程中出现了数据产品的概念。目前社会到了高度信息化的阶段,数据量呈现爆发式增长,它会影响到社会的方方面面,但是目前数据产品的概念比较混乱,市面上与数据有关的产品或服务普遍被笼统的归纳为数据产品。最近接触的一个项目,将生产数据存储的研发也叫做数据产品,这种模糊的概念可能不容易探寻数据价值是最大化,我觉得应该要对数据产品做一次清晰的定义。我认为,“数据产品”应该是指以“数据”为原料,对未加工的数据进行加工,或者对已加工的数据进行再加工而形成的数据加工品(在这里需要强调,数据的加工原料必须是数据)。
# 数据产品的特性
数据产品的特性和上述物联网产品、数码产品、电子信息产品有许多类似之处,虽然数据产品的原料是数据,但是兼具这些不同概念产品的特性,概括下来,数据产品应该具有下述5个基本特征:
- 非物质形态:数据是非物质,数据加工品也是非物质形态,像信息一样,它是构成现在世界的另一种成分。数据加工品的存在和流通,需要依附在物质载体上,这些载体可能具备外观、尺寸和材质等物质特征。举个例子,音频是非物质形态的数据,音乐是音频的加工品,而光盘、流媒体是它们非物质形态的载体。所以,音乐是数据产品,光盘是数据产品的媒质。
- 规模经济性:数据产品的非物质形态特性使其具有天然的可复制性,而且复制的成本极低。随着用户的规模扩大,数据产品每一单位成本会出现持续下降的情况。当数据产品的复制数量趋于无穷大时,该数据产品的边际成本会趋于零。大部分互联网产品也具有该特性。
- 内容体验性:用户只有在使用数据产品的过程中,才能获得数据产品带来的价值。如果用户没有去体验数据产品的内容,那么就很难识别或其传递的内容。
- 使用无损耗:数据产品在使用的过程中,其本身不会发生使用损耗,一个数据可视化看板,它不会因为时间过久或看的人多了而发生消耗,其本身的价值也不会因此而降低。
- 呈现多样性:同一份数据产品在产品化的过程中,因为用户群体、使用场景、加工方式的差异,数据产品的呈现是多样化的,可能是大屏幕的数据看板,也可能是纸质报告。数据产品的形态与它的载体密切相关,它既可以是无形的服务软件,也可以是软硬件的结合体。未来的数据产品,可能呈现的是各式各样的网络应用服务。
# 数据产品的价值
主体和客体相互作用所形成的设计活动是价值产生的基础。大部分产品的价值只有在被消费或被使用的过程中才能体现出来。数据价值是在自然、文化和社会的约束下,数据产品生产者和使用者相互作用产生的。
数据产品生产者的意图和数据产品使用者的期望之间是相互作用、相互影响的,既矛盾也统一,两者所产生的正负效应决定了数据产品的价值大小。孤立的数据产品生产者和使用者无法产生价值。数据价值的最大化要在“自然、文化和社会环境”、“生产者对数据产品的意图”、“使用者对数据产品的期望”,三者之间达成平衡。
# 数据产品的类别
数据产品是数据价值表达的载体。要实现数据价值的最大化,需要对数据产品进行分级,方便评估数据价值被挖掘的程度。目前研究学者对数据产品的分类各有观点,没有统一的标准。
有些人会按数据产品的形态特征来分类。例如,将描述当前行业状况和特点的相关数据应用归为一类,成为描述型数据产品,例如一些指数、Nielsen咨询报告等等;将通过算法进行预测研判的相关数据应用归为一类,成为预测型数据产品,如各类趋势分析,AlphaGo等等。
也有人会按数据产品的应用场景来分类。例如,将通过直接满足用户需求而将数据价值变现数据服务的归为一类,如搜素引擎像用户提供信息查询,查询的过程中可以将数据变现;将通过复杂的运算后发现内在规律的数据分析归为一类,如今日头条可以向用户推送符合其偏好的内容。
还有人会按数据产品的原始特征来分类。一类是数据本身就是产品,可以直接买卖,例如,某些黑产变卖用户信息,这类的数据是无需经过任何加工,即可变现的;另一类是数据经过某种方式加工后形成某种应用,可以是产品也可以是服务,相当于变卖数据加工品,例如,某些行业的数据调研报告,其将调研数据进行加工后,得出有价值的结论后,以服务的形式提供给用户。
这些分类法是通过横向比较,将多元话的数据产品进行区分或区别,但是无法解决同一份数据价值如何递进升级的问题。结合多方观点,可以从数据的加工层次、价值侧重、产品形态三个方面将数据产品分为三个等级:零级数据产品、一级数据产品、二级数据产品。在加工层次方面,从低到高的一次是:点、线、面的层次递进关系。在价值侧重方面,从低到高的依次是:还原表达问题-发现解决问题-重新定义问题的递进关系。产品形态方面,从低到高依次是:还原自然-具象实效-普世适用的递进关系。