邹传伟
上海万向区块链股份公司,上海 200085
摘要:数据要素市场的组织形式和估值框架是当前政府管理和行业发展需要回答的两个重要问题。针对这两个问题,提出不是只有所有权清晰的数据要素才能参与市场配置,数据要素事实上的控制权更为重要;然后分析了数据要素市场与金融系统之间存在的同构关系,并从金融系统的组织形式推测数据要素市场的组织形式;最后提出数据要素估值框架DataRank,以有效反映数据要素价值的主观性、时变性和外部性等特点。
关键词: 数据要素 ; 产权界定 ; 有效配置 ; 组织形式 ; 数据估值
论文引用格式:
邹传伟. 数据要素市场的组织形式和估值框架[J]. 大数据, 2021, 7(4): 28-36.
ZOU C W. Organizational forms and valuation framework of data factor market[J]. Big Data Research, 2021, 7(4): 28-36.
2020年4月,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,提出加快培育数据要素市场。2021年3月,北京国际大数据交易所成立。《个人信息保护法(草案)》和《数据安全法》分别于2020年10月和2021年6月公布。数据要素的有效配置是数字经济发展的关键,也是理解个人隐私保护、互联网平台竞争、大型科技企业监管和金融科技发展的关键,对于AI发展也至关重要。数据要素市场应采取什么样的组织形式?数据要素适用什么样的估值框架?这是当前政府管理和行业发展中迫切需要回答的两个重要问题。
April 2020, the State Department published an opinion on the construction of a better marketed institutional mechanism for elementalization of elements, suggesting key elements for accelerating the nurturing of the data market. In March 2021, the Beijing International Data Exchange was established. The Personal Information Protection (Draft) and the Data Security Act were published in October 2020 and June 2021 respectively.
在数据要素市场的组织形式方面,戴炳荣等人提出了数据资产的标准化思路以及数据资产管理的通用过程框架;叶雅珍等人研究了数据资产的特点和需具备的条件,提出了数据资产化基本框架,包括数据资源确权、数据价值确认与质量管控、数据装盒入库、货币计价与评估、数据资产折旧和增值的管理5个步骤;英国开放数据研究所(Open Data Institute,ODI)提出了数据信托的概念;汪靖伟等人提出了基于区块链的数据市场框架,基于该框架实现了一个数据市场测试系统,并证实了该框架的可行性和安全性。在数据要素的估值框架方面,上海德勤资产评估有限公司和阿里研究院,以及Bennett Institute for Public Policy]分别综述了数据要素估值的主要方法,包括成本法、收入法、市场法和问卷测试法等,但他们认为这些方法都有缺陷;董祥千等人提出了基于利润最大化的数据资产价值评估模型,为参与者进入市场提供了理论参考依据。在数据要素市场的发展政策方面,于施洋等人分析了我国深化数据要素市场化配置面临的挑战;国家工业信息安全发展研究中心提出了数据要素及数据要素市场的边界,梳理了国内外数据要素市场的发展现状。
产权是一个基本的经济学概念。产权指一种可执行的社会架构,该架构决定经济资源如何被使用或拥有,包括:第一,使用经济资源的权利;第二,从经济资源中获得收益的权利;第三,将经济资源转移给他人、改变经济资源、放弃经济资源,以及损毁经济资源的权利。产权可以细分为所有权、占有权、支配权、使用权、收益权和处置权等“权利束”。Mas-Colell A等人指出,产权界定是任何要素有效配置的前提。
property rights are a basic concept of economics. Property rights refer to an enforceable social structure that determines how economic resources are used or owned, including: first, the right to use economic resources; second, the right to derive benefits from economic resources; third, the right to transfer economic resources to others, to change economic resources, to abandon them, and to destroy economic resources.
然而,因为数据要素的特殊属性,数据要素产权界定的难度大于其他生产要素。Mas-Colell A等人从两个维度对不同产品提出了分类标准。第一个维度是非竞争性,指在一个人消费某种产品时,不会减少其他人对该产品的消费。第二个维度是非排他性,指在一个人付费消费某种产品时,不能排除其他没有付费的人消费这一产品,或者排除成本很高。按照这个分类,很多数据具有非竞争性和非排他性,属于公共产品,可以由任何人为任何目的而自由使用、改造和分享。一些数据具有非竞争性和排他性,属于准公共产品,比如收费媒体信息终端。只有很少的数据像一般产品那样具有竞争性和排他性。
在实践中,产权界定是法律和技术共同作用下的产物,一般先由法律确定产权的制度框架,再由技术来保证这些制度框架的可执行性。例如,股东权益由公司法保障,在执行中则离不开股权登记、托管、交易、结算和信息披露等方面的技术。数据要素也是如此。欧盟的《通用数据保护条例》(general data protection regulation,GDPR)引入了个人数据产权的精细维度,包括访问权利、修改权利、删除或被遗忘权利、可携带权利、有限授权和最小化采集原则、个人数据跨境传输条件以及数据控制者的告知义务等。我国的《数据安全法》和《个人信息保护法(草案)》的发布也出于类似目的。密码学技术是数据安全的重要保障,基于可验证计算、同态加密和安全多方计算等使数据“可用不可见”。
不同产权特征的数据要素适用不同的配置机制。例如,作为公共产品的数据一般由政府部门提供。再如,在互联网平台经济中,如果数据来自互联网平台对用户特征和行为的观察和记录,那么其所有权就很难界定。用户实际上用自己的注意力和个人数据来换取互联网平台提供的资讯和社交服务(很多时候看似免费提供,实际上却不是)。这一模式在全球正面临越来越大的争议。2020年12月,欧盟委员会发布《数字市场法案》草案,要求数字经济“守门人”不得基于“核心平台服务”整合个人数据。又如,在专利保护制度下,专利所有权是清晰的,既可以对外授权使用,也可以交易转让。
针对数据要素配置机制,需要避免两个认识误区。第一个认识误区为,数据要素的市场化配置等同于数据要素像股票那样进行市场交易。后文将指出,数据要素有多种市场化配置机制,市场交易只是其中的一种,而且很多数据要素不适合进行市场交易。第二个认识误区为,只有所有权清晰的数据要素才能参与市场配置。前文已指出,很多数据要素(特别是个人数据)难以清晰地界定所有权。根据产权的定义,数据要素的产权最终体现为对数据要素的有效控制,也就是控制谁(who)能在何种条件下(what)以何种方式(how)使用数据要素,这也是数据要素有效配置的前提。
下面先讨论数据要素市场与金融系统之间的同构关系,再根据金融系统的组织形式推测数据要素市场的组织形式。
.
金融系统的基本功能是融通资金。在任何社会和任何时间点,都存在两类经济主体。第一类经济主体由于支出少于收入而积累了盈余资金,被称为资金提供者。第二类经济主体由于支出超过收入而面临资金短缺,被称为资金需求者。资金需求者往往拥有生产性投资机会,但缺乏实施投资计划所需的资金。金融系统将资金从资金提供者引导到资金需求者,帮助后者实施投资计划,有助于合理配置资本,提高经济社会效率。金融系统也会帮助消费者合理安排购买时机,改善消费者的生活福利。金融系统有两种融资模式。第一种是直接融资模式,体现为以股票和债券市场为代表的金融市场。通过金融市场,资金提供者自己决定将资金配置给哪些资金需求者,资金提供者直接享有收益并承担风险。第二种是间接融资模式,体现为以商业银行为代表的金融机构。金融机构从资金提供者处归集资金后,决定将资金配置给哪些资金需求者,再将相关收益和风险返还给资金提供者。
the basic function of the financial system is to absorb capital. At any society and at any point in time, there are two types of economic agents. The first group of economic agents accumulate surplus funds because they spend less than income and are referred to as financial providers.
与金融系统类似,数据要素市场也存在两类经济主体,一类是数据提供者,另一类是数据需求者。数据要素市场的基本功能是促进数据要素从数据提供者流向数据需求者,以实现数据要素的有效配置。资金具有竞争性和排他性,能清晰界定产权,金融交易往往伴随着资金所有权的变更,在产权特征上与数据要素有很大差异。尽管如此,数据要素与资金在若干关键特征上相似:第一,都可以在流通和使用中产生价值;第二,都可以积累,在物理上不会消减或腐化;第三,大部分数据要素和大部分资金以数字形态存在。
数据提供者存在3种可能的类别。第一,数据主体(data subject),指数据描述的对象。数据主体可以是个人,这就涉及隐私保护问题。隐私保护问题不是排斥共享个人信息,而是要有效控制共享过程,在保护和共享个人数据之间做好平衡。数据主体也可以是非人格化的,比如来自工业领域、物联网设备、市政网络和交通网络等的数据。第二,数据所有者(data owner),这主要针对所有权清晰的数据。第三,数据控制者(data controller),数据控制者决定谁能使用数据,在什么条件下使用,以及如何使用等。一般而言,数据要素市场上的数据提供者主要是数据控制者,数据所有者可以被视为一类特殊的数据控制者。但对于个人数据,还要考虑数据主体的制约。在这些制约下,数据需求者对数据的使用往往要遵循附加条件,数据提供者也不一定要向数据需求者让渡自己对数据的控制权。例如,数据可以一直由数据提供者保存在本地,数据需求者给出数据分析工具,数据提供者按要求运行分析工具后,再把结果返还给数据需求者。
基于以上讨论,数据要素市场与金融系统之间的同构关系见表1。因此,将金融系统的融资模式“迁移”到数据要素市场,有助于理解数据要素市场的组织形式。
前文已指出,只有小部分所有权清晰的数据要素才适合进行市场交易,大部分数据要素需要经过中介机构的聚合、加工和集中管理后,才能更好地从最终的提供者流向最终的需求者。因此,数据要素市场在整体架构上将是分布式的,本质上是一个分散的、非标准化的并能适应多样化需求的场外市场,只有小部分标准化程度高的数据要素才适合进行集中化交易。这个分布式市场会将中介机构作为核心节点,如数据银行和数据信托。但是不管数据要素市场演化出何种组织形式,都可以借鉴金融系统的融资模式来理解。
3.2.1 数据交易市场
数据交易市场类似金融领域的直接融资模式。数据需求者直接从数据提供者处获得数据,两者之间具有直接经济关系。数据提供者有较强的自主性,可自行决定把数据提供给哪些数据需求者。
与金融市场存在集中化市场和场外市场一样,数据交易市场也有集中化市场和场外市场之分,前者适用于标准化程度较高的数据交易,后者适用于个性化、点对点的数据交易。由于数据类型和特征的多样性,以及数据价值缺乏客观的计量标准,目前并不存在一个集中化、流动性好的数据交易市场。另类数据市场(alternative data market)可被视为场外的数据交易市场。在这个市场中存在大量的另类数据提供商,已发展出咨询中介、数据聚合商和技术支持中介等作为连接数据需求者(主要是投资基金)和数据提供者之间的桥梁。
3.2.2 数据银行
在开放银行生态中,银行持有客户数据,并在客户授权下通过应用程序接口(application programming interface, API)对外共享;不同银行的客户数据不同,但同一客户的数据可以通过API汇总。因为不同银行介入个人数据市场的程度和管理能力不同,个人数据在银行之间通过API流动,在市场机制的作用下最终流向能最大化数据价值并保证数据安全的银行。这些银行将在开放银行生态中居于枢纽地位——从其他银行、金融机构和互联网平台等处汇集个人数据,并对外提供数据产品。这就是数据银行的概念。
数据银行有助于解决数据要素供需匹配中的两大问题。第一,数据银行被作为分散的数据提供者和数据产品的最终消费者之间的桥梁。数据银行可聚合从各个渠道得到的原始数据,处理和分析后以数据产品的形式提供给数据需求者。第二,数据银行代表数据提供者与数据需求者进行交易,能发挥专业优势,实现规模效应。数据银行可获取数据经营收益,但也要承担相关风险。
3.2.3 数据信托
数据信托是一个在欧盟和英国很受重视的概念。英国开放数据研究所提出数据保管人(data steward)的概念。数据保管人决定谁在何种条件下可以使用数据,以及谁能从对数据的使用中获益。一般情况下,收集并持有数据的机构承担数据保管人角色。在数据信托下,收集并持有数据的机构(即委托人)允许一个独立机构(即受托人)来决定如何为一个事先确定的目标(这里包含受益人的利益)而使用和分享数据。因此,数据信托扮演数据保管人角色。数据信托中的受托人一方面有权决定如何使用和分享数据,以释放数据中蕴含的价值,另一方面要确保其决定符合数据信托的设立目标以及受益人的利益。
ODI认为,数据信托具有以下好处。第一,作为一个独立机构,数据信托的受托人能平衡不同委托人在谁能使用数据以及如何使用数据等方面相互冲突的观点和经济激励;第二,数据信托可以帮助多个委托人更好地开放、共享和使用数据;第三,数据信托有助于降低数据保管和分享等方面的成本以及对专业技能的要求;第四,数据信托为初创公司和其他商业机构使用数据并开展创新工作提供了新机会;第五,数据信托能“民主化”数据使用和分享方面的决策权,使人们对自身数据有更大话语权;第六,数据信托有助于数据收益的分配更广泛、更平等且符合伦理道德。
数据要素价值在微观层面体现为,满足好奇心,提高认知能力和决策水平,最终体现为福利提升;在宏观层面体现为,提高全要素生产率,发挥乘数效应。但数据要素价值的以下特征使数据要素估值面临很大挑战。第一,主观性。同样的数据对于不同人的价值大相径庭,主要原因包括分析方法不同、面对的场景和问题不同,以及所处的政策和制度框架不同。第二,时变性。一些数据具有时效性,数据折旧是一个普遍现象,即数据会随时间流逝而贬值。一些数据有期权价值,尽管现在价值不大,但以后可能价值很大。第三,外部性。同一数据对个人和社会的价值可以不同。数据与数据结合的价值可以不同于它们各自的价值之和。数据要素估值框架应考虑上述特征。为此,笔者提出了DataRank估值框架。
DataRank估值框架的基本思路如下。第一,数据要素价值有很多影响维度,需要一个综合指标以起到类似充分统计量的作用,并作为数据要素估值的基准点;第二,鉴于数据要素价值的主观性,综合指标最好基于客观的、可观察的数据要素特征以及数据流通和使用情况;第三,综合指标应该没有量纲,有助于按统一尺度评估不同数据要素的价值,但又应该与经市场评估或交易形成的数据要素的货币价值有强关联;第四,鉴于数据要素价值的时变性,综合指标要动态反映数据要素特征以及流动和使用情况的变化,其与货币价值之间的关系还要反映数据要素市场的供需情况和成交价格的变化;第五,鉴于数据要素价值的外部性,综合指标应该反映不同数据要素组合使用的情况。
DataRank: 0px: 0px: 0px: 100%; mox-width: 100%; box-silling: border-box!important; overflow-wrap: break-word!important; font-size: 14px; >DataRank valuation framework: the basic idea is as follows. First, the value of the data elements has many implications, and requires a comprehensive indicator to serve as a base for the valuation of similar statistical weights or trade elements; second, given the subjective nature of the value of the data elements of the market, and the dynamic characteristics of the data of the value of the data of the data flow; and the fifth element of the data of the data of the data of the data flow, which reflect the dynamic.
DataRank估值框架借鉴了谷歌PageRank算法的做法。不管数据要素市场采取何种组织形式,站在数据需求者的角度,其面临的问题都是如何从多个可选的数据要素中挑出最适合自己的。这个问题与互联网用户在网上检索信息是类似的。在一定意义上,可以将数据要素市场比照为互联网,将DataRank估值框架比照为搜索引擎。数据需求者说明自己想要的数据要素特征后(可被比照为互联网用户提交搜索查询),DataRank估值框架会筛选出符合要求的数据要素及相关的综合指标。
对于数据要素单元,DataRank估值框架根据以下维度提取影响数据要素价值的主要因素,这些因素被称为数据要素标签。第一,数据类型,如衣食住行等方面的行为数据,以及金融资产和交易数据;第二,数据涉及的样本分布、时间范围和变量类型等;第三,数据容量,如样本数、变量数、时间序列长度和占用的存储空间等;第四,数据质量,如样本是否有代表性,数据是否符合事先定义的规范和标准,观察的颗粒度、精度和误差,以及数据完整性(如数据是否缺失)等;第五,数据的时效性;第六,数据来源,有些数据来自第一手观察,有些数据属于第二手数据,还有些数据从其他数据推导而来。数据可以来自受控实验和抽样调查,也可以来自互联网、社交网络、物联网和工业互联网等。数据可以由人产生,也可以由机器产生。数据可以来自线上,也可以来自线下。
假设共提炼出p个标签。对于每个数据要素单元,用表示它在每个标签上的得分。这些得分是从价值维度较为客观地对数据要素单元的概括。不管是数据要素标签的数量和类型,还是每个数据要素单元在每个标签上的得分,都可以根据数据要素市场的发展情况动态调整。在数据要素市场上,这些标签也被数据需求者用于说明自己的需求,并检索数据要素单元。
用表示某一时刻数据要素标签的权重。标签权重是针对整个数据要素市场而言的,适用于所有数据要素单元。假设当前数据要素市场上有n个数据要素单元,第i个数据要素单元的标签得分是,定义其DataRank值为:
在数据要素市场刚开始运行的时候,要对标签权重进行初始赋值。随着数据要素市场的运行,各数据要素单元的DataRank值将动态调整,标签权重由线性回归来调整估计,其中dr为因变量,为自变量,为待估计参数,ε为随机干扰项:
通过式(2)估计出的主要用于对刚进入市场的数据要素单元的DataRank值进行初始赋值。
DataRank估值框架的核心特点是,数据要素单元被调用的情况将反映为其DataRank值的动态调整。在其他条件相同的情况下,某一数据要素单元被调用得越多,其DataRank值上调得也越多。在多个数据要素单元被一起调用时,DataRank估值框架能考虑数据要素单元之间的协同效应。在其他条件相同的情况下,一个数据要素单元与另一个DataRank值高的数据要素单元一起调用,能提高自身的DataRank值。因此,DataRank估值框架不是试图一劳永逸地给出数据要素单元的估值,而是在一个动态过程中不断评估,并充分考虑数据要素单元在数据要素市场上的表现。接下来讨论两种DataRank值动态调整机制。
DataRank valuation framework has the core feature that data element units will be used to reflect the dynamic adjustment of their DataRank values.
4.4.1 按数据调用情况调整
假设用户在一次调用中,同时调用了n*个数据要素单元,编号为ik,k=1,2,…,n*。用表示因这次调用对数据要素单元ik的DataRank值的上调:
其中,λ表示调用奖励系数。
用户每次调用数据都要参考DataRank值进行付费,通过调用“刷单”来提高某一数据要素单元的DataRank值,会付出比较高的成本。这样能保障DataRank估值框架不会被操纵。
4.4.2 按数据要素单元之间的联系调整
借鉴PageRank算法,把每个数据要素单元视为一个节点。如果两个数据要素单元曾被一起调用过,就认为它们之间存在一条边,并且这条边有权重。比如,考虑某一数据要素单元a,它与数据要素单元b、c和d分别一起调用过5次、2次和3次。那么,从a到b、c和d的有向边的权重就分别是0.5、0.2和0.3。这样,数据要素单元之间的联系就构成了一个有向图。如果赋予有向边的权重以概率含义,那么数据要素单元之间的调用关系就可以用马尔可夫过程来描述,而有向边的权重就是转移概率。按照与PageRank算法类似的方法,分析这个马尔可夫过程的稳态分布,就能得到各数据要素单元的DataRank值。
可以根据数据要素市场的成交记录,拟合DataRank值与货币价值之间的函数关系,作为接下来数据要素市场化配置的价格参考。成交记录也可以用于DataRank值动态调整。比如,在式(3)中,可以将调用奖励系数λ与成交金额关联,成交金额越高,λ越大;在有向图中,可以根据成交金额加权确定有向边的权重。
本文研究了数据要素市场的组织形式和估值框架这两个影响当前数据要素市场发展的重要问题,核心结论如下。
第一,并非只有所有权清晰的数据要素才能参与市场配置,很多数据要素(特别是个人数据)虽然难以清晰界定所有权,但也可以参与市场配置。实际上,数据要素的控制权更重要,它是数据要素有效配置的前提。对数据要素的控制是通过法律和技术的结合来实现的。数据要素有多种市场化配置机制,市场交易只是其中的一种,而且很多数据要素不适合进行市场交易。数据要素市场与金融系统之间存在同构关系,可以从金融系统的组织形式推测数据要素市场的组织形式。数据要素市场在整体架构上将是分布式的,但会有一些中介机构作为核心节点,包括数据银行和数据信托等。这些中介机构会聚合、加工并集中管理数据,使数据更好地从最终的提供者流向最终的需求者。
第二,数据要素估值需要考虑数据要素价值的主观性、时变性和外部性等特点。现有的成本法、收入法、市场法和问卷调查法等都存在局限。本文参考谷歌的PageRank算法,提出了数据要素估值框架DataRank。在DataRank估值框架下,先提炼出影响数据要素价值的主要标签,再结合数据要素单元的标签得分和当前标签权重,对数据要素单元赋予DataRank值,然后根据数据要素单元被调用的情况动态调整DataRank值,这反过来又能促成标签权重的更新,从而形成一个自适应、不断更新迭代的过程。DataRank值基于客观的、可观察的数据要素特征以及数据流通和使用情况计算,有助于按照统一尺度评估不同数据要素的价值,并且可以作为基准点,帮助数据要素市场参与者评估数据要素单元的货币价值。
作者简介
邹传伟(1982-),男,博士,上海万向区块链股份公司副研究员、首席经济学家,主要研究方向为金融科技、商业银行、固定收益证券、资产管理和金融监管等。 @margin-top: 0px; margin-bottom: 0px; padding: 0px; outline: 0px; max-width: 100%; clear:both; min-height: 1em; text-align: justify; text-indent: 2em; box-sizing: border-box!important; overflow-wrap: break-word!important; 联系我们: Tel:010-81055448 010-81055490 010-81055534 E-mail:bdr@bjxintong.com.cn http://www.infocomm-journal.com/bdr http://www.j-bigdataresearch.com.cn/ 大数据期刊 《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,并被评为2018年、2019年国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。
https://blog.sciencenet.cn/blog-3472670-1302715.html
上一篇:[转载]数据资产价值评估与定价:研究综述和展望
下一篇:[转载]基于区块链的大数据交易模式研究与探索
注册有任何问题请添加 微信:MVIP619 拉你进入群
打开微信扫一扫
添加客服
进入交流群
发表评论