宋洁 王聪
2023年2月,《数字中国建设整体布局规划》指出,畅通数据资源大循环是数字中国建设的两大基础之一。然而,当前我国数据市场发展仍在起步阶段,亟需从理论引领、技术赋能到机制设计的研究与支持。有鉴于此,本报告对我国数据要素市场薄弱环节进行研判,并提出完善数据登记授权制度并组建数据专区、发展以满足业务需求为导向的数据技术体系、设计基于动态博弈分析的激励机制等政策建议。
观点概览
l 我国数据要素市场面临的问题包括数据供给相对不足,数据源寻找和匹配难度较大;进入市场的安全担忧和技术门槛,阻碍数据的高效流通;缺乏贡献确认与收益分配的长效激励机制,难以建立长期稳定的市场信任等。
l 促进数据流通交易的政策建议:建立完善的数据登记授权制度,组建数据专区,促进合适的数据主体进入市场;发展以满足业务需求为导向的数据技术体系,保障数据可控、可计量、可流通;构建数商生态,在不同的市场模式中辅助交易评估和信任构建,根据市场长期行为的动态博弈分析设计激励机制。
2023年2月,《数字中国建设整体布局规划》指出,畅通数据资源大循环是数字中国建设的两大基础之一,要构建国家数据管理体制机制,健全各级数据统筹管理机构,推动公共数据汇聚利用,释放数据价值潜能。然而,我国数据要素市场化配置尚处于起步阶段,数据流通交易存在一些深层次问题和结构性矛盾,制约着数据要素市场功能的有效发挥,主要体现在数据供给不足和匹配困难、进入市场的安全担忧和技术门槛、缺乏贡献确认与收益分配的长效激励机制等方面。目前,“数据割据”格局已经形成,有价值的数据资源掌握在公共管理与公共服务机构、大型数字平台企业、行业垄断性龙头企业等“数据大户”手中,而社会公众、中小微企业作为数据产生者却沦为“数据贫农”,一定程度上也反映出目前我国数据资源流通的“瓶颈”局面。
数据流通交易理论创新的着力点应放在如何适应数字时代新的价值范式,强化、放大、运用好数据的特性及其价值运动规律,调整数据攸关者关系,构建多元主体共建共治共用共享共赢的数据价值网络,促进数据专区、数据技术、数商生态的发展,力求实现数据攸关主体整体利益达到最优,推动数据流通交易生态可持续发展,促进数据向现实生产力转化。本报告立足我国数据流通交易实践环境和全国统一大市场宏大视角,剖析当前数据流通交易所面临的理论困境、技术困境、治理困境及供给侧结构性矛盾等重大现实问题,并提出相应政策建议,以期进一步发挥数据资产活力,释放要素价值。
一、我国数据要素市场现状与问题研判
一是数据供给相对不足,数据源寻找和匹配难度较大。国内数据要素市场发展尚处于初级阶段,数据流通规则和数据供需对接机制未有效建立,尚未形成高效完整的数据产品供应链。以人工智能领域为例,大模型技术取得的突破使人工智能技术正在从“以模型为中心”加速向“以数据为中心”转变。然而,我国已有的部分中文开源数据集在数量上远少于国际英文公开数据集,在模型训练过程中,企业需要花费大量的人力和物力进行数据集采集、清洗和标注,成本较高。目前,在人工智能等相关许多领域,高质量数据集缺乏、数据供给的产业生态不健全、企业数据资源获取成本高等问题依然严峻。
二是进入市场的安全担忧和技术门槛阻碍数据的高效流通。一方面,数据的安全性和隐私保护问题凸显,在数据流通的过程中,可能存在包括共享交换平台被攻击导致传输数据遭篡改、平台系统被破坏的风险,访问人员造成数据泄露、滥用的风险,对数据流向无法追踪的风险等等。尤其是涉及到个人隐私和敏感信息的情况下,隐私保护机制不够健全,导致了许多潜在的数据交易受阻。另一方面,不同来源的数据往往以各自独特的标准和格式存在,不同的共享形式对数据的格式、标准等有不同的要求,需要各方技术层面的统一。此外,由于缺乏统一的数据交换协议,数据在不同平台和系统之间的兼容性不足,进而导致数据在流通过程中需要进行繁琐的格式转换和标准匹配,阻碍了数据的高效流通。
三是缺乏贡献确认与收益分配的长效激励机制,难以建立长期稳定的市场信任。数据流通从“动态博弈”到“价值共创”之间仍存在难题。首先,数据的真实性和可信度成为了一个不容忽视的问题。当前,缺乏统一的数据评估体系,使得数据的质量参差不齐,这使得数据交易的过程中往往伴随着信任危机。其次,参与数据共享需要承担一定的经济成本,包括运营成本和沉没成本,如果在共享数据时无法得到合理的激励和收益分配,那么难以形成稳定的参与和长期的投入。此外,各数据主体之间可能存在多种复杂的竞争与合作关系,其自身的类型与条件使其在数据共享的合作中做出不同的策略选择。
二、关于促进数据流通交易的政策建议
第一,建立完善的数据登记授权制度,组建数据专区,促进合适的数据主体进入市场。一是完善数据登记制度,统分结合,形成涵盖多类权益、服务多级市场、吸纳多类主体的全国统一登记确权体系。从国家发展改革委价格监测中心对16家主要数据交易所的调研来看,目前场内数据交易中80%以上为数据产品和服务交易。建议鼓励各地持牌经营的数据交易场所建设数据产品登记平台,确保标准统一和登记信息互联互通,实现对数据产品经营权的登记和确权授权。二是组建数据专区,连接数据供给方和需求方。例如,2023年1月,贵阳大数据交易所发起招募数据首推官,集结银行、交通、医疗、时空数据、数据交付等多个行业领域的专家,破题数据供需信息差,并率先探索“数据专区”运营,打造全国首个气象数据专区和电力数据专区,官网显示截至2023年7月,两专区交易额分别达到3500万元和1亿元。数据专区一方面帮助数据供需双方迅速匹配,另一方面也方便跨领域扩展数据供给方的来源和数据需求方的数据业务请求。三是加大创新探索,促进数据主体进入市场。积极开展数据特区、数据委托运营、行业数据市场、数据市场等创新试点。加大财税综合支持,扶植具有创新技术应用或商业模式的代表性企业,鼓励自由竞争的市场化流通交易。鼓励企业加强数据产品研发力度,主动创新商业模式,主动创造应用场景并寻找市场机遇。大力培育多样、专业的数据服务机构,主动对接数据创新成果、分析数据应用需求、撮合数据流通。研究建立数据价值评价指标体系,从行业、场景等方面切入,开展数据估值定价试点。进一步探索数据要素金融服务体系,提高相关企业的融资效率。
第二,发展以满足业务需求为导向的数据技术体系,保障数据可控、可计量、可流通。一是发展高效能的以大数据技术栈、开源社区为核心的生态系统,以及新兴的数据处理方法。AI技术与数据处理技术相结合降低技术使用门槛,2023年AIGC技术的跨越式突破发展,不仅使大语言模型进入公众视野,更扩展了数据基础设施与AI融合的发展空间。以数据库为例,生成式AI在数据库结构设计、架构设计、数据分析挖掘等方面可以不同程度简化人员操作,提高开发、运维、分析的效率,降低用户使用门槛,更好助力数据流通。二是强化数据安全与隐私保护措施,发展以人工智能、隐私计算、区块链等为代表的新兴技术持续护航数据要素安全流通。例如,联邦学习技术能够打破数据孤岛,在保护用户隐私和公司数据的前提下,更好地发挥数据价值。未来,新兴技术将在应用过程中不断融合以适应不同场景下的技术需求,向着更加高效、安全的方向不断发展。三是提出数据标准与交换协议,推动各行业建立通用的数据格式和标准,降低数据格式转换和标准匹配的成本,提升数据流通的效率。数据技术的发展和标准的统一将推动各行业从“有数可用”到“数尽其用”,全场景智能、跨领域协同、数据流通跨域安全管控成为新阶段的发展目标,推动数据要素价值不断向更多应用场景拓展。
第三,构建数商生态,在不同的市场模式中辅助交易评估和信任构建,根据市场长期行为的动态博弈分析设计激励机制。一是支持各类数商积极主动寻找市场定位,构建数商生态体系。例如,数据经纪人是数商生态中的重要角色,承担数据价值洞察、撮合、代理、评估等职责。数据经纪人通过建立数据安全、隐私和保密的共同规则为市场提供信任,解决利益相关者的担忧。无论是数据存储加工和使用,还是发现客户、达成交易等,科技弱势群体可以委托数据经纪人保护其权益。建议培育并规范更多专业的数据经纪从业人员以及其他数商相关从业人员。二是建立完善的数据评估机制,对数据进行全方位的评估和验证,明确数据的质量等级,提高数据交易的可信度。目前的主流市场模式包括数据技术使能者模式、数据合作社模式和数据信托模式等,在不同模式中需明确数据主体之间的利益关系,建立完善的交易评估方案,保障交易产生的收益按贡献合理分配,从而建立长期的市场信任。三是进行长期市场行为的动态博弈分析,设计支撑稳定数据合作的激励机制。构建基于多主体动态博弈的,旨在降低数据交易成本、提高交易匹配效率的,正向协同、安全可信、监管有效的数据价值网络。通过构建数据价值网络,揭示数据流通从“动态博弈”到“价值共创”的内在逻辑,建立“理论引领—技术赋能—流通生态—价值释放”创新路径,优化数据价值网络空间中数据主体的利益关系。充分了解动态博弈的各方需求,设计有效的激励机制:鼓励企业和个人参与数据产生和共享,可以通过经济激励和政策支持等方式,激发市场主体的积极性和创造性。例如,设立数据共享平台,鼓励企业之间的数据交流和合作。鼓励企业与高校、科研院所等建立产学研合作关系,共同开展数据合作的研究与创新,以期实现基础服务与基础制度的供给,促进数据价值的创造、流通与实现。
作者单位:宋 洁 北京大学工学院
王 聪 北京大学光华管理学院