数智中国2029|郑磊:避免因短期利益而阻碍公共数据开放

焦点好文 2024-09-10
- N +

本站全国维修客服热线电话:400--117--9882(温馨提示:点击屏幕下方↓↓↓可直接拨打)

2024年9月6日,澎湃研究所举办“数智中国2029:拥抱新一代信息技术”研讨会,邀请了朱嘉明、史丹、彭文生、郑磊等知名专家学者,深入探讨数字经济与新兴信息技术对中国未来发展的深远影响。

复旦大学国际关系与公共事务学院教授、数字与移动治理实验室主任郑磊发表了题为《数据开放、流通与利用的堵点与解法》的主旨演讲。郑磊教授认为,公共数据的流动至关重要,而作为两种供给方式的公共数据开放和公共数据授权运营,各有其适用的数据类型与运用场景。

以下为郑磊老师演讲实录。

 

复旦大学国际关系与公共事务学院教授、数字与移动治理实验室主任郑磊教授
澎湃新闻记者 周平浪 图

在中国数字经济迅速发展的背景下,数据已成为关键生产要素。政府在推进数字化建设过程中,努力推动了数据的跨部门、跨地域、跨层级流动以提升办事效率,但公共数据面向社会的开放与利用仍面临诸多挑战。作为重要资源,公共数据不仅对政府内部运作和公共服务至关重要,对外部企业和数字经济的发展也有巨大价值。为此,政府正在积极探索两种公共数据供给方式:“数据开放”和“授权运营”。

公共数据开放:待客需“公道”

如果将政府掌握的公共数据比做茶壶里的茶水,公共数据的开放,就是要将政府掌握的数据资源从“茶壶”中倒出,让外部社会和企业得以使用。由于这些数据是通过公共财政资助来采集和储存的,理应遵循“取之于民、还之于民”的原则,强调免费和直接的供给。

同样是给客人们“倒茶”,却难免会面临有先有后,有浓有淡,有热有冷的状况,这样的差异化就会造成不公平。公共数据开放在实际操作中也会面临公平性问题,政府在将数据“倒出去”的过程中,不同企业在获得数据的时间、数量和质量上可能存在差异。这种差异化的供给方式会导致竞争上的不公平。

为解决这一问题,就需要设立一种类似“公道杯”的机制,就是在数据开放的过程中,先对数据进行过滤和均衡化处理,质量不好、涉及安全与个人隐私的数据提前被过滤筛出。同时,滤至公道杯中的茶水也能做到温度和浓度都均匀一致。这种情况下,再将其“倒”给不同的数据需求主体或者由其各取所需,才能确保公平公正。

从政府角度来说,设置“公道杯”主要体现在把数据放在一个公共数据开放平台上。2009年,美国最早推出了国家级政府开放数据平台Data.gov。近年来,中国各级地方政府也陆续建立了超过226个数据开放平台。通过这些平台,经过安全审查和隐私保护的数据可以供公众直接下载或通过API来获取,以保障公共数据供给的普惠性。

《开放数林指数报告》发布的数据显示,2012年只有3个地方上线了公共数据开放平台,到2023年这一数字已增长至226个。其中,上海、北京推动较早,省级平台如浙江、山东、贵州,市级平台如杭州、济南、德州都卓有成效。在数据集的总数上,2017年只开放有8000多个数据集,而到2023年已增长至35万个。

有成绩的同时也有挑战。数据开放面临的第一个堵点就是有很多数据,特别是高价值的数据仍然“倒不出来”。一方面,政府担心安全问题,数据开放可能涉及安全、隐私和商业情报;另一方面,政府意愿不足,数据开放对社会、对市场、对数字经济有好处,但于政府而言无偿提供数据只会增加工作量和负担,总而言之是“不放心,不省心,没好处”,于是导致“供不出”。

第二个堵点则在于“流不动”。在供需对接的中间环节,作为供方的政府不知道市场需要何种数据,而作为需方的企业也不了解政府有什么样的数据,提不出要求来,加之政府自身的技术开发运营服务能力有限,导致供需对接困难。政府人力和财力的不足又使得一些需要经过加工的高价值数据无法持续稳定地供给,而不能充分满足市场需求。数据对接的“供不出”和“流不动”使得最终数据价值“用不好”,无法充分发挥其应有价值。

数据授权运营:“温碗”赋能新价值

在数据开放的过程中,政府所掌握的公共数据如滚烫的热水,蕴含巨大能量的同时也有烫伤人的风险,比如泄露隐私。而先将热水倒入“温碗”这个中介,再将酒壶放置在温碗中,温碗中的热水本身不能倒出去,却可以将热量持续“赋能”给壶中的酒。如此,数据本身虽不流动,而其价值和能量都能流动起来,向外释放。数据授权运营模式即是如此。授权运营平台可以利用隐私计算、联邦计算、数据沙箱等技术手段确保原始数据不出域,数据“可用不可见”,但基于原始数据开发出来的数据产品和服务却能够流通、交易和利用。

以个人医保数据为例,这些数据包含了患者的病史和用药情况,虽然对药厂和保险公司极具价值,但涉及隐私,普通公民显然不希望涉及自己的这些数据被开放。然而,如果企业能够了解某个地区的疾病暴发整体情况或疾病覆盖的人群特征,这对药物研发和保险产品的设计将提供重要参考。在这个案例里,授权运营就可以在不泄露每个个体的原始数据的情况下,通过加工产生只涉及整体情况的数据产品和服务来满足企业的需求。

需要强调的是,这种模式基于场景导向来供给,很多地方采用了“一场景一审批”的方法来授权,并需要运营主体来发挥中介作用。在实际操作中,企业首先要向数据主管部门或运营主体明确提出具体的数据需求和使用场景。运营主体从政府部门获得授权,将数据加工成所需的结果反馈给企业。通过这种方式,使数据的价值得以“供得出”。与此同时,除了负责加工和供应数据,运营主体还需要促成供需双方的对接,推动合作,从而实现数据价值的有效利用。

然而,数据授权运营也面临诸多挑战。首先,授权的管理机制需明确具体的授权部门、授权对象及授权范围。如果授权仅限于单一企业,可能导致市场垄断、价格不公等问题,这需要确保授权过程的公平性和反垄断性。其次,授权运营中各参与主体之间的权责利关系也需要理顺,如何合理设定数据加工费用,是否应将收入分配给数据源部门等等,这些细节问题尚在讨论中,未能完全理顺。

总体来看,公共数据的价值释放涉及三大核心维度:一是守住安全底线,防止涉及国家安全和隐私的数据泄露;二是提高运营主体的数据处理和供给效率,以保证数据的高质量流通;三是保证数据共享的普惠、公平和公正,确保所有市场主体均能平等获取数据。这三点虽然各自合理,但如何在实际操作中平衡好这些维度仍然是一个亟待解决的问题。

协同推进开放与运营,平衡创新与安全

在公共数据供给中,数据开放与授权运营各有优势和弱势。单纯依赖数据开放难以有效推动高价值数据的安全流动,而完全依赖授权运营又可能因其申请流程复杂和安全要求较高而限制了创新的活力。因此,结合两者优点,形成互补和协同,在保障数据安全与促进创新发展之间找到最佳平衡,才能有效有序地促进公共数据资源的开发利用。

数据开放强调无偿、广泛地提供公共数据以促进创新和增进公共利益;而授权运营则侧重在保护数据安全隐私的前提下,授权第三方主体将原始数据加工成服务或产品,供特定市场用户使用。要实现两者的统筹协同,应根据数据类型和应用需求采取不同的处理方式。

对于不涉及个人信息、公共安全风险低且社会受益面广的数据,主要依靠公共财政采集和生成的数据,应优先选择数据开放。这类数据通常无需深入加工,直接供给即可带来较大的社会效益。例如,公共交通数据和环境监测数据不仅能助力创新应用,还能提升公共服务质量和公共治理水平。

相对而言,对于涉及公共安全和个人隐私、不完全依靠公共财政生成或需要投入较高成本才能加工成可供企业使用的数据产品和服务的数据,授权运营就更为适合。这类数据通常面向特定行业或垂直领域,例如,水、电、煤等行业的数据可能需要通过授权运营实现安全、有效的利用。

在推动数据开放与授权运营时,应特别注意平衡与协同,避免因短期的利益驱动压缩公共数据开放空间。例如,一些地方政府可能片面看重将公共数据快速变现带来的短期收益,而将原本应该开放的数据认定为需授权运营的数据,进而收取费用,这可能影响公共数据的公平性和可得性,进而抬高了各类市场主体尤其是中小企业获取公共数据的门槛和成本,反而不利于创新驱动和数字经济的长远发展。

标签:
点击拨打电话