每经记者|张蕊每经编辑|陈旭

张向宏,现任北京交通大学信息管理理论与技术国际研究中心特聘教授,为享受国务院特殊津贴专家。

他曾担任中国软件评测中心常务副主任、中国电子信息产业发展研究院副院长、中国信息安全研究院副院长等职,主持过50多项国家级重大课题研究和100多项地方和企业项目研究,曾参与起草十多部国家政策文件。

5月10日,以“数智无界 安全共生”为主题的2025中国数谷·西湖论剑大会在杭州举行。大会期间举办了数据安全流通论坛,该论坛首次邀请18个数据基础设施试点城市中超过半数的城市数据运营管理机构掌舵人齐聚一堂,共商数据基础设施建设大事。

张向宏在论坛上对《数据基础设施技术路线研究报告》作了解读。论坛期间,他还接受了《每日经济新闻》(以下简称NBD)记者的采访。

要在数据高速流通过程中解决数据安全问题

NBD:在当前数字经济快速发展的背景下,您认为我国数据基础设施技术路线的核心目标是什么?为实现这一目标,需要在哪些关键技术领域取得突破?

张向宏:核心目标就是要解决一定程度上存在的数据“供不出、流不动、用不好”的问题。

我国数据基础设施的定义是从数据要素价值释放的角度出发,面向社会提供数据采集、汇聚、传输、加工、流通、利用、运营、安全服务的一类新型基础设施,是集成硬件、软件、模型算法、标准规范、机制设计等在内的有机整体。

这里面第一句话就是“从数据要素价值释放的角度出发”,所以其根本任务就是让原本不能流通的数据能够流通起来,使流通慢的数据加速流通,并且在数据的供给、流通和使用过程中确保数据安全,即实现数据“供得出、流得动、用得好、保安全”。这就是根本目标。

衡量数据基础设施是否卓有成效,主要有两个指标:

一是是否有大量数据在应用、流通。如果只有三五个人或者三五十人的数据在流通,这也不能算,像滴滴、美团、携程等平台,上面有几亿用户的海量数据在高速流通,这才是真正的数据基础设施。

二是流通过程必须是安全的。

数据流通基础设施要解决数据高效流通和可信安全的问题,其技术确实很难。计算机发展至今只有七八十年的历史,安全和发展往往是割裂的。以前是由不同的人做,有的做发展,有的做安全,而现在需要将数据流通技术和保障数据安全技术结合起来,难度在这里。

所以,区块链技术、隐私计算技术、数联网技术,数据元件、数场、可信数据空间技术等这六种技术路线,目前来看都兼具了确保数据能流通并且流通过程安全的特点。而像传统的TCP/IP协议(传输控制协议/网际协议)、云计算等,确实能让数据流通,但是不保安全。

但前述六种技术目前还不够成熟,例如区块链和隐私计算技术虽然安全,但效率较低,难以大规模应用。隐私计算技术目前主要应用于银行等金融机构,为高净值客户提供数据保护方案,成本较高,它只覆盖少量用户,因此不算基础设施。

所以,要使隐私计算等技术得到更广泛应用,必须突破如何在使用联邦学习(一种分布式机器学习技术)、多方安全计算、密态等技术后,减少数据价值损耗、提高数据流通速率的问题。只有突破这一难题,隐私计算技术才能像5G一样,降低成本,为更多行业和普通百姓服务。

因此当前如何在数据高速流通的过程中同时解决数据安全问题,这是相关技术的核心,也是难点。



张向宏教授接受采访 每经记者 张蕊 摄

未来国家数据基础设施技术路线一定会收敛成一条

NBD:去年国家数据局发布了一个支持可信数据空间发展的文件,提出到2028年,我国将建成100个以上可信数据空间。您认为可信数据空间是一条比较有前景的技术路线吗?

张向宏:这可以从两个角度来理解。

一个角度是,《国家数据基础设施建设指引》中提出了六条技术路线,可信数据空间是其中之一。从这个角度来看,可信数据空间与其他五条技术路线一样,都是国家鼓励试点试验的技术路线。

目前,其他技术路线都没有专项政策,而可信数据空间出台了《可信数据空间发展行动计划(2024—2028 年)》。从这个角度来看,在国家政策支持方面显然与其他技术路线存在差异。目前,从社会反响来看,可信数据空间的探索确实相对比较多。

另一个角度是,未来的技术发展一定会收敛成“一个空间”,或者叫“一个场”“一个平台”或“一个网”。无论叫什么名字,核心问题是数据在这个空间里是高效流通的,流通过程中是安全的。

构建这个空间、场或平台时,可能会用到隐私计算技术、区块链技术、数据控制技术、数据元件技术、数据沙箱技术等,这些技术不是必须用,但不用这些技术肯定无法实现目标。

至于称呼,空间、场、平台或网并无本质区别,关键在于要有大量数据的供数主体,带来海量的数据资源;要有大量的用数主体,带来丰富的数据应用场景;要有大量的数据服务主体,从数据资源到数据场景中间提供大量服务。

只要具备这些要素,无论叫什么名字都无所谓。把握数据基础设施的核心要义,就是要将数据的供数主体、用数主体和服务主体放在一个空间上、一个场上、一个平台上、一个网上。

通过国家数据基础设施建设解决“数据平权”问题

NBD:不同行业的数据基础设施建设需求应该是存在差异的,比如金融、医疗、交通等行业,您觉得在制定技术路线时,应如何平衡通用性与行业特殊性?

张向宏:在人类文明发展史上,生产要素可以划分为三个阶段:以土地和劳动力为要素的是农业社会,以技术和资本为要素的是工业社会,以数据为要素的是数字社会。

从20世纪90年代末开始,我们逐渐进入以数据为要素的数字社会,目前正处于加速阶段,国民经济和社会发展都在进行全面数字化转型。

从这个角度来看,各行各业对数字化的需求并无差异。如果一个行业不进行数字化转型,不通过数据发展业务、改善流程、降低成本,或者个人不通过数据平台交友、购物、打车,生活将很难正常开展。因此,从需求角度来看,我认为各行各业的差异性并不大。

对各级政府来说,当前需要做的工作是填平“数据鸿沟”。国家数据局等部门出台的《“数据要素×”三年行动计划(2024—2026年)》列出的12个行业中,第一个是工业制造,第二个就是现代农业,这两个是排在前面的,金融、医疗等排在后面。

目前我们还处于数据要素化发展的前期阶段,过十年、二十年回头再看,数据在传统工业、农业等领域的应用将会非常广泛。例如传统物流业,以前数据应用较少,现在数据应用已经非常广泛。

NBD:您认为生成式AI(人工智能)的训练数据溯源难题、输出结果不可控性是否将颠覆现有数据安全框架?您觉得监管应更侧重训练数据治理还是输出内容管控?

张向宏:我个人认为,对于人类社会的技术进步,我们不应过度猜测,而应顺其自然。过度忧虑只会增加人类的焦虑。

以人工智能为例,我们对人工智能当前这个发展阶段的期望值过高。人工智能目前还处于发展阶段,存在一些偏差是正常的,它目前的发展阶段就是这样,尚未达到真正的智能。

自动驾驶也是一样,我们不能完全依赖自动驾驶技术,自动驾驶目前只是辅助驾驶,它出现一些偏差,你认为是它的问题,要限制它,这就是“人的焦虑”的反映。

今天我讲到“数据基础设施与人工智能需要高度契合”这个发展趋势,举例说DeepSeek解决了人工智能的算力瓶颈和算法瓶颈这两大问题,我们叫算法平权、算力平权,这是一个重大突破。

人工智能有三大要素:算力、算法和数据。目前,算力和算法问题已经得到一定程度的解决,但数据问题仍然存在。我们应该关注如何构建更大规模、更高质量的数据集,使人工智能更聪明、更智能,这就是国家数据基础设施要解决的问题。

我们要在国家数据基础设施上让数据“供得出、流得动、用得好”,集聚一大批各行各业的高质量数据集。数据应用于千行百业,其中有一个新兴应用场景,就是人工智能,还有低空经济等等,意义非常重大。

我们应该关注如何通过国家数据基础设施建设解决“数据平权”问题,使人工智能得到突破性发展。由于数据来源不可靠等因素,人工智能会出现大模型幻觉等问题,如果能提供高质量的数据,这些问题就会减少。

ad1 webp
ad2 webp
ad1 webp
ad2 webp