数据隐私问题研究(观点隐私计算)
数据隐私问题研究(观点隐私计算)1.内部共建,畅通集团内数据循环中国银行自2020年启动企业级架构建设工程,提出分布式、大数据、移动智能3个基础技术平台与AI中台、区块链、物联网等N个专项技术平台相结合的“3 N”技术平台规划。其中隐私计算平台作为数据要素应用领域重要的技术平台,已完成原型研发及试点,并加快推动建设中。我们认为,集团级的隐私计算平台是建设数据要素新生态的重要技术基础设施,具备保障数据隐私安全、畅通内外数据交互、发掘数据价值的能力,将为业务合规经营、提质增效、模式创新发挥重要价值。随着商业银行数字化转型的快速推进,目前先进同业基本已完成大数据、人工智能、区块链等基础技术平台的建设,初步实现了经营过程中各类数据的有效存储、管理和使用。如何更加深入地挖掘数据要素价值,推进数字化转型进入更高阶段,成为重要课题。建设企业级隐私计算平台以完善数字化技术底座,是有效途径之一。我们认为,商业银行企业级隐私计算平台需具备以
当前,数据作为一种新型生产要素正在颠覆全球社会的发展模式。6月22日,中央深改委通过《关于构建数据基础制度更好发挥数据要素作用的意见》,强调“促进数据高效流通使用、赋能实体经济,统筹推进数据产权、流通交易、收益分配、安全治理,加快构建数据基础制度体系”。去年底,中国人民银行提出“从强化数据能力建设、推动数据有序共享、深化数据综合应用、做好数据安全保护方面充分释放数据要素潜能”。深入数据要素使用、加快数据要素市场培育等工作已提升至国家战略。
隐私计算等新兴技术的快速发展打破了传统技术局限,为深入挖掘数据要素价值提供了必要条件。商业银行应积极探索、把握机遇,为国家数据要素市场和数据要素新生态建设贡献力量。
中国银行软件中心副总经理 王丽静
技术革新,开拓数据要素新机遇“隐私计算”本质上是一套数据流通、应用、服务解决方案,对于数据所有者来说,可以在“数据不出域”的前提下,与参与方共享挖掘数据要素潜在价值。通过隐私计算技术可实现数据“可用不可见、可控可计量”,成为破解数据保护与利用之间的矛盾的利器。
随着商业银行数字化转型的快速推进,目前先进同业基本已完成大数据、人工智能、区块链等基础技术平台的建设,初步实现了经营过程中各类数据的有效存储、管理和使用。如何更加深入地挖掘数据要素价值,推进数字化转型进入更高阶段,成为重要课题。建设企业级隐私计算平台以完善数字化技术底座,是有效途径之一。我们认为,商业银行企业级隐私计算平台需具备以下能力。
在业务价值方面。以用户体验为中心,打造功能齐、性能佳、操作简单的一站式数据服务平台。在底层技术架构上,通过融合密码学、大数据和人工智能技术,打造安全的系统架构,实现密文数据流转的可控可审计、可用可计量,同时支持跨平台间互联互通。在引擎层,设计多方安全计算和可信联邦学习双引擎,服务安全求交、匿踪查询、联合分析、联合建模等多个业务场景。在模型设计层,支持拖拉拽设计、可扩展组件等低代码建模,降低用户学习成本。
在技术能力方面。在满足信创要求的前提下,与商业银行已有技术平台充分融合,共同为业务应用提供基础技术能力。基于大数据平台获取数据要素,支撑丰富的行业数据服务场景,推进商业银行与集团综合经营公司、监管机构、政府机构等的数据等方向可用不可见的应用。与区块链平台打通,数据持有者可将共享数据目录、数据使用申请、数据使用审批、数据使用审计等上链。DMZ区独立部署,数据与大数据平台分离,防止风险传染。与人工智能平台打通,构建明文建模和密文建模双引擎,通过统一的建模界面,支持用户明密文一站式建模。
中国银行自2020年启动企业级架构建设工程,提出分布式、大数据、移动智能3个基础技术平台与AI中台、区块链、物联网等N个专项技术平台相结合的“3 N”技术平台规划。其中隐私计算平台作为数据要素应用领域重要的技术平台,已完成原型研发及试点,并加快推动建设中。我们认为,集团级的隐私计算平台是建设数据要素新生态的重要技术基础设施,具备保障数据隐私安全、畅通内外数据交互、发掘数据价值的能力,将为业务合规经营、提质增效、模式创新发挥重要价值。
业技联动,打通内外生态双循环1.内部共建,畅通集团内数据循环
中国银行作为我国全球化、综合化程度领先的商业银行,依托中银集团全牌照、多领域的优势及全球网络优势,为客户打造综合化服务模式潜力巨大。通过应用隐私计算技术,可探索实现集团内行司协同、跨境联动新模式,助力实现中银集团“一体两翼”发展新格局。
在行司协同方面。银行端拥有客户、账户、交易等各类优质的金融和非金融数据。而综合经营公司端拥有产品销售、渠道行为、产品收益、客户关系等特色数据,相对银行端来说往往用户量较小、特征维度少、数据质量差。通过隐私计算技术,可实现两方或多方数据价值共享,突破集团内部不同法人主体之间的数据壁垒,推出适合不同业务场景的产品和服务,有效提升综合经营公司数据要素分析和价值挖掘能力。
我们在中银消费、中银证券等综合经营公司相关业务场景开展先行先试工作。以中银消费行司数据共享项目为例,我们使用隐私计算联邦学习技术,运用行内数据与中银消费数据对贷前、贷中风控模型进行联合建模,在双方数据不出域、不泄露的情况下,筛选出需求真实、消费意愿强、还款能力可靠、信用风险可控的优质客户群,进行存量客户的再营销,唤醒休眠客户,激活低阶客户,夯实客户基础,优化客群结构。
在跨境联动方面。中国银行在境外61个国家和地区设有机构,服务遍布全球。在开展跨境业务过程中,在对特定客户的展业、全球风险统一管理、反洗钱等方面有集团数据共享需求。然而,由于跨境数据流通可能对国家安全和个人隐私造成巨大风险,不同法律规范之间、国内法与国际法之间的配套协调存在难以逾越的鸿沟。隐私计算技术为跨境数据流动安全管理机制带来新思路,通过接入国内外合规数据源,在不传输敏感数据的前提下完成跨境身份核验、资产核验、信用总账管理等,从而达到提升金融风控的同时促进贸易和投资的目的。
2021年11月,我们与大湾区跨境数据互信互认平台签订合作协议,该平台将接入粤港两地合规数据源,在中国首创对粤港两地个人的跨境身份核验服务,解决中小企业和个人用户跨区域身份认证的难题,有助于推动粤港金融合作、数据流通。
2.外部互连,引入行业数据活水
通过接入千行百业多元数据,将有效补齐商业银行数据短板,通过进一步的价值分析、挖掘,赋能各大业务领域,其中风控和营销最为典型。而在普惠金融支持、电信诈骗防范等方面,商业银行基于自身数据进行的数据分析和挖掘已渐渐无法满足实际需求,基于隐私计算技术的多方数据共享体系为此类场景提供了可行方案。
在风险控制方面。运营商拥有企业或个人用户的上网行为、通话时长、话费余额、欠费次数、常驻地址等数据,利用运营商数据,商业银行可有效提升精准营销触达,可识别企业集群背后的复杂关系链条及欺诈风险以提高风控水平。2021年12月,我们与海南省大数据管理局合作,建设海南省中银E贷贷前风控项目。该项目通过搭建多方安全计算平台,将海南大数据管理局的公共数据资源接入到海南分行,训练行为表现模型、资质评价模型等在内的风控模型,解决了分行在开展“中银E贷”业务过程中缺乏外部数据的痛点,推动了E贷业务的提质增效。
在营销方面。互联网平台掌握个人丰富的社交、消费、生活等行为数据,同时平台流量巨大,商业银行在连接平台数据后,在零售金融领域可显著降低获客成本、提升活客效率。各商业银行大都已建成“客户关系管理”等营销系统,“智能推荐、流失预警、潜在客户资产提升”等基于机器学习的精准营销模型也大都在实际生产中应用并取得了一定效果。然而,受限于行内数据广度,模型预测效果、时效性等方面进一步提升的难度很大。通过与互联网平台合作,可将其客户标签画像数据对商业银行进行隐私共享,提升客户的标签维度,补全客户画像,有效提升客户精准营销能力。
在普惠金融方面。政务数据资源丰富,包括自然信息类数据、城市建设类数据、城市管理统计监察类数据以及服务与民生消费类数据,商业银行利用政务数据可有效提升金融服务民生水平,提升普惠金融服务能力,更好地实现商业银行社会责任。比如对中小微企业信贷评审时,通常面临数据稀缺、不全面、历史信息沉淀不足等问题,商业银行难以识别业务风险,导致业务增长缓慢。通过应用隐私计算技术,商业银行与政府部门、保险公司、运营商等实现数据隐私共享,联合训练贷前、贷中评估模型,精准识别高危用户从而避免风险,快速发现优质中小微企业完成拓客,同时支持业务开展动态管理,动态调整信贷额度,协助推进“敢贷、愿贷、能贷、会贷”长效机制发挥实效。
在反诈骗方面。近年来,电信诈骗新型违法犯罪花样不断翻新,在金融场景,用传统的基于专家经验的方法往往具有滞后性的问题。电诈风险中主体牵涉面广,包括政府、公安、监管单位、银行金融机构、非银金融机构、运营商、互联网服务提供商等,而各主体之间信息独立,难以形成闭环管理。而这个特征,往往会被犯罪集团利用,跨平台、跨机构、跨行业实施诈骗。依托隐私计算平台,完成各责任主体数据共享,建立账户、交易、设备、网络以及位置多维的数据隐私共享网络,联合共享黑名单,训练事前、事中反诈模型,即在账户开立阶段进行多方面核验,账户资金流转过程中实时预警,助力“断卡”行动从人工到智能的转变。
安全合规,推进互联互通标准化在积极共建数据要素共享体系的同时,商业银行应坚持监管规范和促进发展齐抓并举,严格遵守相关法律法规和各类监管标准规范,切实保障人民群众的合法权益,进一步提升商业银行服务体验。
1.依法合规,严格落实数据使用规范
数据安全是数据要素市场建设的基本保障。近两年国家、监管、行业层面数据安全相关政策法规、规章制度也密集出台。据统计,我国现行有效的数据相关标准79条,其中2020年和2021年发布了23条。数据安全和保护法律法规的日益完善,为数据要素的有效保护和合法利用提供了制度保障。
然而,使用隐私计算相关技术对个人信息进行加密处理,是否符合“去标识化”“匿名化”的相关要求,目前尚未明确界定。在现阶段的具体实践中,商业银行应确保遵守“4法1条例1办法”的相关规定,采取用户明示授权等方式确保合法实施数据要素共享,切实保障数据要素应用全流程合规。
2.积极探索,加快技术标准规范建设
数据要素市场依赖于数据要素共享生态,而生态的建立依赖于规模效应,这要求在数据产生、加工、使用、流通等环节中数据管理的规范化和技术体系的标准化。当前隐私计算行业技术体系仍不统一,相关技术标准、规范缺失。各商业银行、行业厂商应在监管机构的统一指导下,规范数据流通关键标准、建设开源技术,尽快解决数据要素规模流通问题。
中国银行积极参与并推进隐私计算关键技术和相关标准建设。2021年,牵头完成北京金融科技产业联盟组织的《联合建模关键技术研究报告》,参与《联邦学习技术金融应用规范》的制定及《基于联盟链技术的隐私保护金融应用研究报告》《联邦学习金融应用白皮书》《多方安全计算金融应用白皮书》等白皮书的撰写工作。同时在隐私计算开源治理工作贡献力量,2021年我们加入FATE开源社区技术委员会,参与开源治理工作,2022年参与《FATE开源框架金融行业技术应用报告》编写,持续为隐私计算开源体系建设贡献实践经验。
展望未来,携手共建数据要素生态当前隐私计算相关技术已经从概念验证阶段步入商业落地阶段。随着各商业银行数据治理体系逐步健全,主流隐私计算平台能力不断完善,相关场景实践将快速展开,建议数据要素共享生态参建各方应协力从以下几点持续推进。
坚持数据合规性。当前在隐私计算实践中,能否很好地落实法律最小化原则、是否能显著降低数据泄露风险较难把握。商业银行需结合应用场景针对分析,以确保符合各项法律法规和监管政策要求。
完善技术理论。隐私计算部分技术仍然不够成熟,原始数据被复原、模型泄漏、参与方违背公约等问题仍可能导致数据泄漏。各应用行业特别是商业银行,对隐私计算的认可度和信任度仍然不足,各方应尽快攻关关键技术理论,确保数据和模型安全。
提升计算性能。基于隐私计算相关技术原理特点,模型性能较明文机器学习模型存在较大差距,也是实际应用的障碍之一。目前部分隐私计算平台已经可以支持亿级数据的计算,高并发XGB算法建模效率相比之前可提高至少50%。但与很多重要场景要求仍有一定差距,未来性能方面仍需持续提升。
建立行业标准。各厂商平台在技术架构、协议、算法等方面仍未达成统一,异构平台之间无法有效协作,导致出现了“数据群岛”和“计算孤岛”的问题。建议加快底层技术研发实现互联互通,并通过营造合作生态实现互联互通。
结 语综上所述,依托国家政策大力扶持、监管机构引领指导、各行业积极探索、专业厂商持续投入,数据作为“第五种关键生产要素”,其内在价值必将持续深入挖掘,战略定位也将愈发突出。数据要素新生态建设正逢其时。
商业银行信息化程度高、数据要素密度大、数据要素质量好,具有天然的数据要素资源属性禀赋。充分挖掘数据要素的价值,特别是建立跨领域、跨层级、跨行业的数据要素生态对商业银行经营管理意义重大,未来商业银行势必将会成为数据要素新生态的关键节点。我们将认真落实国家建设数据要素市场的全局规划,积极发挥社会责任,在监管部门的指导下,与各方协力共建我国数据要素共享生态,助力打造数字经济深化发展的核心引擎!
(栏目编辑:张丽霞)