看研报 您所在的位置:网站首页 54188-14588 看研报

看研报

#看研报| 来源: 网络整理| 查看: 265

金融信息化研究所:隐私计算金融应用白皮书(2022)(135页).pdf

本白皮书版权属于北京金融信息化研究所有限责任公司,并受法律保护。转载、编摘或利用其他方式使用本白皮书文字或观点的,应注明来源。违反上述声明者,将被追究相关法律责任。主主任:任:潘润红副主任:副主任:黄程林、庄文君编委会成员编委会成员(排名不分先后,按姓氏拼音排序(排名不分先后,按姓氏拼音排序):陈起、方兴、龚光庆、黄登玺、寇冠、李晓敦、李肇宁、万化、王超、王健宗、王铿、王磊(太保)、王磊(蚂蚁)、王平、巫锡斌、吴择金、许宝东、应志伟、俞枫、喻华丽、詹志辉、赵焕芳编写组成员编写组成员(排名不分先后,按姓氏拼音排序(排名不分先后,按姓氏拼音排序):鲍力成、陈晨、董琦、冯浩、傅杰、高海隆、高靓、葛明嵩、胡祎然、黄小芮、黄章成、孔宇飞、李成、李泽远、梁腾文、廖旺胜、刘剑、刘静、钱江、盛沛、时煜坤、史春奇、陶建萍、万琳、王锋、王光中、王秋卉、王雪黎、邬佳伟、吴鑫涛、武竞、徐崚峰、薛祥杰、叶茂城、赵可、郑植、周建平、朱明杰执笔人执笔人(排名不分先后,按姓氏拼音排序(排名不分先后,按姓氏拼音排序):鲍思佳、王帅强主编单位:主编单位:北京金融信息化研究所中国工商银行股份有限公司中信银行股份有限公司中国光大银行股份有限公司上海浦东发展银行股份有限公司平安科技(深圳)有限公司蚂蚁科技集团股份有限公司参编单位:参编单位:中国农业银行股份有限公司中国银行股份有限公司中国建设银行股份有限公司交通银行股份有限公司招商银行股份有限公司兴业银行股份有限公司兴业数字金融服务(上海)股份有限公司深圳证券交易所国泰君安证券股份有限公司中信证券股份有限公司中国人寿财产保险股份有限公司中国太平洋保险(集团)股份有限公司泰康保险集团股份有限公司海光信息技术股份有限公司蓝象智联(杭州)科技有限公司杭州金智塔科技有限公司数字经济时代,数据已成为关键生产要素,具有重要战略资源地位和核心科学决策作用。在数据融合计算需求激增和数据安全保护趋严的背景下,隐私计算技术作为保障数据融合使用过程中数据隐私安全的有效技术手段,成为金融数据流通领域的主要探索方向。金融机构已经从产业侧、应用侧和产学研用生态三个维度开展隐私计算技术在技术发展、平台建设、场景实践、检测认证等方面的应用探索。随着隐私技术应用领域不断拓展,实际应用中出现了融合多项技术的组合方案,更好地满足多样化业务需求。隐私计算技术在金融业应用还处于初期探索和应用试点阶段,仍面临法律合规风险高、公共基础设施不完善、示范效应和规模化应用场景欠缺、赋能金融业务不明显、异构平台互联互通难等诸多挑战,亟需完善隐私计算金融应用合规指南,提升技术性能和标准化服务水平,建立科学合理的安全性度量体系,鼓励大型金融机构对外输出互联互通能力,共享行业应用实践与先进经验,切实提升金融业隐私计算应用安全水平。一、概述.1 1二、隐私计算技术发展现状.2 2(一)多种技术繁荣发展.2(二)技术融合发展与应用.4(三)隐私计算安全验证方式及主流平台.6三、金融机构积极探索隐私计算的应用与实践.1515(一)逐步开展隐私计算平台建设.16(二)通过隐私计算融合不同渠道的数据.18(三)不断探索隐私计算应用场景.21四、隐私计算金融应用生态不断完善.2525(一)推进异构平台互联互通,避免形成“计算孤岛”.25(二)技术与数据协同引入,快速实现外部数据链接.28(三)开展标准检测认证,保障隐私计算金融应用安全.29五、隐私计算在金融业应用面临的风险与挑战.3030(一)金融应用面临合规风险.30(二)技术与产品性能和安全性亟需提升.32(三)金融应用基础设施有待完善.35(四)示范效应和规模化应用场景欠缺.37(五)异构平台互联互通仍存在障碍.38六、多措并举推动隐私计算在金融业合理合规地应用.3939(一)强化隐私计算金融应用的顶层设计.40(二)以应用促进隐私计算技术与产品性能和安全性提升.41(三)探索建立金融业共享共用的隐私计算基础设施.42(四)积极推广试点示范与可规模化应用的场景.43(五)大力推动隐私计算异构平台的互联互通.43风险防控一:隐私计算应用企业评分授信.45风险防控二:基于多方安全数据分析平台的金融反诈应用.48风险防控三:基于纵向联邦学习技术建立个人信贷风控模型.52风险防控四:基于多方安全知识图谱计算的中小微企业融资服务.54风险防控五:基于多方安全计算的图像隐私保护.56风险防控六:基于隐私计算实现集团内反洗钱名单数据共享.59风险防控七:基于区块链的行业黑名单共享研究与应用实践.62风险防控八:长尾客户小额信贷场景的多方安全计算信用风险预测.71风险防控九:基于多方安全计算的全链路联合风控助力普惠金融.74风险防控十:基于隐私计算的金融反欺诈联防联控平台.79风险防控十一:基于隐私计算的小微商户普惠金融服务.85风险防控十二:隐私计算安全融合政务数据赋能银行智能风控实践.89精准营销一:隐私计算技术在集团内的数据安全保护实践.101精准营销二:基于隐私计算技术的第三方支付机构营销推荐.104精准营销三:基于多方安全计算平台实现高净值客户价值倍增.106精准营销四:基于隐私计算的银行保险用户联合营销.107精准营销五:基于隐私计算的精准营销获客.109产品创新与其他一:基于隐私计算和区块链的财富管理精准服务.112产品创新与其他二:基于隐私计算的内外部数据融合研究与应用.117产品创新与其他三:泛金融之理赔调查场景中多方安全分析的应用.123图表 1“隐语”框架分层总览.9图表 2 PrivPy 多方安全计算平台功能架构总览.12图表 3 GAIA 产品架构图.13图表 4 金智塔框架分层总览.15图表 5 白盒组件示意图.27图表 6 黑盒组件示意图.281在数字经济时代,数据作为最活跃的生产要素,已经全面融入经济价值创造,对生产力发展、生产关系变化产生深远影响。近年来,国家深入布局数字经济战略,加快培育数据要素市场,数字经济规模逐年增加。“十四五”数字经济发展规划 提出“数据要素是数字经济深化发展的核心引擎,要建立数据要素市场体系,充分发挥数据要素作用,加快数据要素市场化流通”。关于构建数据基础制度更好发挥数据要素作用的意见指出“完善数据要素市场化配置机制,扩大数据要素市场化配置范围和按价值贡献参与分配渠道”。数据要素进入价值创造的新阶段,数据流通中的数据安全和隐私保护问题日益凸显。随着数据安全法个人信息保护法 征信业务管理办法等法律法规和管理办法落地实施,数据合规与隐私保护已成为企业的一项重要任务。金融业是数据密集型行业,具有丰富多样的业务场景。数据要素流通为金融数字化转型带来全新机遇。在数据融合计算需求激增和数据安全保护趋严的背景下,隐私计算技术作为保障数据融合使用过程中数据隐私安全的有效技术手段,成为金融数据流通领域的主要探索方向。金融科技发展规划(2022-2025 年)提出“要积极应用多方安全计算、联邦学习、差分隐私、联盟链等技术,探索建立跨主体数据安全共享隐私计算平台,在保障原2始数据不出域前提下规范开展数据共享应用”,为金融机构利用隐私计算技术实现数据共享提供了方向和指引,推动金融机构在隐私计算领域的布局和应用。数据作为生产要素,流通的不是数据本身,而是其计算价值。随着数据流通和数据隐私保护并重的产业需求愈发旺盛,隐私计算技术或将成为数据要素化时代的关键技术,推动传统数据合作模式变革,保障数据流通安全可控,释放数据要素价值。(一)多种技术繁荣发展(一)多种技术繁荣发展隐 私 计 算 技 术(Privacy-PreservingComputationTechnologies)是一类技术的统称,保证数据在不透明、不泄露的情况下完成处理和计算。主流隐私计算技术包括多方安全计算(Multi-Party Computation,MPC)、联邦学习(FederatedLearning,FL)和可信执行环境(Trusted Execution Environment,TEE)等。这些技术的技术原理、安全假设、应用方向各不相同,通过在不同金融场景的探索实践,形成了隐私计算产业的基础支撑。多方安全计算多方安全计算的基本理论首先由华裔计算机科学家、图灵奖获得者姚期智教授于 1982 年提出。通过多方安全计算协议,各参与方的数据能够在密文状态下共同完成特定的函数计算,并具备计算结果的一致性。多方安全计算的安全性基于对密码学的信3任,将数据的使用权从其控制权中分立出来,在实现计算价值的同时保障原始数据的安全,具有较为完备的理论基础。多方安全计算具备计算精确、通用性高的优点,依赖秘密分享、混淆电路和不经意传输等技术,构建一系列基础运算操作,实现多方原始数据密文状态下的协同计算,可以用于联合统计、隐匿查询、隐私求交等多方数据的通用安全联合计算分析服务。多方安全计算技术的代表性产品或平台有华控清交 PrivPy 平台、光大银行多方安全计算平台等。联邦学习联邦学习的基本理论由谷歌公司于 2016 年提出,原本用于解决安卓手机终端用户在本地更新模型的问题。联邦学习是一种分布式机器学习框架,每个参与方的原始数据仅在本地模型训练,通过交互迭代的中间计算结果,不断优化全局模型,达到“数据可用不可见”的目标。根据联合建模场景需求,联邦学习可以分为三类,横向联邦学习、纵向联邦学习、联邦迁移学习。联邦学习的安全性基于对统计学的信任,侧重多方数据的分布式机器学习模型训练和推理,可以提供联邦特征工程、联邦统计探查、联邦建模等服务。在整个联邦学习过程中,各训练参与方的数据始终保存在各自的本地服务器,解决了传输本地存储数据受限的问题,也减少了数据集中化带来的风险。联邦学习代表性企业和产品有微众银行 FATE、瑞莱智慧 RealSecure 等。可信执行环境可信执行环境是由软硬件组建的一个独立的安全区域,具有4运算和存储功能。可信执行环境的安全性基于对硬件的信任,用硬件来保障数据机密性、数据完整性和代码完整性。各参与方数据以加密形式进入可信执行环境后,被解密为明文进行计算,只有经过授权的代码才能访问数据,即使是使用调试器,也无法从外部查看数据或者执行操作。在可信执行环境中进行机密计算,可实现包含传输、存储、计算在内的数据隐私保护。可信执行环境不仅能够无缝支持通用计算框架和应用,而且计算性能基本可以匹敌明文计算。可信计算代表性企业和产品有蚂蚁自主可控TEE HyperEnclave、海光 CSV、机密计算联盟开源项目 Occlum等。(二)技术融合发展与应用(二)技术融合发展与应用隐私计算技术各有特点,单一技术难以满足所有场景需求。随着隐私技术应用领域不断拓展,实际应用中出现了融合多项技术的组合方案,更好地满足多样化业务需求。1.1.多种隐私计算技术融合多种隐私计算技术融合联邦学习与密码学协议、可信执行环境有机结合,减少中间计算结果暴露原始数据的可能性。联邦学习交换的中间计算结果能够被用来逆推原始数据,存在数据隐私泄露的风险。目前,保护中间计算结果安全的方式主要有两种:一是将联邦学习与同态加密、秘密分享等密码学技术相结合,对每轮迭代出的参数或梯度等中间结果进行加密,实现更加安全的联邦学习聚合算法;二5是将联邦学习与可信执行环境相结合,由可信执行环境代替联邦学习中的参数服务器,完成全局模型的迭代优化,提升数据隐私保护力度。可信执行环境与多方安全计算有机结合,实现可信环境下的密文计算。可信执行环境基于硬件机制构建了一个安全的计算区域。可信执行环境与多方安全计算技术相结合,在可信环境中完成数据在密文状态下的直接计算,既可以降低供应链攻击和侧信道攻击等造成的数据隐私泄露风险,提升计算安全性,又可以降低多方安全计算跨网节点的通信瓶颈影响,提高计算效率,打造安全可控的隐私计算软硬件一体机。2.2.隐私计算与区块链隐私计算与区块链隐私计算与区块链技术相辅相成,为实现数据价值共享提供了一套更加完整且严密的解决方案,实现更广泛的数据协同。隐私计算借助区块链技术,实现对计算任务的存证,提升数据共享协作效率。隐私计算应用过程中面临数据难验证、多方难互信、多方难协作等问题。隐私计算结合区块链技术实现对智能合约内容及计算任务的全流程存证,解决数据共享参与者身份及数据可信问题,便于后续的回溯、审计和追责,一定程度上避免主观作恶、合谋推导、数据造假等问题的发生。另外,数据持有者将共享数据目录、数据使用申请、数据使用审批、数据使用审计等功能上链,提升数据共享协作效率,降低隐私计算应用成本。6区块链通过隐私计算技术保护链上数据安全,以适应更多应用场景。比如对区块链上所有的用户余额和交易金额进行同态加密,除了拥有私钥的可信第三方机构外,所有节点都只能验证交易而无法得知具体数值,从而有效保护用户的账户隐私。同态加密技术还可以在保证数据隐私性的前提下,完成区块链共识算法同步或智能合约执行。此外,上链过程中的私钥签名环节可以放入可信执行环境执行,防止用户私钥泄露或签名过程被篡改,从而为整个区块链网络提供安全性保障。3.3.隐私计算与知识图谱隐私计算与知识图谱利用联邦学习保护用户隐私信息,构建知识图谱的联邦融合与推理。知识图谱本质上是一种概念网状图,将实体、概念及其之间的关系链接起来,构建机器的先验知识,用于智能搜索、深度问答、智能决策等场景任务推理。目前,知识图谱的应用大多是基于单一完整图谱的理想状态进行设计的,但在实际应用场景中,构成知识图谱的要素往往散落在不同的机构或个人手中,由此形成一个个数据孤岛。仅基于自身数据体系构建的知识图谱推理准确率往往较低。通过联邦学习技术,在不泄漏各参与方数据的前提下,对多个参与方知识进行归纳抽象、联邦融合,最终完成协同知识联邦推理,形成更为完整的知识图谱。(三)隐私计算安全验证方式及主流平台(三)隐私计算安全验证方式及主流平台隐私计算是保护数据隐私的重要技术手段,针对隐私计算技7术在金融业应用的安全性和可靠性的研究和验证,对推进我国数据生态整体建设具有十分重要的意义。常见的隐私计算技术产品安全性验证方法有三种:一是基于密码学算法的验证,隐私计算协议原理公开可循,算法发表在知名的期刊或会议中,有详细、完整的安全证明。二是基于密码及安全标准的验证,将底层密码模块的安全参数对标国内国际标准。三是基于行业规范及专业测评认证的验证,遵守中国人民银行发布的多方安全计算金融应用技术规范等规范要求,参与北京国家金融科技认证中心、国家金融科技测评中心等机构关于隐私计算金融应用领域的测评认证。数据融合应用是释放金融创新活力和数据价值潜能的重要前提。科技企业正积极构建隐私计算平台,推动数据融合共享,助力业务数字化发展。目前,开源隐私计算平台主要有“隐语”开放平台、FATE 开源隐私计算框架等,闭源隐私计算平台主要有 PrivPy 多方安全计算平台以及 GAIA 统一业务智能平台、金智塔隐私计算平台等综合类隐私计算平台。1.1.“隐语隐语”开放平台开放平台“隐语”开放平台是基于开源框架的隐私计算一站式可视化操作平台。该平台经蚂蚁集团内部金融风控、联合营销等业务场景的长期打磨,旨在联通技术到应用的最后一公里。安全保障方面,“隐语”引擎中实现的密码学相关算法算子8均已发表在国际知名密码学/安全/隐私会议或者期刊中,例如ACM CCS、Usenix Security、Crypto,引擎中涉及的密码学算法均有详细、完整的安全证明。“隐语”底层密码模块的参数选择参考了 NIST 国际标准,保证了至少 112bit 的计算安全参数以及30bit 的统计安全参数。联合项目参与方可通过“隐语”的 CCL前置安全配置功能,在 MPC 相关技术能力支撑下,对数据资产进行分级分类,并通过前置配置来保护安全级别高的敏感数据,保证多方隐私数据在计算过程中不泄漏。“隐语”框架提供标准化网络管理能力,项目参与方可通过“隐语”框架的节点网关,自主管控本方节点的通讯策略。在网关之间建立可信授权并采用https 作为通讯信道是“隐语”对跨节点通信的前提。“隐语”技术符合中国人民银行发布的多方安全计算金融应用技术规范,并获得国家金融科技测评中心首批金融应用技术测评认证,满足安全、合规需求。功能方面,“隐语”开放平台提供组件化数据分析和机器学习工具,使得隐私计算技术的应用更为简便直观,满足金融全链路中不同类型参与方的多种功能需求,具备适配不同场景利用数据要素的灵活性、安全性、自主性和规模性。算法逻辑方面,“隐语”开放平台基于“隐语”开源框架建设。“隐语”框架通过密文计算设备对多种技术进行抽象,支持所有主流的隐私计算技术,通过分布式引擎执行调度,满足多样9化场景的灵活组装需求,基于多方安全计算、联邦学习、可信执行环境提供多种技术模式的隐私保护 AI&BI 算法。图表 1“隐语”框架分层总览实践方面,该平台已有应用项目落地,比如保险理赔领域,好医保基于“隐语”MPC SQL 多方联合分析专用语言,构建了健康险定制多方数据联合分析解决方案,覆盖了全国案件占比 50%省份的官方合法来源医疗数据,提升核赔效能。2.FATE2.FATE 开源隐私计算框架开源隐私计算框架FATE(Federated AI Technology Enabler)是联邦学习工业级框架开源项目,已广泛应用在金融、医疗、零售等多个行业,是国内最大的联邦学习开源社区。FATE 项目使用多方安全计算和同态加密技术,构建底层安全计算协议,支持不同种类的机器学习安全计算,包括逻辑回归、树算法、深度学习和迁移学习等,为上层联邦算法组件提供灵活适配的安全协议,并支持协议可插拔。10FATE 可以提供从模型研发到生产各阶段的一整套联邦学习隐私计算应用方案。开发者能够以较低的集成成本使用 FATE 能力。FATE 一站式解决方案包含联邦学习算法库、联邦调度引擎、联邦可视化组件、联邦在线服务框架、联邦计算引擎和联邦云等多个功能模块,底层支持多种安全计算协议。FATE 支持在多种计算引擎进行部署,通过星型架构和点对点连接两种网络连接方式,适配不同场景需要。2021 年 3 月,FATE 社区牵头的首个联邦学习国际标准 IEEEP3652.1GuideforArchitecturalFrameworkandApplication of Federated Machine Learning发布。4 月,微众银行 AI 团队和富数科技隐私计算团队联手破解了不同联邦学习平台之间互联的技术难题,在行业内第一次实现了异构联邦学习平台的互通。7 月,FATE TSC 发起成立互联互通工作组,初始成员包括来自工商银行、农业银行、建信金科、微众银行、光大科技、中国电信等 TSC 成员,旨在以安全便捷的方式实现不同联邦学习平台间的互联互通。3.PrivPy3.PrivPy 多方安全计算平台多方安全计算平台PrivPy 多方安全计算平台是企业级、行业级、行业间数据共享融合基础设施平台。该平台为各领域的数据安全共享场景提供支撑。安全方面,PrivPy 平台在工程化实践中已获得银行卡检测11中心颁发的多方安全计算金融应用评测证书、中国信息通信研究院颁发的基于多方安全计算的数据流通产品和基于联邦学习的数据流通产品等证书。相关测评依据分别为 JR/T 0196-2020多方安全计算金融应用技术规范、BDC 41-2020基于联邦学习的数据流通产品 技术要求与测试方法、BDC-58-2021隐私计算联邦学习产品性能要求和测试方法和金融场景隐私保护计算平台测评规范等。功能方面,PrivPy 平台集成秘密分享、混淆电路、不经意传输、同态加密及联邦学习等多种隐私计算技术,提供超过 400个密文函数和算法,能够执行隐匿查询、隐私集合求交、联合统计和联合建模等功能,支持灵活对接多种数据源,定制化开发适配各种业务场景,具有安全可控、通用易用等特点。架构方面,PrivPy 平台采用分布式技术架构,数据、算法、算力和控制面层层解耦,实现调度系统、计算引擎、数据服务的弹性扩展,支持中心化监管,实现整个计算过程和数据使用方式的存证。性能方面,PrivPy 平台支持千万级数据分钟级联合建模,秒级联合统计和匿踪查询,可平滑扩展到亿级数据的多方安全计算。平台支持同城跨机房负载均衡双活部署,机房和服务器出现故障时,业务可以自动无缝切换。12图表 2 PrivPy 多方安全计算平台功能架构总览实践方面,PrivPy 多方安全计算平台已落地案例包括光大银行多方安全计算平台、中国互联网金融协会个人合格投资者认证平台、上海通联金融银行卡联合风控平台等,为金融业依托数据融合实现产品创新及数据生态建设提供技术支撑。4.4.蓝象智联蓝象智联 GAIAGAIA 隐私计算平台隐私计算平台蓝象智联自主研发的“GAIA 隐私计算平台”提供金融级隐私计算服务,支持联邦学习和多方安全计算的全流程研发、部署、服务能力。“GaiaX 隐私计算联盟共享平台”通过多方安全计算技术,在核心数据不出库的情况下,实现数据的实时共享,快速构建隐私计算私有化联盟网络并开展联盟内的多方业务合作,集数据资产全生命周期管理、多模式组网、数据资产交易与计量计费、实时隐私计算与查询服务为一体。“GaiaC 数据要素可信流通平台”基于“数据可用不可见”的可信流通技术,实现在业务13场景下的数据要素可信流通。平台提供数据流通全生命周期管理能力,实现数据要素到数据要素产品化,再到数据要素应用价值化的可信流通闭环。GAIA 隐私计算平台基于同态加密、秘密分享等密码学“底座”,实现上层多方安全计算、联邦机器学习等应用。其中,GAIA平台采用的加密算法包括 paillier 半同态加密、CKKS 全同态加密、基于椭圆曲线的加密/签名、秘密分享、RSA、AES、SM2、SM3和 SM4 等,均为国密标准或者成熟安全算法。GAIA 隐私计算产品是首批通过信通院联邦学习安全评测的产品,共通过 12 大项、50 个 case 的评测,获得 BCTC-多方安全计算金融应用测评证书、BCTC-联邦学习金融应用测评证书等一系列国内权威机构的认证证书,并通过信息系统安全等级保护第三级认证。图表 3 GAIA 产品架构图GAIA 系列产品具备六大优势。一是沉浸式分析/建模体验,满足业内对于灵活易用的需求,迁移成本较低;二是实现安全审14计、流程合规等安全内容产品化;三是 MPC/FL 性能优异,亿级PSI2 分钟内完成,强限速条件下,百万数据 10 分钟附近完成建模;四是分层架构易集成,已在包括工行在内的多家大行集成上线;五是互联互通,完成多开源平台的黑盒互通,是银联的“白盒”互联互通项目的核心承建方;六是支持国产化兼容,包括ARM 兼容、麒麟兼容。5.5.金智塔隐私计算平台金智塔隐私计算平台金智塔隐私计算平台融合了多方安全计算、联邦学习、区块链、数字水印等技术,提供了数据确权、分级分类、质量审计、应用存证等功能。金智塔隐私计算底层基于同态加密、秘密分享等底层密码学原语,其安全性基于大数的质因子分解难题、离散对数问题等数学难题,上层模型在半诚实的假设下均满足计算安全性和统计安全性。平台安全性通过中国信通院的联邦学习安全专项评测和多方安全学习安全专项评测、国家金融科技评测中心的多方安全计算金融应用测评。金智塔隐私计算平台构建了去中心全对称分布式架构,支持混合协议联合 SQL,采用大规模、分布式并行架构并内置多模态异构计算引擎,亿级隐私求交性能极大提升,并以算法模块化、插件化的形式接入不同平台,实现隐私计算平台互联互通,全面保障数据价值安全释放。15图表 4 金智塔框架分层总览金智塔隐私计算平台基于联邦学习和隐私计算两大技术路线,不仅支持多节点数据联合计算,还支持单节点数据安全计算。该平台实现了数据可用不可见、用途可控可计量,具有高安全、高性能、高扩展、高互通四大优点,已通过中国信通院可信隐私计算基础能力、性能、安全系列评测,央行国家金融科技检测中心的多方安全计算金融应用评测,公安部安全认证以及华为鲲鹏认证。平台已在数字政务、智慧金融、智慧产业等场景打造了数十个成功应用案例,其数字政务、智慧金融领域的应用实践分别入选了中国信通院 2022 大数据“星河”奖项的标杆案例和优秀案例。目前,金智塔隐私计算平台已在风控、营销、监管等多个金融场景中实践应用。金融机构积极探索利用多方安全计算、联邦学习、差分隐私等技术,在保障原始数据不出域的前提下,有序推进金融数据共16享。根据调研数据1发现,超过 60%的金融机构已经具备在原始数据不出域的前提下规范开展数据共享的能力,并制定了相应的管理办法和制度。有 50%的金融机构正在积极开展隐私计算技术的研究,并探索隐私计算在金融业的应用场景。随着隐私计算技术的不断发展,有 15.7%的金融机构在过去两年建立了数据安全和数据隐私管理机制,近 7%的金融机构搭建了企业级的隐私计算平台,并在多个领域开展隐私计算技术成果试点应用。(一)(一)逐步开展逐步开展隐私计算平台建设隐私计算平台建设金融机构基于自身业务发展需求,在满足数据监管合规的前提下,积极建设多方安全计算、联邦学习隐私计算平台,研究布局可信执行环境,打造隐私计算服务能力,提供基础数据服务和基础业务服务。从金融业应用实践看,隐私计算平台建设主要包括自建、共建、行业级三种不同模式。一是自建隐私计算平台一是自建隐私计算平台。基于金融行业的特殊属性和强监管要求,国有大型商业银行和股份制银行、大型证券机构、大型保险机构普遍采用自建的方式建设隐私计算平台,通过自研与商用技术或产品相结合的方式,打造定制化的综合性隐私计算平台,与现有金融业务系统对接,围绕客户服务、风险管控、运营管理等领域开展探索实践。1调研数据:行业调研数据共包含 237 份有效调研反馈,调研机构包括国有大行、股份制商业银行、城市商业银行、省联社、农村商业银行、证券业机构、保险业机构、非银支付等代表性金融机构。全文数据分析基于每个调研问题的有效反馈计算百分比,数据最终解释权归金融信息化研究所。17专栏一 自建隐私计算平台工商银行按照多方安全计算、联邦学习和可信执行环境三个方向进行隐私计算技术体系规划,通过商用产品结合自研的方式建设了联邦学习、多方安全计算技术平台,赋能全行业务创新发展,对外提供联合统计、隐私求交、联邦特征工程、联邦建模等服务。中国人寿财险基于多方安全计算、联邦学习技术建设隐私计算平台,以数据可用而不可见的安全方式促进保险公司内外部数据智能生态共建,在安全合规的前提下开展联合风控、联合营销、精算定价等业务。二是共建隐私计算平台二是共建隐私计算平台。联邦学习、多方安全计算、可信执行环境等隐私计算技术涉及统计学、密码学、人工智能算法等底层技术研发,技术复杂,应用难度大。由于科技投入不足、科技人员少等因素,金融机构建设自有的隐私计算综合性平台存在困难。但在监管机构、行业协会或第三方支付机构的主导下,以某一业务领域为切入点,多家金融机构共同参与,共建隐私计算平台。共建模式一般采用同一技术路线或科技服务提供商,以确保平台之间的互联互通,合力探索隐私计算在金融业务领域的应用。专栏二 共建隐私计算平台深交所基于深证金融区块链平台,联合国泰君安、长江证券、东吴证券、兴业证券、招商证券、广发证券、国信证券等 7 家市场机构成立了联合课题组,以共建共享为原则,提出了基于区块链的18行业数据共享的解决方案。三是行业级隐私计算平台三是行业级隐私计算平台。金融行业高安全级、生产级的通用隐私计算服务平台是一项需要标准规范、场景需求、技术支持等多方视角融合共建的工程。部分金融关键信息基础设施运营单位在积极规划布局行业级数据共享与隐私计算公共服务平台,探索定制面向金融机构的数据共享服务,但目前普遍没有开展实质性业务。专栏三 行业级隐私计算平台深圳数据交易公司联合 50 家国家单位、智库、高校、大型金融机构、互联网公司共同成立开源社区,旨在集结开源社区内的各方力量共建自主可控、互联互通的开放群岛隐私计算平台。但该平台建设还处于规划布局与部分功能测试验证阶段,还未提供实质性的平台化数据服务。金融机构通过自建、共建、行业级等多种建设模式,不断夯实金融业数据安全与共享基础设施建设的基础,助力提升金融业数据流通与共享水平。(二二)通过通过隐私计算隐私计算融合不同渠道的数据融合不同渠道的数据金融机构利用隐私计算技术探索数据融合应用,赋能金融业务创新发展。融合数据的渠道主要包括集团内部、金融同业、跨行业三种方式。19一是企业级数据共享一是企业级数据共享。金融机构普遍优先采取在集团内部实现数据共享的方式。根据集团子公司、分支机构业务场景的不同需求,利用隐私计算技术协同集团内部的数据资源,赋能子公司业务的发展。另外,隐私计算技术能够链接各部门、各子公司的数据,实现集团数据并表,显著提升集团监管合规能力。专栏四 企业级数据共享农业银行利用隐私计算技术,联合统计总行和境外分行的信用总账,实现集团数据内部共享。建设银行使用自建隐私计算平台,先后探索建设银行同建信基金、建信人寿等子公司间、不同法人主体下数据共享使用的隐私计算场景挖掘和落地,有效提升基金产品的营销效果。兴业银行应用隐私求交多方安全计算技术,实现集团内母子公司间的反洗钱信息合规共享,保证各法人实体能且只能获取所辖客户范围内的风险信息,提升反洗钱工作准确性,实现了集团内风险联防联控。二是行业级数据共享。二是行业级数据共享。金融机构着眼于贷后资金流向分析、反洗钱可疑交易分析、电信网络诈骗识别等金融业风险联防联控业务领域,通过隐私计算技术实现跨机构的行业信息共享和互联互通,有效提升监管能力和水平。在金融监管类场景中,随着参与的金融机构数量不断增多,模型训练效果不断优化,训练结果越趋近于资金流转全貌,参与机构的边际成本不断降低,具备未来大规模推广应用的潜力。20专栏五 行业级数据共享农业银行某分行进行多方安全数据分析联合实验室建设,通过与管理机构联合构建跨机构数据合规流通与融合使用的新型基础设施,覆盖了人民银行、公安部门、运营商、30 余家商业银行,应用于黑灰名单报送,反欺诈、反洗钱等场景,保障各方数据安全隐私,促进各家商业银行间数据合规融合与使用。蓝象与新网银行、银联共同搭建实时风控联盟平台,汇集实时且丰富的多头数据,提供精准且及时的贷前贷中风控能力,在各机构节点的授信额度和在贷余额数据不出域的情况下,完成联盟内成员中间的额度和余额共享。三是跨行业的数据共享三是跨行业的数据共享。跨行业的数据共享在金融场景中具有很高的应用价值。一般由具备行业公信力的第三方组织协同相关机构,通过隐私计算技术联合分析、联合建模,融合社保、税务、司法等政府公共数据,流量、资费等运营商数据与金融机构自身的客户信息、资产信息、产品持有信息、交易信息等数据,准确判断客户的信用情况,快速挖掘潜在客户。专栏六 跨行业数据共享海南大数据管理局与中国银行海南分行搭建的多方安全计算平台,将海南大数据管理局的公共数据资源接入到分行,服务分行消费金融场景,助力拓展客户群体,提升用户规模。浦发银行基于自建多方安全计算平台和引入开源算法库两种方21式,结合区块链存证技术,与保险机构、互联网公司进行跨机构、跨行业数据共享,实现补充完善用户画像,精准圈定目标用户的效果,赋能各类金融业务场景。(三)不断探索隐私计算应用场景(三)不断探索隐私计算应用场景隐私计算技术有效推动金融业数据共享,释放金融数据价值,在联合风控、精准营销、产品创新等领域探索应用场景,助力金融业更好地服务实体经济。通过隐私计算联合建模通过隐私计算联合建模,提升业务风险防控水平提升业务风险防控水平。联合风控包括信贷风控、信用评级、反欺诈识别、反洗钱监测、黑名单查询等细分场景。在信贷风控方面在信贷风控方面,大型商业银行应用联邦学习技术,将自有客户数据与非信贷场景的网络行为、社交数据、消费记录等多方数据融合,构建准确有效的风控模型,提前识别风险客户和可疑行为。在信用评级方面在信用评级方面,证券机构运用隐私保护技术,打通行业风险数据融合应用通道,完善投资者信用风险画像,避免向信用状况较差、违约风险较高的投资者提供融资支持。在反在反欺诈识别方面欺诈识别方面,针对用户重复投保、疑似客户欺诈、疑似代理人欺诈等行为,保险机构利用多方安全计算技术构建行业黑名单库,在保护用户隐私的同时,集行业之力联防联控,打击行业欺诈群体,维护保险业市场秩序。在反洗钱监测方面在反洗钱监测方面,金融机构、第三方数据机构利用隐私计算技术进行联合建模,有效扩充反洗钱模型训练数据集,增强各机构间反洗钱工作的实时联动,提升金融22业反洗钱风险监测的准确性。在黑名单查询方面在黑名单查询方面,金融机构利用隐匿查询技术,在各方黑名单原始数据不泄露不出库、查询标的不暴露的情况下,实现对黑名单库数据的查询,联合同业机构安全“共享”黑名单,扩充自有黑名单系统,提升金融机构对客户的风险判断能力。专栏七 风险防控场景工商银行与工银瑞信通过纵向联邦学习技术实现在债券违约领域的联合建模,充分利用总行在企业及法人资金、偿债能力等方面的数据优势,提升债券违约预测能力。中国银行与中银消费金融有限公司建立行司联合风控模型,实现贷前审批模型建设,基于两方数据联合建模,生产客户评分,提升行司工作质效,丰富中银消费的风控数据维度。交通银行利用多方安全和知识图谱技术,融合运营商数据,为中小微企业提供画像分析,助力中小微企业贷款的精准投放,提升风险防控能力和客户贷款体验。浦发银行通过引入“隐语”隐私计算平台,实现基于多方数据的联合风控,大幅提升风险防控能力,并获得了 2021 IDC 金融技术应用创新奖。中国人寿财险利用隐私计算的匿踪查询功能进行数据安全查询,在保障查询数据不被外部机构探查的同时,保障外部机构被查数据的绝对安全。通过联合统计通过联合统计、隐私求交隐私求交、联合建模等联合建模等,提升客户营销能力提升客户营销能力。23由于金融业涉及的客群交易活跃、需求多样,精准营销对金融机构提升客户粘性、降低获客成本至关重要。隐私计算有助于解决数据维度不够丰富、关联企业间的数据共享渠道难以打通的问题,提升金融机构精准营销能力,加强客户价值挖掘。联合营销包括纳新拓客、存量客户营销、客户画像等细分场景。金融机构利用多方安全计算,在保障原始数据不出域的前提下,完成客户资产管理规模的结算与提升,增强客户粘性,降低获客成本。集团与子公司、总行与境外分行联合统计用户总资产,激活沉睡客户。另外,跨行业机构之间利用隐私计算技术,通过纵向联合建模,挖掘潜在用户和高净值客户,基于不同企业特点设计信贷、委托、贷款、政府贴息等专项金融产品,降低信息不对称的成本,实现产业链延伸、价值链提升、供应链贯通。专栏八 客户营销场景工商银行牡丹卡中心消费零售跨机构联合运营,运用多方安全计算技术,在数据不出机构的前提下,实现商户消费数据的联合计算,保障数据的确权及隐私安全。中国银行联合包括企业或个人用户上网行为、通话时长、话费余额、欠费次数等在内的运营商数据,进行客户智能营销。中信银行在信用卡消费场景中,联合外部运营商数据,拓展客户的信息维度,通过样本隐私求交、隐私统计分析、联合建模与模型预测的方式,挖掘潜在消费客户,完成客户信用卡提额营销。招商银行利用海量外部数据丰富用户画像,洞察客户需求,针24对性地进行客户营销,提升拓客效率。中信银行联合外部运营商数据,拓展信用卡客户通话、流量、资费等信息维度,通过联邦建模,挖掘潜在消费客户,完成客户信用卡提额营销。光大银行结合光大信托、光大保险的客户资产情况,统计光大银行客户在银行、信托和保险的总资产区间,挖掘集团高净值潜力客户。中国人寿财险与集团成员单位合作进行带标签的隐私求交,实现集团内部的标签共享,整合形成客户资产等级标签,用以综合评估客户资产水平,为各方推送高价值客户,提高展业质量,促进精准营销。利用多方安全计算融合政务利用多方安全计算融合政务、企业等多方数据企业等多方数据,提升金融产提升金融产品与服务的创新力度品与服务的创新力度。金融机构在原有金融服务的基础上,通过多方安全计算技术,融合多方数据资源,丰富金融机构数据标签维度,解决数据源单一、数据处理时效性差、数据信息整合分析困难等问题,实现多方数据联动,创新金融产品与服务,提高服务实体经济的能力。专栏九 业务创新场景工商银行与政府、驾校、驾培协会合作,利用多方安全技术联合政务、驾培协会等多方数据,建设安全便捷的珠海驾校资金托管系统,获取资金监管项目实时进度和状态并联合校验,实现精准高25效的监管资金结算,保障资金流转速度,提升资金安全程度,打造珠海驾校驾考资金数字化全流程管理平台。国泰君安证券基于隐私计算和区块链技术的数据共享方案,通过数据合作共享健全客户画像、挖掘客户需求、预测客户意图,为客户提供与自身风险承受能力和实际投资需求相匹配的财富管理服务,有助于提升客户服务体验,提高财富管理机构服务效率。某保险公司与蚂蚁保险科技合作,构建了基于理赔科技平台和隐私计算框架“隐语”的“理赔大脑”智能理赔系统,与其外部医疗数据 ISV 在原始数据不离开本地、数据价值有保护的前提下进行联合分析,有效发现阳性线索、降低错赔风险、提高理赔查勘效率。金融业具备丰富的数据基础、庞大的业务需求、领先的数据要素流通探索实践经验,是国家数据要素市场化配置改革的最佳实践地。金融机构、产业机构、研究机构等多方协同,不断完善隐私计算金融应用生态。(一)推进异构平台互联互通,避免形成(一)推进异构平台互联互通,避免形成“计算孤岛计算孤岛”当前隐私计算平台普遍为异构平台,技术实现原理差异较大,跨平台互联互通存在困难。隐私计算原本连接的“数据孤岛”容易演变成“计算孤岛”。此外,金融机构需要通过隐私计算平台链接不同数据提供方,这种方式容易导致系统重复建设和运维成本增加等问题。26金融机构逐步探索异构隐私计算平台间的互联互通,打通异构隐私计算平台间的技术壁垒。统一规范的接口协议和交互方式可以实现跨平台的数据、算法、算力的协同与互动,支持不同平台的用户共同完成同一计算任务。这种方式并不强制要求所有产品同质化、统一化,实现各方私有数据在不同底层技术平台之间流畅的传输和交互。目前,金融机构隐私计算平台互联互通普遍采用底层通用平台加上可插拔式算法组件的实现模式,算法组件包括白盒方式和黑盒方式。1.1.基于白盒组件实现互联互通基于白盒组件实现互联互通白盒组件是在核心算法步骤、关键参数交互流程完全一致的前提下,异构隐私计算平台通过对齐算法协议,自行开发实现的算法组件,支持跨平台互联互通网络协同完成隐私计算任务。白盒组件实现了算法级别的互联互通,优点是算法实现更加直观,安全性和可信度较高;缺点是一定程度上损失了算法的独立性,开发改造成本较高。比如农业银行的隐私计算平台已实现包括隐私查询、可信数据分析、联邦学习等多种隐私计算模式,通过与FATE 隐私计算平台的异构对接,围绕多方安全计算算法中的安全求交和联邦学习算法中的逻辑回归,基于轻量化中间件构建了可行解决方案,以最小改动代价实现对各平台“低耦合、可复制、易扩展”的异构互联互通。27图表 5 白盒组件示意图2.2.基于黑盒组件实现互联互通基于黑盒组件实现互联互通黑盒组件通过定义算法的基本信息、输入、输出,实现异构平台间的互联互通。这种方式并不定义算法本身,而是将核心算法作为一个黑盒,保护了平台内部的算法实现原理,使算法呈现出“算法插件”的形式。黑盒组件常以节点作为组成单元,使用同一平台管理页面和算法组件,或通过规定数据、项目、算法等统一接口,实现跨平台任务调度和算法实现。黑盒组件实现了节点级的互联互通,优点是操作较为简便,可灵活部署于不同隐私计算平台,并保持算法的独立性;缺点是算法的实现细节不可见,需要对平台或算法组件进行可信认证。比如招商银行的跨平台互联互通采用对等网络形态实现,全部由平台节点组成,平台节点以黑盒组件方式实现与富数科技、洞见科技等异构隐私计算平台的互联互通,对内向计算、数据等子节点分发、调度互联互通消息。跨平台互联互通的场景中不同隐私计算平台实现相同功能、承担相同角色,具备对等的地位。各平台能被其它对等平台直接访问而无需经过相关协调方,从而共同执行跨平台隐私计算任务。28图表 6 黑盒组件示意图(二)技术与数据协同引入,快速实现外部数据链接(二)技术与数据协同引入,快速实现外部数据链接构建隐私计算金融应用生态的核心是盘活数据资源、促进数据流通与共享,驱动力是隐私计算技术的发展和落地。在金融业的实际应用中,数据和技术常常被协同引入。1.1.跨行业跨机构数据共享需求驱动技术引入跨行业跨机构数据共享需求驱动技术引入金融业是数据密集型行业,金融机构对数据应用存在广泛的需求。同业机构、互联网公司、运营商、政府部门等数据提供方的数据可以拓展金融业务开展所需的数据维度,加速跨行业数据合作落地,促进金融业务创新。通过隐私计算技术引入外部数据,提高模型训练效果,已在金融业普遍形成共识。一方面,数据供给方通过与金融机构的长期合作,深入理解金融机构对数据的切实需求,除数据本身外,还通过特征工程生成各种衍生特征和综合评分类特征,更好地为金融机构提供数据服务;另一方面,在合规要求的约束下,数据供需双方积极探索基于隐私保护技术的数据安全流通形式,通过建设隐私计算平台或采用隐私计算科技公司提供的服务进行数据共享,一些数据源与特定的隐私计算产品会被绑定输出。292.2.隐私计算科技企业积极打造数据链接型的商业模式隐私计算科技企业积极打造数据链接型的商业模式金融机构与外部数据源的合作会引入隐私计算技术,保障数据流通安全。在这个过程中,隐私计算领域的科技企业起到了重要的辅助作用,帮助数据供需双方快速实现数据链接,一方面,科技企业向金融机构提供多方安全计算、联邦学习、可信执行环境等隐私计算技术的底座支撑。另一方面,科技企业也积极地与政府机构、运营商、互联网公司、数据交易所、征信机构等合作,通过隐私计算技术向金融机构提供数据源接入、场景建模等服务。同时,这种服务会衍生出数据分润和业务分润两种商业模式。数据分润模式以科技企业作为中间方,向金融机构提供数据源接入等服务,由数据提供方支付数据分润费用;业务分润模式是由科技企业提供数据产品调用服务,按照业务转化效果,比如获客量、交易量等维度,向金融机构收取业务分润费用。这两种商业模式或将成为隐私计算技术在金融业应用的主要运营模式。(三)开展标准检测认证,保障隐私计算金融应用安全(三)开展标准检测认证,保障隐私计算金融应用安全1.1.隐私计算金融应用标准规范逐步完善隐私计算金融应用标准规范逐步完善金融管理部门、行业协会、产业联盟等机构牵头制定并完善各类技术标准规范,更好地推动隐私计算技术在金融场景中安全与合规应用。中国人民银行牵头发布了金融业数据能力建设指引 多方安全计算金融应用技术规范等标准规范,从多方安全计算技术金融应用的安全、性能等方面提出明确要求,为金融机构开展金融数据利用工作提供全面指导。支付清算协会联合多30家金融机构、科技企业等基于 多方安全计算金融应用技术规范制定了多方安全计算金融应用评估规范,提出相应的测评要求和方法,为评测机构开展测试、评估、认证等工作提供依据。北京金融科技产业联盟正组织制定联邦学习金融应用技术规范、异构隐私计算平台互联互通团体标准等,为隐私计算金融应用的标准规范提供有益补充。2.2.隐私计算金融应用的认证力度不断加大隐私计算金融应用的认证力度不断加大北京国家金融科技认证中心、中国金融认证中心、国家金融科技测评中心等机构按照 多方安全计算金融应用技术规范多方安全计算金融应用评估规范 金融科技产品认证规则等标准规范和规则,认真制定隐私计算金融应用相应的测评方案、认证实施细则等内容,积极开展测试、评估和认证等服务工作,保障隐私计算技术在金融业的应用安全。例如,蚂蚁集团研发的国内首个金融级TEE系统HyperEnclave1.0通过北京国家金融科技认证中心认证检测,达到金融级产品的功能和安全标准;华控清交 PrivPy 多方安全计算平台通过国家金融科技测评中心的多方安全计算产品检测,获得国家密码管理局商用密码检测中心颁发的商用密码产品认证证书;基于海光 CSV TEE 技术的隐私计算一体机通过了信通院隐私计算金融场景专项评测,有效保证计算环境安全、计算过程安全以及金融数据安全。(一)金融应用面临合规风险(一)金融应用面临合规风险31数据安全法 个人信息保护法等法律法规相继出台实施,而金融业尚未出台相应的实施细则和指引。隐私计算技术能够保证原始数据不出域,实现“数据可用不可见”、“数据不动价值动”,有效保护隐私安全,但其是否满足法律中的匿名化处理,能否切实达到合规要求,尚不明确。1.1.法律法规风险层面法律法规风险层面运用隐私计算技术进行处理数据的合规风险亟需关注。就处理个人信息数据而言,目前我国个人信息处理的合规路径主要包括匿名化和授权同意。匿名化是指个人信息经过处理,无法识别特定自然人且不能复原的过程。绝对的匿名化是无论关联多少数据都无法识别个人、无论采用何种技术都不能复原个人信息的状态。隐私计算基于信息混淆、统计学、密码学等各类方法,实现数据计算过程的“可算不可识”,大大降低数据泄露的可能性,有效保护数据处理过程。但隐私计算技术本身并非匿名化的必然实现方式,仍然存在反向推算出原始数据的可能,即使仅获取其他参与方的数据切片、模型梯度等数据,也因这些数据存在客观上可逆的可能性,而需要判断是否满足个人信息保护相关法律法规要求。因此,主流的隐私计算金融应用并不能实现绝对的匿名化,仅仅属于法律中的去标识化。此外,在实际金融应用场景中,为规避合规风险,往往先通过隐私计算金融应用场景来确认合作双方数据范畴、数据有效性,再去解决取得个人授权同意等问题,严格意义上并不符合个人信息保护法的要求。322.2.业务合规层面业务合规层面金融应用场景中若涉及个人和企业信用信息的共享,需要严格遵守征信业务管理办法执行,金融机构不得与未取得合法征信业务资质的市场机构进行商业合作来获取征信服务,需要与互联网平台实现“断直连”。征信业务的生态系统较为复杂,通常涉及数据流通方、数据加工方、数据使用方三方数据融合。而隐私计算在实际应用过程中也涉及多方主体,包括个人信息主体、数据提供方、数据计算方、数据结果方等。面对众多主体,金融机构通过隐私计算技术共享外部数据应用于风控、营销等场景的模式,能否满足全链路的征信业务合规要求尚不明确。在现有法律法规、行业标准规范、应用案例的基础上,金融机构仍在探索平衡计算效率、应用价值和合规风险的隐私计算最佳实践路径。(二)技术与产品性能和安全性亟需提升(二)技术与产品性能和安全性亟需提升1.1.技术性能方面技术性能方面隐私计算技术能够实现安全求交、隐匿查询和联合建模等多种应用,但由于算法实现中涉及大量的密码学操作和网络通信,导致隐私计算无法实现很高的性能。比如同态加密可以直接进行密文计算,并保持计算后解密的结果与明文计算结果一致,实现数据的“可算不可见”,但是同态加密依赖的底层算子对算力要求较高,计算复杂度大,其耗时是明文计算的几千至几万倍。计算性能的制约,导致目前隐私计算还不能满足部分高并发高实时金融业务的要求。33隐私计算应用呈现通信频次高、数据传输量大等特点。跨网交互计算对网络需求高,比如隐私求交中哈希 ID 的交换、秘密分享中数据分片的交换、联邦学习中梯度和权重的传输等,都需要多轮大数据量的交互通信,降低了系统性能。金融机构出于安全考虑,在跨机构通信中常常使用专线连接,而专线的带宽资源非常有限,因此网络带宽已成为制约隐私计算性能的瓶颈。另外,隐私计算需要多方进行实时通信和协同计算,计算资源、网络带宽受限的参与方会拖慢整个算法的执行进程,使隐私计算在性能上出现“木桶效应”。隐私计算产品的应用部署架构分为直连模式和代理计算模式。在直连模式下,数据提供方同时担任计算方的角色,相互间直接两两连接进行计算。在参与方较多的场景下,由于直连模式需要完成多轮端到端的计算和通信任务,数据、算法和算力都集中在端上,可能面临计算与通信性能低、通用性弱、可扩展性不足、难以监管等问题。代理计算模式由代理计算节点完成计算任务,将数据方和计算方相互独立,具备可扩展性高、可监管性强的特点,但其初始开发和部署成本较高,部署便利性较低。2.2.应用安全层面应用安全层面隐私计算技术路线多样性导致了隐私计算算法实现的多样性。由于安全协议的选择、安全位数的设置、算法流程的设计、安全与性能的权衡等诸多因素影响,不同厂商对同一个算法的实现差异较大,难以形成业界统一标准。一方面,由于协议和算法34的复杂性,多种技术交叉融合,难以从理论上证明这些算法的安全性;另一方面,基于实践经验,安全性通常与性能、可用性互斥,严格安全会导致算法可用性大大降低,所以要求所有算法可证安全也不符合实际。目前,行业的共识是不同安全等级的算法都有存在的必要,可以根据金融场景、数据量、时效性等因素综合进行选择,但如何衡量隐私计算算法的安全水位和安全等级仍缺少统一标准。隐私计算技术都有安全前提假设。目前主流的技术路线以半诚实模型安全协议为主,其安全性基于所有参与方不能违反协议,只能抵抗半诚实敌手,无法抵抗恶意攻击。在联邦学习训练模型时,恶意参与方可能会通过投毒、注入、模型窃取等途径实施恶意攻击,基于训练过程中的中间参数进行推理,还原原始数据,对金融机构的原始数据和模型安全产生威胁。存证审计有助于降低各方作恶的动机,但是无法有效避免作恶的危害。此外,在隐私求交技术实际应用中,若参与方的数据体量明显不均衡,那么数据量小的一方存在暴露信息的风险。开源与闭源的选择对于隐私计算的安全也有影响。开源算法可以接受业界广泛的安全测试和评估,有利于算法安全的验证和提升,但也增加了算法被攻击的潜在风险。而闭源算法尽管使用了部分公开的论文和成果,但其代码一致性和潜在漏洞难以得到业内充分的测试和评估,仅依赖厂商难以自证安全,需要依赖第三方权威机构进行检测。35(三)金融应用基础设施有待完善(三)金融应用基础设施有待完善金融业作为数据密集型行业,多方数据合作是其数据要素发挥价值的重点。隐私计算技术积极推动传统数据要素流通模式变革,有望成为全社会数据流通产业的基础设施。搭建可共享的隐私计算基础设施,目前仍然面临不少的挑战。1.1.行业共享的基础设施层面行业共享的基础设施层面搭建可共享的隐私计算基础设施,需要保证较高的可用性,但目前整个隐私计算行业的产品化能力仍处于初期。面对数十亿数量级数据运算场景时,分布式计算节点的故障、网络抖动等情况极易导致隐私计算应用的不稳定。这是因为隐私计算网络是由分布在多个机构的节点构成,而跨机构节点的可观测性、监控运维往往非常困难。首先,各机构的基础设施差异较大,大部分机构以提供裸机为主,少部分机构有成熟的容器部署平台,这导致隐私计算服务在横向扩展、故障转移、自动容错等高可用性设计方面缺乏底层支撑;其次,跨机构的网络链路长,中间可能经过多次负载均衡转发,任何环节的网络波动、网络变更都可能造成隐私计算服务不可用;最后,跨机构指标采集、链路追踪、日志分析等成熟的系统运维方案难以统一实施,故障定位需要多方协同,因此故障的定位和排除周期较长。2.2.网络基础设施层面网络基础设施层面隐私计算网络节点管理问题越发显现。目前,业内还没有对隐私计算节点网络身份制定相关标准,隐私计算产品异构化趋势36明显。同时,金融机构间隐私计算平台组网存在困难。各金融机构内部现有的网络基础设施尚未很好地满足当前新型隐私计算的需求,存在网络安全管理机制缺乏、通信协议不兼容、网络安全评估效率低下、网络抖动等问题,形成了隐私计算节点“易安装难组网”的困境。此外,隐私计算需要更大的通信负载。在金融行业实际应用中,各金融机构间并没有针对隐私计算提供专门的网络基础设施,仅在保障各参与方节点可用的前提下完成落地验证。因此,通信效率已经成为了阻碍隐私计算性能提升的关键瓶颈。3.3.数据质量保障和数据流通机制层面数据质量保障和数据流通机制层面数据的质量和真实性是隐私计算技术能否发挥作用的关键因素。隐私计算需要融合多参与方的数据,而多数据源增加了数据整合与计算的难度,也给数据质量、数据真实性、数据来源的把控带来新的挑战。低质量数据将导致模型训练和预测结果不佳,严重浪费计算资源;虚假的或者构造特殊的训练数据,不仅会扰乱模型结果,还会在某些特定标签上呈现指定的预测结果,从而产生严重后果。同时,我国尚未形成成熟的数据相关定价和流通模式,数据责任和数据确权尚不明晰,金融业数据交易的基础设施不够完善,配套的体制机制不健全,造成了不愿、不敢、不会开放共享数据资源的窘境,也限制了隐私计算的规模化应用。此外,虽然政府公共数据在金融应用场景中具有较高的使用价值,但是各地政府对于数据开放共享采用的制度和模式差异较大,明37文共享、隐私共享等方式还处于摸索阶段。(四)示范效应和规模化应用场景欠缺(四)示范效应和规模化应用场景欠缺1.1.试点示范及应用推广层面试点示范及应用推广层面部分金融机构已启动隐私计算平台建设、开展验证性测试,但实际落地生产案例较为有限,已经落地应用的金融机构也担忧法律合规风险。行业缺少示范性强、可推广、可复制的典型案例给同业参考。另外,实际应用过程中出现的风险事件和攻击案例较少,隐私计算在金融业应用推广后的风险识别和预警、事中事后监管等环节的制度和策略还不完善,缺乏实际的参考价值。2.2.技术与业务融合层面技术与业务融合层面随着数字化转型程度逐步加深,金融机构通过隐私计算技术拓宽数据合作渠道、提升数据应用价值的需求更为紧迫。但金融场景的业务应用与隐私计算的技术能力天然存在发展步调、技术成熟度等方面的差异,技术内化至业务需要一段融合与适应期。如果强行将技术嵌入业务中,容易陷入“空有硬技术,效用未显现”的窘促局面,致使业务获得感不强烈,制约隐私计算示范效应和规模化应用。比如金融机构底层业务系统架构与隐私计算现有技术架构无法兼容,需要定制化改造与适配,在此过程中会影响业务开展;信贷风控的业务指标需要长周期统计与测算,使得隐私计算在该场景应用的价值不易直接量化。3.3.流程改造和管理运营层面流程改造和管理运营层面传统金融业务与隐私计算平台的结合和改造,需要投入大量38的时间和人力成本。开展实际金融业务时,相关法务层面的流程需要根据隐私计算情况进行变更,比如“隐私政策”。另外,在运用隐私计算实现跨平台的实际业务落地时,需要将数据、权限、审批、计算等环节全部打通,管理和运营难度提高,运营成本明显增加。(五)异构平台互联互通仍存在障碍(五)异构平台互联互通仍存在障碍金融机构根据自身需求选择不同隐私计算技术或平台,但由于异构平台之间不兼容,在实际开展数据交互时,只能要求合作企业部署己方的产品以实现数据资源对接,这增加了平台部署的费用。尽管金融机构联合隐私计算科技企业在异构平台互联互通方面进行了积极探索,但仍然面临严峻挑战。1.1.系统功能与算法的复杂性增加了技术难度系统功能与算法的复杂性增加了技术难度不同隐私计算技术或平台在算法原理与实现、系统功能方面存在偏差,导致隐私计算平台难以直接互联互通。算法原理与实现方面,由于通信协议、上层接口、数据格式、密码算法等算法原理差异很大,存在多种不同的实现方案和数据交互流程,理论层面的协议互通存在挑战,在技术层面实现互联互通更是困难重重。系统功能方面,各隐私计算平台包括的功能组件都是基于自身长期的技术积累和场景应用实现的,比如操作流程、流通模块、加密组件、任务管理、资源授权、节点管理等,存在较大的差异性。算法原理和实现方案的差异、操作流程的不同、功能组件的多样显著增加了隐私计算互联互通的技术难度和实现成本。392.2.互联互通的合作意愿不足互联互通的合作意愿不足技术路线的选择、核心算法的设计和基础功能的实现都是各隐私计算平台最核心的设计思想和知识产权。实现互联互通的过程中需要一定的相互迁就与妥协,损失产品原有的个性化。另外,金融机构缺少隐私计算互联互通产品选型和路线规划的指导意见,数据提供方难以把控数据流通过程中的数据权属和数据使用方式,隐私计算科技企业增加了技术改造成本,这些因素都导致互联互通的内驱力不足。3.3.互联互通放大了安全风险互联互通放大了安全风险隐私计算技术或平台作为保护数据安全流通的重要工具,其安全协议依赖安全假设,仍存在一定的安全风险。比如,隐私计算只考虑了半诚实模型,假设每个参与方都执行所规定的算法,可能存在试图通过从协议执行过程中获取的内容来推测其他隐私,但不会存在不遵循协议的恶意行为。在各参与方使用相同平台的情况下,该风险一定程度上可控。但是当各参与方通过互联互通的方式部署异构平台,安全假设的信任风险会在异构平台之间相互传递,甚至会不断被放大,增加数据泄露风险。为推动隐私计算技术在金融业合理合规应用,降低应用过程中出现的数据泄露风险,避免违规使用个人信息数据,金融机构在开展隐私计算金融应用时应严格遵守数据安全法 个人信息保护法等相关法律法规要求,建立并完善企业内部数据的全40生命周期管理制度,建立健全产品上线前的安全评估机制,以技术加管理的方式,从责任约定、设计方案、密码算法、安全协议等多角度、全方位开展安全评估,加强数据的安全性保护。同时,积极探索隐私计算金融应用场景,以金融应用拉动隐私计算产业的发展,促进异构平台互联互通,打造隐私计算金融应用的良好生态。(一)强化隐私计算金融应用的顶层设计(一)强化隐私计算金融应用的顶层设计建立健全隐私计算金融应用合规指南建立健全隐私计算金融应用合规指南。个人信息保护法征信业务管理办法等法律法规出台实施后,建议加快制定隐私计算在金融业的应用指南,对法律法规相关条款进行补充描述,为隐私计算在金融业的合规应用提供政策指导,明确隐私计算数据安全分级、数据监管审计等方面的规定,促进隐私计算应用场景更好落地。在合规应用指南出台前,建议金融机构严格落实用户的知情同意原则,在经过用户授权同意后开展用户信息的分析和使用,确保个人用户信息使用的合规性。完善隐私计算相关标准规范完善隐私计算相关标准规范。推动隐私计算相关安全测试标准、性能测试标准、密码学测评标准、互联互通技术标准等基线标准的制定。基于现有安全分级标准,探索制定针对单个隐私计算技术路线的安全级别,以及针对跨技术融合的隐私计算通用安全分级标准和安全评估标准。加快完善联邦学习、可信执行环境等隐私计算技术在金融业应用的技术应用标准、互联互通标准、评估与认证规范等标准规范,规范隐私计算应用路径,保障金融41应用安全。健全隐私计算认证体系和合规审查机制健全隐私计算认证体系和合规审查机制。建议建立隐私计算领域的权威认证体系,完善隐私计算在参与机构、技术平台、算法组件等方面的认证规范,大力发展权威认证机构和隐私计算金融应用认证业务,增强合作方互信。建议金融机构设置隐私计算专项法律合规审查机制,确保各项目安全合规落地。(二)以应用促进隐私计算技术与产品性能和安全性提升(二)以应用促进隐私计算技术与产品性能和安全性提升加强产学研用联合攻关加强产学研用联合攻关。建议隐私计算产业机构加大创新研发力度,不断优化产品的技术性能,提高自主掌控能力,提升产品的标准化服务水平。比如采用硬件和软件加速解决大量加解密造成的计算瓶颈问题,从通信数据量、通信频率、算法设计等方面优化通信带宽。建议金融机构联合产业机构开展金融业务创新,以金融业务需求为出发点,针对应用过程中棘手问题开展联合研究与攻关,不断优化算法性能,根据数据量、安全要求等因素,选择合适安全等级的隐私计算算法,平衡好算法的安全和性能,更好地满足金融业务对监管合规、功能效用的需要。强化隐私计算金融应用安全强化隐私计算金融应用安全。在实际金融应用场景中,基于隐私计算的产品和服务,建议金融机构结合原理说明、代码审查、网络抓包、日志分析等多种方式,对算法的安全性进行验证,并积极参与权威机构的安全测评。建立科学合理的安全性度量体系,结合金融数据的特点,从攻破给定的安全防护所需成本、信息泄露风险、不确定性等角度,对隐私计算实现的“数据密态”进行42安全分级,促进隐私计算技术在实际金融场景中的安全应用与推广。健全安全存证机制,增加安全逻辑监测,对于恶意攻击要及时发现并切断攻击路径,加快隐私计算与区块链技术融合应用,存证防篡改,支撑交易审计回溯。(三)探索建立金融业共享共用的隐私计算基础设施(三)探索建立金融业共享共用的隐私计算基础设施积极推进金融业共建共享的隐私计算平台建设积极推进金融业共建共享的隐私计算平台建设。建议具备行业公信力的第三方机构组织金融机构、隐私计算科技企业共建行业级的隐私计算平台,合力解决隐私计算服务扩展难、链路长、运维监控复杂等问题,并基于某一类金融应用场景组织金融机构开展试点示范,合力打造更为开放、多元、融合的数据流通生态,推动释放金融数据价值。不断优化金融业网络基础设施建设不断优化金融业网络基础设施建设。探索建设隐私计算节点网络身份标准,制定全网统一的节点与身份编码,形成一套标准的节点身份分配和管理机制,为异构隐私计算平台互联互通网络、隐私计算多样化产品网络提供标准化的节点网络管理基础设施。积极建设标准化的网络节点系统软件,基于标准的节点网络身份和隐私计算产品特点,构建开放共享的隐私计算网络节点系统,连接不同的隐私计算平台和产品,以网络节点先行的方式,解决组网困难的问题。探索构建跨机构隐私计算通信承载网络,加强金融机构、隐私计算科技公司与运营商的技术共建合作,将隐私计算与 5G 技术、商用承载网络技术等深度结合,提供具备自适应带宽、安全加固、快速便捷的基础网络传输服务。43(四)积极推广试点示范与可规模化应用的场景(四)积极推广试点示范与可规模化应用的场景发挥隐私计算金融应用的示范试点效应发挥隐私计算金融应用的示范试点效应。各金融机构的隐私计算应用场景不尽相同,但普遍集中在营销、风控等领域,并取得较好的应用效果。建议金融管理机构以合法合规为原则,兼顾各机构隐私计算平台的互联互通,牵头整合各方意见,求同存异,在营销、风控等领域形成隐私计算金融应用指引,指导金融机构制定科学合理、可落地的实施方案,并开展试点示范,稳步推动隐私计算在金融领域的应用。推广隐私计算在金融监管类场景中的应用推广隐私计算在金融监管类场景中的应用。建议金融管理机构牵头金融机构参与监管类场景实践,如贷后资金流向分析、反洗钱交易分析、诈骗团伙识别等,积极推广金融监管类应用场景,切实发挥数据要素的融合价值,提升监管能力与水平。提升技术能力与业务应用的适配度。提升技术能力与业务应用的适配度。建议将多方安全计算、联邦学习等技术进行拆分,转化为业务场景可用的功能组件,基于业务需求筛选和适配功能组件,进一步提升技术能力与业务应用的适配度,保障面向业务场景的隐私计算高可用性。比如商业银行在开发贷款业务联合风控模型时,可以预先将业务与技术进行适配,规划隐私计算技术选型和适配后的应用效果,缩短业务开发周期,以更直观的方式展示模型结果,提升业务层面的获得感,助力隐私计算在金融业形成应用示范和规模化效应。(五)大力推动隐私计算异构平台的互联互通(五)大力推动隐私计算异构平台的互联互通加快加快互联互通互联互通技术研究和技术研究和标准标准制定制定。建议研究机构、产业联44盟、金融机构、隐私计算科技企业联合开展隐私计算异构平台互联互通的技术研究,充分考虑主流技术路线,总结行业互联互通的实践经验,推动行业最佳转化为团体标准和行业标准。积极制定互联互通的技术框架,并在管理面最小必要元素设计、多方资源访问控制协调、流程调度互通设计等关键技术点开展联合攻关,以求同存异为原则保障商业产品的多样性,引导技术厂商进行实践性标准的落地,真正实现异构平台的互联互通。鼓励大型金融机构对外输出互联互通能力鼓励大型金融机构对外输出互联互通能力。建议大型金融机构加快隐私计算异构平台互联互通技术的落地实践,利用自身隐私计算平台以及跨异构平台互联互通能力,积极向中小金融机构赋能,降低金融机构应用隐私计算的门槛,积极推动行业互联互通的成果转化,为隐私计算规模化应用提供支撑。支持隐私计算开源技术发展支持隐私计算开源技术发展。鼓励金融机构参与国内Occlum、隐语、FATE 等开源社区的建设,推动开源社区的发展,充分利用开源技术透明、普及度高、使用门槛低等特性,提高异构平台互联互通的水平,提升隐私计算技术自主掌握与应用的能力。45在国家鼓励加快数据要素流通的大背景下,各地政府也在积极探索政务数据的创新管理模式,以数据共享开放助力地方产业经济发展。但在对外开放数据的实践中,地方政数局存在数据被不当利用的安全顾虑。工商银行积极与地方政府合作探索“科技信贷”新模式,通过隐私计算技术实现银行信贷评分模型与政务数据的安全融合计算,快速输出更为精准的小微企业授信评分,助力小微企业破解“融资难”、“融资慢”的难题,推动产业金融的良性循环发展。隐私计算技术可实现数据在“可用不可见”的前提下释放价值,本案例借助隐私计算中的秘密分享技术,实现银行信贷评分模型与地方政数局的公共数据在密文状态下的联合计算,输出小微企业信贷评分结果,实现对贷款客户的精准授信。图 1 结构框架图46在隐私计算密码学协议的保护下,本案例既实现了政务数据的原始数据不泄露,也保护了银行的信贷评分模型参数明文不出域,解决了数据共享过程中的安全顾虑,支撑银行快速完成客户精准授信放款,缩短审批放款周期,助力小微企业融资纾困,是政府和银行共同探索的“科技信贷”新模式,是发展普惠金融的新样板,为后续产业金融“数字化转型”提供了宝贵的参考借鉴。一是合法合规性问题。严格参照中国人民银行金融消费者权益保护实施办法 数据安全法等进行设计,在数据收集和使用过程中采取措施保护支付信息和用户敏感信息安全,所提供金融服务符合相关法律法规要求,在项目进行中涉及的各项数据都得到了企业的相关授权,可依法合规开展业务应用。二是技术安全性问题。项目将在系统上线前进行全链渗透性测试、安全扫描、压力测试,对相关操作人员进行应急处置培训;建立系统信息隔离机制,做好系统隔离和数据隔离;对数据共享关键过程进行存证留痕,做好备份审计工作;项目采用了已被业界广泛认可的隐私求交和秘密分片算法,该算法已在合作机构内部经过多个项目安全验证,性能指标符合预期。同时,项目组密切关注算法最新理论研究成果,通过协议明确合作方在算法出现风险后不得进行数据破解或者逆向工程,且约定了项目暂定、项目终止、项目退出等应急预案保障措施。47本项目方案已经过技术、业务、法律合规、风险控制等充分评估,确保技术安全可靠、业务真实有用、共享过程合法合规。在地方政数局落地实施后,实现了小微企业放贷授信金额提升50%,放款审批时间缩短约一半,提升了对小微企业的支持力度和放款效率,有力支撑了地方产业经济的健康发展。48银行账户是电诈犯罪涉案资金转移的重要通道。近年来,受利益驱动,个人银行卡、对公账户、手机卡成为电信网络新型违法犯罪资金流、信息流运转的重要载体。2020 年 3 月以来,对全国电信诈骗案件中涉案对公账户开卡地、涉案个人银行卡开户地等八项线索进行综合排名,定期重点通报排名进入前 20 位的城市。其次,技术反制是打击治理贩卖涉案账户的有力支撑。电信网络诈骗是高科技、非接触、跨国跨区犯罪,诈骗手段层出不穷,迭代升级十分迅速,作案成本低、破案成本高、挽回损失难,必须依靠源头治理、预防为先,堵住不法分子转移非法资金的通道成为打击治理的关键环节。从苏州经验来看,通过组建多方参与的数据分析联合实验室,使用隐私计算技术,在短时间内有效遏制了新开个人银行卡的涉案风险。再次,隐私保护是开展多方数据融合应用的必要前提。随着我国网络安全法 数据安全法 个人信息保护法的相继出台,个人隐私信息及个人金融信息必须依法依规使用。为防止个人金融信息泄露和滥用风险,人民银行牵头制定了个人金融信息保护技术规范、金融数据安全 数据安全分级指南及多方安全计算金融应用技术规范等多个规范文件,个人金融信息(数据)保护试行办法也在积极制定中。在此背景下,本项目提出采用多方安全计算、隐私计算、联邦学习等大数据领域新技术将现有基于客户身份单向加密的实49体实验室升级为多方安全的虚拟联合实验室,在不泄露原始数据、保障隐私安全的前提下推动多个主体间的数据共享与融合应用。本项目构建了跨机构间数据合规流通与融合使用的新型信息基础设施,在保障各方数据安全隐私的前提下,促进了各家商业数据的合规融合与使用,实现了涉诈线索的精准识别、事中阻诈等多类别关键需求,以科技能力有效保障了人民群众财产安全,并取得显著效果。本项目创新性建设了市级金融联合实验室平台,覆盖了苏州市多家商业银行和机构,运营商的接入使得系统规模进一步扩大,是国内运用“区块链 隐私计算”技术的大规模生产级应用案例,在全国具有首创性与先进性。项目的成功实施应用也为行业大数据“走出去”提供了开放共享高价值参考。基于联盟区块链、安全多方计算与联邦学习并搭载高效通用的数据隐私算法,有效解决多方数据归集模式下的数据隐私违规问题,可服务于包括信贷风控的联合建模、大数据隐私查询、基于多源数据的征信评价、精准营销用户画像等诸多数据融通场景。基于本平台实现了反电信网络诈骗纵向建模,强化了反诈识别的覆盖度,发现潜在的诈骗分子信息,进一步提高了整体反诈识别能力。本项目主要包括隐私计算平台、区块链平台等平台和账号反诈业务系统等功能模块。隐私计算平台以可用不可见的方式实现了数据隐私安全的联合计算,具体包含隐私查询、可信数据分析和联合建模功能,隐私查询在不泄露查询条件的情况下获取查询50结果;可信数据分析提供了四则运算、逻辑运算等基础算子及其组合计算;联合建模提供了聚类、回归模型、树模型、神经网络等丰富的算法类型。区块链平台实现了对联合计算产生的任务数据请求、授权、使用、计算等环节的存证,保证隐私计算任务全流程可追溯、可验证,确保数合法合规据使的。账户反诈业务系统通过建设数据综合应用平台,为用户提供黑灰名单匿名查询、潜在风险识别预警、风险排查处置管理、反洗钱调查等功能。本项目涉及的关键问题是如何安全且有效地联合使用合作方数据,使数据安全合规的同时最大限度发挥价值。课题组对此进行了梳理与深入探讨,在数据流动的各个环节给出了解决思路。(一)数据收集(一)数据收集系统各参与方对自身数据名单进行管理,对匿名查询的结果、模型预测结果进行管理,记录、跟踪重要的特征数据,对各参与方的数据授权和使用流程进行管理以及其他相关业务需求和管理需求。采用区块链技术,从硬件、网络、存储、计算、密码学、共识、成块等底层技术到各个业务环节,保证链上各环节业务信息和业务数据安全可控。(二)数据共享使用(二)数据共享使用在数据不出库的情况下,实现基于加密计算的规则建模及使用。根据某些关键特征制定筛选规则,支持基于多种联邦学习算法的多方安全联合建模及使用,融合银行同业和外部参与方的数据特征,深入挖掘其中隐含的风险,提升模型精度和预测效果。51(三)数据传输(三)数据传输数据共享采用隐私计算平台,数据不出本地,不对明文数据进行节点之间的传输。各数据参与方之间网络两两互通,确保可以进行联邦隐私计算,每个结算节点有数据单元和计算单元,数据单元将数据加密后由计算单元计算。管理参与方可通过日志监控数据调用细节和计算细节,同时获知网络端口发送信息,完全了解本节点计算内容。(四)数据存储(四)数据存储各参与方数据均在本地存储,查询完成后,查询方存储查询结果;被查询方存放业务发起方与查询次数;管理参与方存储可知各方查询与被查询次数。区块链平台对联合计算产生的数据、请求、授权、使用、计算等环节进行存证,利用区块链的不可篡改的特性保证隐私计算任务全流程可追溯、可验证。基于本项目所搭建的平台,农行苏州分行依托大数据、区块链、隐私计算等技术,完成了反电信网络诈骗纵向建模的流程框架和方案设计。通过利用前沿密码学原理在保证数据融通安全和可靠的前提下引入运营商数据,通过扩维增强模型训练性能和泛化能力。训练阶段各方保留部分联邦模型,训练过程只交换中间结果,如密态梯度、碎片化结果等,训练结果性能可满足实际要求。模型结果拆分保存至各参与方,保护模型安全,防止特征泄漏。通过联邦学习技术,丰富了反诈识别手段,强化了反诈识别的覆盖度,发现潜在的诈骗分子信息,提高了整体反诈识别能力。52中国银行和集团子公司中银消费金融有限公司利用隐私计算开展跨机构数据融合,基于纵向联邦学习 XGBoost 算法共建个人信贷风控模型。行司联动“好客贷”业务是由中银消费金融联动中国银行,基于行内存量客户金融属性数据联合建模,在保证数据安全、信息安全的前提下,有效筛选需求真实、消费意愿强、还款能力可靠、信用风险可控的目标客群,经客户授权后,匹配差异化申请流程、定价、利率,通过合规经营、正确引导,为客户提供合理、便捷、安全的纯线上金融服务,满足下沉客群消费信贷需求。本项目是中行第一个全行级别的隐私计算应用。利用开源联邦学习框架 FATE 进行建模。该项目共包含六大步骤:一是在大数据平台加工好客户建模特征;二是双方准备加密后的 ID,利用 FATE 进行隐私求交;三是进行联邦建模并对模型效果进行评估;四是在模型上线做联机预测。53图 1 个人信贷风控模型在项目实施过程中遇到两大困难,一是开源隐私计算框架信创支持不足;二是只有生产环境才有客户信息以及对外联通网络,需要在生产环境进行联邦学习建模。中国银行和中银消费金融有限公司为解决这两大困难,改进适配了信创环境,探索在生产环境进行隐私计算建模的流程和数据安全使用机制。54纾解中小企业融资困难已是当务之急。然而,由于银企信息不对称、部分中小企业行业垂直度高、专业性强、风险意识不足,普惠金融服务的风险压力居高不下,进而导致尽调要求高、融资流程复杂、融资成本难以降低。交通银行同运营商合作,开展基于多方安全知识图谱计算的中小微企业融资服务。基于各自管控的多方安全计算系统平台,确保银行和运营商在原始数据不出库前提下联合分析,进而精准防范和打击伪冒审贷等扰乱金融秩序的行为,为进一步降低中小企业融资成本,安全高效地服务实体经济提供助力,如图 1 所示。该项目首次将图计算技术和多方安全计算技术结合,运用多方安全计算技术提供数据融合中的数据隐私保护,运用知识图谱技术对中小微企业集群进行风险传导分析,将技术应用分析结果图 1 基于多方安全知识图谱计算的中小微企业融资服务55作为开户真实性意愿审核的辅助手段,达到身份核验手段多元化效果,助力银行中小微企业精准贷款投放和集群风险管控,提升金融机构风险防控能力及客户贷款体验,营造健康的普惠金融生态。该项目入选上海市金融科技创新监管试点首批应用,是国内金融领域首例对外公开的多方安全计算技术应用。56生物识别信息是敏感个人信息,一旦泄露或者非法使用,容易导致自然人的人格尊严受到侵害或者人身、财产安全受到危害。生物识别信息一旦发生泄漏或滥用事件,对客户的危害极大、影响深远。交通银行同中国银联合作,将多方安全计算(MPC)应用于金融场景的生物特征识别中,在保证金融服务便利的同时提升生物特征的使用安全。如图 1 所示,在用户注册即生物特征采集、提取过程中,项目在用户授权的前提下,对手机 POS 采集到的图像进行特征提取后,将特征信息进行随机切片、分别传输并存储至交通银行和中图 1 基于多方安全计算的图像隐私保护产品57国银联,使任何一方都不保留用户的生物特征,而只有将双方的特征数据进行联合运算时才能获取生物特征信息。在用户身份识别即生物特征信息比对过程中,首先将需识别的图像特征进行随机切片,然后将识别信息与在交通银行和中国银联存储的数据通过多方安全计算进行比对,保证在不泄露原始信息的前提下实现身份识别,保护用户的生物特征隐私信息安全。该案例在不改变现有移动端验证流程,保障用户体验的前提下,提升用户生物特征信息的保护能力,强化了生物特征信息安全,有效避免了大型机构单独存储生物特征信息的集中化风险:一是在图像数据存储方面,将图像特征数据进行随机切片后分别存储在多个独立主体,避免了金融机构单独存储图像隐私信息的风险,同时也保护了用户的隐私数据安全。二是在图像特征计算方面,运用多方安全计算技术,保证用户图像特征在密文形态下,仍然能够完成身份信息的验证,从而保障了整体方案的安全、有效。三是在算法更新方面,客户端只需维护一个版本的算法模块,当需要对图像识别算法进行更新时,通过平滑升级机制在新一次的验证过程中同时更新特征并替换算法版本,降低客户端的处理与存储开销。58四是在收单业务风控方面,运用图像识别、多方安全计算技术,在核实商户责任人和收银员身份的同时,有效提升收单机构反欺诈、反洗钱等风控能力。该案例入选上海市金融科技创新监管试点第二批创新应用。是首个将多方安全计算技术应用于生物信息保护的金融应用。59近年来,我国反洗钱相关法律制度不断修订完善,国家对反洗钱犯罪的打击力度不断加大。反洗钱法要求金融机构应当依法采取预防、监控措施,建立健全客户身份识别制度、客户身份资料和交易记录保存制度、大额交易和可疑交易报告制度,履行反洗钱义务。金融监控机构提倡建立集团层面统一风险视图,统筹推进境内外反洗钱合规工作。反洗钱风险名单数据因客户信息需在不同法人实体间隔离等监管要求,无法在集团范围内直接共享。同时,相较银行,集团金融子公司所掌握的客户身份、行为、交易信息较少,故在识别客户风险、异常交易以及可疑案件等方面面临极大挑战。隐私计算技术是指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一系列信息技术,保障数据在流通与融合过程中的“可用不可见”,为数据的开放共享与隐私保护提供解决方案。本项目基于隐私计算技术实现集团内反洗钱名单数据共享,打破了监管合规的数据孤岛问题,加大了集团内数据安全应用的效率,提升了金融机构间金融风控的协作能力,对促进金融安全健康发展提供了技术保障。本项目创新性地使用隐私计算技术,通过密码学技术对原始60数据进行加密后进行安全计算,保障各法人实体只获取所辖客户范围内的风险信息,实现了数据的可用不可见,解决了数据共享过程中数据的“隐私性”问题,实现了集团内反洗钱客户名单信息的合规共享。本项目使用的核心隐私计算算法为隐私集合求交算法(Private Set Intersection,简称 PSI)。该算法能找到两个集合的交集,但是参与双方都无法获知交集以外的对方集合数据。算法执行前,双方将名单数据上传至隐私计算平台;算法执行中,运算涉及的数据均经过了加密处理且不可反推。算法执行后,仅发起方可以获取结果。反洗钱风险名单共享场景实施的前提是要保证查询参与双方的数据安全性,即参与双方无法获得除自有客户以外的其他客户信息。隐私计算为上述需求提供了解决方案,实现隐私数据的“可用不可见”。在实际应用中,安全求交算法会对原始数据加密进一步保障参与方的数据安全。为了进一步确保数据共享过程的数据安全,参与方对共享的名单数据进行脱敏后上传至隐私计算平台。此外,为了避免可能存在的信息系统安全、网络安全等风险,在系统上线前进行了渗透性测试、代码安全扫描、压力测试;在生产环境的网络层面建立系统隔离机制;数据共享关键过程进行留痕存证,便于后续审计。61兴业银行积极推动树立以数据为核心资产的经营理念,探索隐私计算技术在金融场景的落地应用。在反洗钱领域,兴业银行选择集团子公司进行试点,基于子公司兴业数金开发的隐私计算平台,综合应用隐私求交、隐匿查询等多方安全计算技术,保障各法人实体只获取所辖客户范围内风险信息,实现了集团内母子公司间的反洗钱信息合规共享,提升反洗钱工作准确性,实现了集团内风险联防联控。62在大数据时代,跨机构数据共享日益受到关注与重视。对于数据密集应用的证券期货市场而言,受业务强监管性的要求,市场机构对于涉及业务经营的风险敏感数据的关注与应用显得更加突出。这类数据以有关违规和失信等风险客户数据为主,俗称黑名单。黑名单数据不仅有助于市场机构降低各类业务风险,还能加强客户关系管理,对提高业务服务质量具有重要意义。然而值得注意的是,在现实市场环境中,受多种因素的影响,行业黑名单数据在采集与应用方面面临多种困难,突出表现在:一是各机构虽然有自身认定的黑名单数据,但由于数据的敏感性,不愿直接与其他外部机构进行共享。即便有共享,也仅限于业务或股权上有关联关系的机构,共享范围有限。二是由于黑名单缺乏共享,导致一些风险客户虽然在一家机构受限,但转投其他机构后仍然不被识别,从而给其他机构再次带来同样的风险隐患。三是由于机构之间业务差异,导致一些黑名单风险客户的认定标准不统一,加上缺乏有效的共享机制,在一定程度上制约了黑名单的共享。因此,如何突破当前行业机构之间的黑名单应用困境,探索合规有效的解决方案,建立行业统一、公共的数据共享机制与平台,推动增强行业机构风险识别与防范能力具有重要的现实意义。为解决行业数据共享问题,2020 年深交所联合国泰君安、63长江证券、东吴证券、兴业证券、招商证券、广发证券、国信证券等 7 家市场机构成立了联合课题组,针对行业数据共享的应用需求,运用区块链技术,经过深入分析研讨,设计提出了基于区块链的行业数据共享的解决方案。方案总体思路是:以共建共享为原则,组织行业机构成立行业数据共享联盟,制定相关的数据共享标准与共享机制,同时依托区块链技术和数据隐私保护算法,确保共享数据在跨机构之间的隐私保护,从而达到安全合规的数据共享需求。具体来说,方案包括如下四个方面内容。(一)数据共享的组织运作(一)数据共享的组织运作以自愿加入为原则,通过共建、共享、共治模式,建立行业联盟,推动联盟内机构黑名单数据共享,联盟会员以行业机构为主,包括交易所等核心机构、证券公司、基金期货等市场经营机构,同时也视情况吸收如银行等行业外机构。联盟设置黑名单共享治理委员会,负责对黑名单管理、系统建设和运维服务进行决策,下设运营方负责日常事务处理。在黑名单建设期,市场机构需要提供一定数量与质量的黑名单才能加入共享,成为创始会员,同时黑名单的查询次数与贡献数量挂钩。创始会员能参与相关系统建设、讨论并制定黑名单标准,并享有联盟内黑名单查询和联盟后续相关收益分配的权益。当创始会员数量或者黑名单数量达到一定规模后进入运营期,运营期间,由联盟商议明确激励规则,以鼓励各会员机构积极更新维护黑名单,维持黑名单共享平台可持续发展。(二)数据共享的技术平台(二)数据共享的技术平台64区块链作为分布式账本,有着去中心化、链上信息不可篡改的特点,并且天然就能在链上“共享”数据,解决数据共享过程中多方之间难以平等互信的问题。深交所近年来针对区块链在证券市场应用持续开展了场景应用探索研究与实践,并在 2017 年推出深交所深证金融区块链平台。该平台作为行业的区块链基础设施和一站式区块链应用平台,可快速搭建区块链,可支持黑名单共享方案落地。在本方案中,基于深交所深证金融区块链平台,利用区块链技术搭建分布式网络,连接联盟内的各参与方,保护数据不被篡改,奠定平等互信基础,提高点对点数据传输效率。(三)数据共享的业务流程(三)数据共享的业务流程黑名单共享流程分为准备阶段、查询阶段和评价阶段,如图1 所示。在准备阶段,各参与机构在私域内部署联盟共享系统(接入系统)与联盟链节点,并将各自业务系统准备共享的黑名单按照统一格式上传到联盟共享系统中。进行黑名单查询时,联盟共享系统会自动完成对查询请求的OT 算法加密,然后通过联盟链节点调用智能合约,向联盟链上所有机构发起查询;当获得所有反馈信息后,联盟共享系统会自动汇总查询结果提交给查询方业务人员。最后的评价阶段,业务人员结合实际情况判断客户的风险值,并给出专业的评价意见。65图 1 黑名单业务流程图(四)数据共享的查询使用(四)数据共享的查询使用方案采用不经意传输(Oblivious Transfer,简称 OT)算法,这是密码学中的一种基础协议,能使通信双方以一种选择模糊化的方式传递消息,提高数据的利用率。算法不仅能通过加密查询请求保护数据查询方的查询隐私,还能通过加密数据集及私钥加密信息保证数据贡献方的数据隐私;最终实现隐私数据可用不可见。如图 2 所示,整个数据共享查询过程分为总共分为五步:第一步,查询方 A 根据身份证号发起查询请求,第二步,查询请求去敏,也就是计算身份证号哈希,保证隐私信息不被破解。第三步,查询请求 OT 算法加密,同时生成查询 key。第四步,机构 B根据加密后的查询请求,在本地黑名单中筛选出符合条件的黑名单;然后使用 OT 算法加密,生成查询结果集。第五步,机构 A根据查询 Key 也就是随机因子解密查询结果集,即可得到张三在机构 B 黑名单中的情况。66图 2 不经意传输算法示意图针对上述方案,课题组还对方案所涉及的关键问题进行了梳理与深入探讨,并提出了相应的解决思路。(一)黑名单标准(一)黑名单标准由于整个行业缺少黑名单相关标准和规范,各市场机构的黑名单具有明显差异性,所以当务之急需建立统一的行业黑名单标准,才能使黑名单共享更具有普适性和推广性。本方案根据证券行业业务开展情况,初步拟定了黑名单的类型标准,大致可分为以下三类:67一是营销黑名单。某些客户利用市场机构营销时的规则漏洞抢占营销资源,参与流量造假,影响市场机构业务开展和成本控制,俗称“羊毛党”。营销黑名单记录的是“羊毛党”的相关信息,业务来源于网络金融,主要用于防范“羊毛党”套取营销费用,从而避免资源浪费,提高营销效率。此类数据券商常见使用于渠道侧,数据多以外购为主,通过营销黑名单的有效识别,快速完成“羊毛党”的匹配和剔除,有效形成安全过滤网,确保有限资源的高效使用。二是潜在风险黑名单。市场机构开展融资融券、质押融资等信用业务时,需结合业务要求和客户行为轨迹动态调整客户的信用评级和授信额度。潜在风险黑名单记录的是市场机构开展信用业务时,由内部系统(风控系统、反洗钱系统、业务应用系统等)“分析认定”的潜在风险客户。该名单对客户信用评级、授信额度调整等业务办理的准入性或相关阈值控制提供参考依据。这类客户通常包括:多次强行平仓客户、恶意投诉债务纠纷类客户、异常交易客户、违约负债(本金未偿还或未及时偿还利息)客户等。三是高风险黑名单。高风险黑名单又称“公开黑名单”,特性在于公开,一部分来源于监管层下发的高风险黑名单客户,如沪深交易所重点监控名单、中登违反实名制名单等;一部分来源于外购的反洗钱黑名单,如道琼斯、汤森路透等数据。市场机构高频使用这类数据,通常对这类黑名单采取限制交易、限制业务办理等管控措施。(二)数据质量(二)数据质量68如何保证黑名单质量是黑名单共享成败的关键之一,方案结合实际情况给出了解决方法。首先,机构加入联盟链由联盟审核资质,严格把控进入门槛。理论上这些机构都是被一定程度信任的,而链上每个机构的数据质量影响着全联盟的权益,原则上机构共享的黑名单应是其自身正在使用的,这样数据质量就可以得到一定程度的保证。其次,联盟将采用现场检查的方式确认机构共享的黑名单是否来自他们自身的业务系统,确保黑名单的完整性、准确性、合理性,进一步保证数据质量。然后,推广评价机制形成机构对数据的正向反馈,也是保证数据质量的有效手段,评价内容将与共享方权益挂钩,做到奖优惩劣。最后,联盟将不定期抽查各机构的黑名单和评价内容,以确保共享机制的良性发展。(三)隐私保护(三)隐私保护由于黑名单涉及客户隐私,如果不能有效地解决数据隐私安全问题,黑名单共享将寸步难行。在黑名单共享的场景中,保护隐私需要满足两个条件:第一是贡献方无法确认查询方想要查询的客户信息,第二是查询方无法获得除该名客户以外的其他客户数据。不经意传输算法通过选择模糊化的方式,能同时满足上述条件,实现隐私数据可用不可见。在实际应用中,为了进一步确保黑名单共享过程的安全,实现敏感数据不出私域,查询请求中的敏感信息可以做哈希脱敏处理;同时,为了提高共享效率,查询方还可以将查询请求的部分信息取作“参照物”发送给贡献方,例如取哈希明文的后三位。这样,贡献方可以根据“参照物”优先完成本地大量黑名单的数69据过滤,筛选出目标黑名单集,从而减少非必要信息的加密和传输。经过计算,如果透露哈希明文的后三位,那么效率可以提高1000 倍。理论上,哈希明文位数透露越多,效率就越高,但是风险也会成倍增加。(四)激励机制(四)激励机制图 3 激励机制如何有效地激励链上机构积极更新共同维护黑名单至关重要,这是保障黑名单共享可持续发展的基础。在建设期,查询方通过贡献黑名单获取查询次数,查询次数与黑名单贡献量呈正相关,部分公开类黑名单则考虑不纳入次数消费。在运营期,方案使用积分作为激励手段,查询方消耗积分,贡献方获得积分;非联盟链上机构,查询需要消耗更多积分;不同业务查询,消耗积分不同;鼓励批量查询,消耗积分更少。具体的积分规则由联盟商议决定。基于上述方案,深交所研发了面向行业的基于区块链的黑名70单共享系统。系统分为联盟共享系统、联盟治理系统、外部查询系统和共享平台服务,其中联盟共享系统部署在联盟机构内网,提供给机构接入使用;联盟治理系统由运营方部署使用,外部机构查询系统提供给非联盟机构查询使用,建设时期暂不实施。联盟共享系统已完成主要包括数据统计、黑名单查询、本地黑名单管理、历史记录查询的功能。联盟机构按照约定的格式把黑名单导入系统,其中不同的业务分不同的表进行存储;联盟共享系统提供黑名单查询 API 供机构业务系统调用,同时也提供查询界面供业务和 IT 人员使用;本地黑名单管理功能可实现对于本机构黑名单的增删改查,还可进行总数据量、本地数据量、新增数据量、查询次数、命中次数、剩余次数等数据统计。历史记录查询功能支持对每次查询结果进行保存,后续再次查询时,先显示历史查询结果,然后由机构选择是否进行再次查询。接入系统(共享系统)支持负载模式提高可用性,并定时向共享平台反馈服务运行状况及数据情况。71中国普惠金融研究院(CAFI)于 2021 年 12 月发布中国普惠金融发展报告(2021)指出:未来五年,普惠金融要在普惠保险、创业投资以及多层次资本市场三大领域发力。金融机构在推进产品和服务方式创新时要首先考量防范风险,风险评估需要依仗大量的数据,隐私计算成为保障数据安全流通的技术选择之一。在金融领域,构建先进的信用风险预测模型需要大量数据来提升算法性能,银行等金融机构需要获取更全面、真实的数据,但出于数据隐私保护的考量,且各金融机构间的互不信任,导致单家机构无法利用大量数据进行模型训练。长尾用户往往信用记录(例如申请信用卡、消费贷款等)较少甚至缺失,金融机构无法对其进行有效的风险评估,进而导致面向这一类客户能够提供的金融服务有限,但他们往往正是急需金融服务的人群。金融对于基础设施建设的安全和合规要求非常高的行业,全面布局隐私计算技术,从代码到系统层面有着非常严苛的要求,对于隐私计算产品的性能和适用性也有着非常高的要求。浦发银行采用多方安全计算的风险模型,利用浦发银行及其合作方的数据来共同提高模型的有效性,在保护用户隐私和数据安全的前提下,基于隐私计算框架“隐语”开发风控模型,提升独立自主风控能力,通过多方数据的安全协作将模型 KS 值大幅72提高,不仅识别出十几万名高风险客户,阻止了数十亿人民币的高风险贷款的发放。浦发银行基于隐私计算框架“隐语”构建了多方安全计算信用风险预测模型,建立更为精准的风控体系,实现差异化风控策略,为零售贷款业务中的长尾客户提供了更为优质的信贷服务:基于多方安全计算的模型训练包含六大流程:一是浦发银行与其合作方将训练数据样本上传至各自的数据存储服务;二是建模人员在多方安全计算平台通过可视化页面构建数据融合、特征工程、模型训练、模型评估等工作流;三是工作流以任务形式下发到协调器,后者将任务调度到对应节点的训练引擎;四是训练引擎根据任务描述,读取本地样本数据;五是训练引擎使用多方安全计算协议与对端协同完成一次训练任务;六是训练任务完成后,训练引擎将模型文件保存至各自的模型存储服务。应用模型的多方安全计算预测具体流程(以一次预测为例)也包含六大流程:一是决策服务作为预测请求统一入口,浦发银行从本地向它发起一次预测请求;二是决策服务根据模型 ID,请求预测引擎;三是预测引擎从浦发银行本地的特征服务获取在线特征,利用本侧的模型参数计算预测分数;四是浦发银行预测引擎向其合作方预测引擎发起预测请求;五是其合作方预测引擎从特征服务获取在线特征,利用本侧的模型参数计算预测分数,并返回给浦发银行;六是浦发银行预测引擎将两侧预测分数相加得到最终的预测结果。73银行在线上业务自主风控管理体系的构建中,主要面临两大挑战。一是数据采集范围局限:传统的信贷数据主要来自人行征信数据,在与各合作方开展线上业务合作的过程中,可用于线上审批模型及审批策略的基础数据来源较为单一,对于互联网生态环境下的多态数据获取及应用存在较大局限性;二是要在确保数据隐私的前提下,达成与合作方的数据融合、数据挖掘。浦发银行需要合规引入外部数据来增强风控模型效果,以对零售信贷业务中的长尾客户进行更准确的授信判断。多方安全计算(MPC)技术由于安全性上的优势,更匹配金融行业的联合风控场景需求。并通过融合秘密分享、同态加密等密码学技术,使得数据可用不可见。浦发银行提升了模型性能。与单一数据源模型相比,多方数据协作模型可以将模型的 KS 值提高 12%-23%。由于 KS 值普遍用于评估风控模型的效果,数值越高则意味着模型精准识别风险的能力越强。在信用风险管理、识别高风险客户方面,该模型识别出超过14.5 万名高风险客户,阻止了数十亿人民币的高风险贷款的发放,进一步提高了资产质量,减少了损失。同时,该模型识别出了 37 万名低风险客户,潜在授信规模约 80 亿元人民币,从而帮助银行拓展了零售信贷服务可支持的客户面。74中国将扩展和深化普惠金融的重点对象定为:小微企业、农民、城镇低收入人群、贫困人群和残疾人、老年人等。这类人群/主体对金融服务需求高,但金融机构往往缺少可以对这一群体进行信用评估的有效数据。金融机构在推进产品和服务方式创新时要首先考量防范风险,风险评估需要依仗大量的数据,普惠金融的发展,也依赖于数据流通。中国人民银行于 2021 年末发布金融科技发展规划(2022 年-2025 年)明确强化数据能力建设、推动数据有序共享、深化数据综合应用、做好数据安全保护以充分释放数据要素潜能。为积极响应央行科技司“金融数据综合应用试点”号召,网商银行与合作机构按照多方安全计算金融应用技术规范的指导,合作了网商贷场景的多方安全建模。此案例是基于多方安全计算实现金融机构间数据价值共享的探索,实现了以数据不出域为前提的金融机构间数据价值安全共享,在保护隐私数据的同时完成了数据的联合应用,为小微客户提供更为优质的普惠金融服务。传统网商贷场景的业务方案,是合作金融机构使用网商银行相关数据产品进行信贷联营业务中的风控决策,这种传统方案是网商银行向合作的金融机构单向反馈,合作的金融机构所独有的75客户存款、信用卡等相关数据,只能在单方风控中发挥作用,双方基于各自数据作出的独立决策一致性偏低,并未真正实现数据价值流通。网商银行在小微用户普惠金融服务中,与合作银行构建了网商贷场景的隐私计算新方案:双方拥有共同的客户、互补的特征维度,基于隐私计算框架“隐语”进行多方安全建模,通过联合模型实现优化审批通过率、降低新客户风险、加强贷中风控管理等。图 1“隐语”开发平台合作模式相比传统模式合作银行单向使用网商银行相关数据产品进行风控决策,双方通过隐私计算新方案在保护用户隐私的前提下,加强了数据价值的共享,提升了独立自主风控的能力。在框架层面,此方案基于“隐语”的良好分层设计及开箱即用的隐私保护数据分析及机器学习等功能,降低了风控技术平台的开发集成工作量,和风控算法团队的使用门槛,使得隐私计算得以更深入地应用于规模化的业务实践。76在基础设施层面,此次合作基于“隐语”框架搭建了组件更好用、流程更便捷的新的平台。比如,模型评审数据一键导出的功能,“小而美”地解决了用户为获取模型数据时,不需要从建模流程中每个组件获得运行数据,极大地提升了平台使用效率。金融风控的细分链路往往长而繁,每个环节都会面临数据安全的挑战,而为全链路提供高安全水位的 MPC 解决方案难度较高,现阶段对全流程金融智能风控的研究还在探索中。训练风控模型只是金融风控的其中一环,对于隐私计算来说,前期的数据分析、后期的模型服务所带来的难度都不低于机器学习,甚至 MPC 数据分析的难度还要超过 MPC 机器学习。针对上述挑战,网商银行与合作机构基于“隐语多方安全计算的金融风控全链路方案”提升了各个环节的安全等级:图 2“隐语”基于 MPC 的金融风控全链路技术方案一是数据注册。在数据资产注册环节,参与方基于 CCL(Column Control List)列安全约束功能,各自配置其数据资77产的安全约束;在项目创建后,对数据的使用会触发系统自动检查,确保后续操作满足双方配置的安全约束;二是样本对齐。基于隐私安全求交 PSI 能力,完成样本对齐处理,保证样本交集外的无关数据不泄露;三是特征预处理。网商银行与其合作机构利用特征预处理组件,进行空缺值/异常值处理、数据标准化、woe 分箱等联合特征处理,再配合“隐语”的特征统计组件如相关系数矩阵、全表统计、VIF 指标计算,完成多方安全数据分析的统计结果生成;四是模型训练。业务需要根据实际数据情况进行模型的选择和配置,参与方利用了“隐语”提供的通用机器学习算法,如逻辑回归、评分卡、XGB 等算法,在确保隐私保护的同时也能够控制业务开发成本;五是模型预测。一键提交部署将模型服务化,通过测试环境验证、冒烟、灰度、重跑等一系列措施保障稳定性,确保性能达到生产级别;六是监控和审计。针对模型上线服务,参与方调用“隐语”的业务指标监控能力,监控识别模型效果、进行服务版本升级。实现平台操作和运行日志可追溯、可审计,以便进行多方安全模型迭代或问题排查。已在浦发银行、江苏银行等累计 20 金融机构落地应用,根据应用场景不同,运用联合模型,可实现优化审批通过率、降低新客户风险、加强贷中风控管理等。此次合作中,两家银行针对78贷前 A 卡、贷中 B 卡分别进行了建模,产出共计 4 个模型,与单一机构提供的数据源建模效果相比,双方联合建模的模型 KS 可提高 10 %,加强了双方数据价值的共享,提升了独立自主风控的能力。79近年来,电信网络诈骗呈高发趋势,有着涉及面广、涉案金额多、手段层出不穷的特点,据国家反诈中心数据,2021 年共紧急止付涉案资金 3200 余亿元,拦截诈骗电话 15.5 亿次,成功避免 2800 余万名民众受骗。科技加立法,打击电信网络诈骗刻不容缓。2022 年 9 月 2 日中华人民共和国反电信网络诈骗法经表决通过,本次立法将电信、金融、互联网机构均纳入了反诈主体,力求跨行业、跨地区协同合作,有效防范、打击相应犯罪活动。这标志着我国反电信网络诈骗工作进入新的阶段,为反电信网络诈骗犯罪提供全方位的法律支撑。互联网诈骗手法不断翻新、模式持续升级,诈骗治理技术对抗性日益加大,对涉诈信息监测模版更新频率、基于大数据的诈骗信息识别能力、苗头性诈骗风险预警能力、技术反制能力等提出更高要求。隐私计算可以响应这种高要求并且保护数据交互流动的安全性。作为隐私科技与数据要素生态服务商,蓝象智联在中国人民银行广州分行、广东省公安厅相关部门的指导下,联合广州银行电子结算中心,整合政府、公安机关、多家商业银行、三大运营商及其他第三方数据源,搭建了“基于隐私计算技术的金融反欺诈联防联控平台”。通过隐私计算的模式实现反电诈的“数据联防联控网”,在利用该项技术实现数据可用不可见、保护各机构数据安全的前提下探索基于数据融合,提高反诈模型识别覆盖范80围、延长模型/策略生命周期,协同多个单位携手开启电信网络诈骗治理新模式。整体技术方案是基于蓝象智联的隐私计算技术构建金融反欺诈联防联控联盟,可以实现保护数据安全,减少数据流动阻碍,加速异业机构协同反诈效率等效果。在社会价值方面,该平台以隐私计算协同各行业进行联防联控,既探索了新技术赋能数据要素流动的可行性,又充分发挥了不同行业不同机构的数据和职能优势,多方合力针对电信诈骗做出有效监控、预警、联控、反制等措施。这一平台是新型技术赋能数据要素生态建设的具体实践,更是平衡数据要素安全开放和严管严控双重要求的新路径。在行业价值方面,该平台是在反电信网络诈骗法颁布以来首次以联盟形态构建基于隐私计算的金融反欺诈联防联控平台,平台由公安机关、政府、三大运营商和 10 多家金融机构共同组建,与传统点对点进行合作探索的反诈模式相比,蓝象智联的隐私计算技术能够承载更加复杂的一对多、多对多的联盟形态数据交互,对隐私计算行业的应用落地有很大的示范作用。在技术价值方面,该平台首次将多方参与的联邦学习算法引入到反诈领域,更首创了全流程加密联邦学习技术、“三盲”查询技术等创新技术,实现了不暴露数据明文信息的联合建模,同时满足通用与个性化不同场景的需求,最终实现多方数据安全共81享后的全链条式反诈联防联控。与单一机构自有数据进行模型训练相比,该平台模型性能提升 30%,全方位提升管控的数据范围,扩大金融机构的打击面覆盖;相较传统金融反诈数据建模项目,该平台整体实施成本降低了 50%;通过自适应和高性能的联邦学习方案,实现计算效率提升 2 倍以上。图 1 金融反欺诈联防联控平台架构图(一)组网架构(一)组网架构基于隐私计算的金融反欺诈联防联控平台的整体组网架构遵循数据流与管控流分离,数据流基于隐私计算在机构部署的隐私计算节点之间进行流动,管控流集中在枢纽方,通过枢纽方部署的协调节点对金融反欺诈联防联控联盟进行整体管控,保障稳定良好运行。(二)多方参与的联邦学习算法(二)多方参与的联邦学习算法基于隐私计算的金融反欺诈联防联控平台支撑超过 5 方的82多方联邦建模,可以实现多家金融机构、异业机构协同参与模型训练,底层依赖隐私计算的联邦学习技术,在保护各机构参与建模的样本数据不出本地的前提,仅通过共享模型梯度信息实现多方联邦建模。通过此能力可以充分利用异业海量数据提高模型精度,延长模型/策略生命周期,探索电诈治理新趋势。(三)支持多档建模方式(三)支持多档建模方式金融反欺诈联防联控联盟有多种联合建模场景,包括枢纽方主导发起的联合建模,成员主导发起的联合建模,不同的方式可以应用不同场景。枢纽方主导发起的联合建模主要用为联盟提供统一通用的场景解决方案,联合模型可以共享给每个联盟成员调用。成员主导发起的联合建模主要解决该成员特定业务痛点,帮助成员引入外部数据形成自己业务适用的个性化解决方案。(四)全流程加密联邦学习技术(四)全流程加密联邦学习技术在经典的联邦建模过程中,一般会暴露数据交集信息,但出于安全性考虑,数据交集信息也需要进行密文保护。基于隐私计算的金融反欺诈联防联控平台基于 OPPRF-PSI、Secret-SharedShuffle 以及秘密共享(SS)计算 sigmoid 函数等技术解决了多个难点,实现了全流程加密联邦学习技术,该技术较经典的联邦学习技术具有更高的安全性,可以保障联合建模过程不暴露任何明文交集信息。(五)基于(五)基于 PIRPIR 搭建搭建“三盲三盲”查询技术查询技术基于隐私计算的金融反欺诈联防联控平台基于隐匿信息检83索(PIR)、秘密共享(SS)、不经意传输(OT)搭建起“三盲”查询技术,通过枢纽方协调节点转发成员之间的调用请求,做到查询成员与数据提供成员身份的互盲,查询成员的查询数据基于隐私计算可以保障数据层面的隐匿,身份双盲和数据隐匿合为“三盲”查询。这项技术可以打破同业机构竞争关系的顾虑,实现同业数据安全共享。目前,基于隐私计算的金融反欺诈联防联控平台搭建完成。电信网络诈骗的治理新趋势是依托于跨行业的数据进行联防治理,在海量的数据中,数据联动和分享依然是个难题。隐私计算技术可以实现“数据可用不可见”,基于隐私计算的金融反欺诈联防联控平台,由公安机构、三大运营商和多家金融机构组建,将公安数据、社保数据、金融机构数据、运营商数据以及第三方相关数据在数据安全的前提下充分整合,协同治理电诈。“白手套”识别模型建设完成。基于蓝象智联的隐私计算技术融合了海量数据,通过数据的融合共创可以发现欺诈线索,进行智能提醒、特征分析和趋势预判,从而推动金融机构反欺诈监控识别和风险防控能力的提升。目前金融反欺诈联防联控联盟已经完成“白手套”识别模型建设,可以有效识别预测诈骗链路参与洗钱的账户风险,模型融合了三大运营商数据、金融机构数据以及第三方数据等不同领域数据,与单一机构自有数据进行模型训练相比,该平台模型性能提升 30%,全方位提升管控的数据范84围,扩大金融机构的打击面覆盖;相较传统金融反诈数据建模项目,该平台整体实施成本降低了 50%;通过自适应和高性能的联邦学习方案,实现计算效率提升 2 倍以上。公安参与形成联防联控机制。基于隐私计算的金融反欺诈联防联控平台引入公安机构参与,利用公安数据与外部其他行业数据联动形成联防联控机制。具体来看,该平台在反诈过程中,通过融合多家机构的相关数据,结合基于联邦学习技术建立的“白手套”识别模型,可以通过分数高低的模式来预测一个人成为欺诈人或受害人的可能性。在这个基础上,公安机关能够更高效地拦截可疑行为,保护受害者资金安全。85小微商户市场发展前景广阔,客户数量多、总体规模大,在繁荣经济、稳定就业、促进创新、方便群众生活等方面发挥着独特的重要作用,尤其是以个体工商户为典型的经营主体,金融需求多样、交易活跃,是未来优质客户的重要来源。但面对同业竞争压力以及数据安全“强监管”,银行业的数字普惠金融发展存在一定的挑战。2021 年,国家相继出台了数据安全法、个人信息保护法等法律法规,对个人信息、敏感信息的收集、处理和使用,数据的收集、存储、使用、加工、传输等提出了严格的要求。数据是数字普惠业务的核心资产,如何在安全合规的前提下,应用外部数据提升场景获客风控水平,已成为发展数字普惠业务的新挑战。隐私计算技术,能够高效且安全地帮助机构间在数据安全的要求下,打破数据壁垒进行数据共享使用。本案例充分利用蓝象智联的联邦学习平台,在原始数据不出库的情况下,实现某国有大行与中国银联商户信息补充,深入描述小微商户画像,为客户风险评估等提供更全面有效的数据基础。(一)打破信息互通壁垒(一)打破信息互通壁垒本案例应用蓝象智联的隐私计算技术,通过联邦学习平台,在原始数据不出行、保障信息安全的情况下,打破了信息互通壁86垒,实现“国有大行 银联”数据融合,有效解决隐私保护与大数据运用之间的矛盾,开创了银行与外部机构信息交互合作的先河。(二)构建全新场景模型及风控体系(二)构建全新场景模型及风控体系本案例通过引入银联收单及卡交易信息,结合该国有大行行内已有的征信、流水等信息,进一步丰富风险画像,构建全新场景风控体系:在入口端,优化商户违约预测模型,风险识别效果提升 20%;深入分析商户收单特征,打造“刷单套现”精准识别模型,有效防范欺诈风险。在闸口端,基于知识图谱技术,引入银联卡交易行为,补充借款人同名跨行及关联交易的资金流向分析,打造全新的资金流向违规领域探测模型,提升贷后监测覆盖面及精准度。(三)实现全线上智能运维管理(三)实现全线上智能运维管理本案例基于模型风险评估,结合业务经验,制定了综合化授信、差异化定价等精细化应用策略,实现全线上智能运维管理。同时,以业务发展为导向,创新打造面向小微商户的开放式融资服务新模式,进一步扩大服务面,提升金融普惠性。客户可在线主动申请业务,由系统开展自动审批,实现最快“三分钟申请、一分钟放款”,大幅提高业务办理效率和客户体验。87图 1 合作模式示意图本项目通过蓝象智联的隐私计算技术,实现数据补充,数据维度更为丰富,模型效果提高,与原有模型相比,小微商户业务模型的性能提升 20%,且客户准入率提升。能够高效且安全地帮助机构间在满足数据隐私、安全和合规的要求下,打破数据壁垒进行数据共享使用,较传统开发的效率提升巨大,实施成本降低50%。通过自适应和高性能的联邦学习方案,实现计算效率提升2 倍以上。该国有大行与中国银联总部基于隐私计算技术,实现了丰硕的实践成果。一是基于蓝象智联的联邦学习平台隐匿求交,实现数据“可用可不见”,在原始数据不出门的情况下,引入银联商88户收单及卡交易等信息,实现“国有大行 银联”数据融合;二是通过集成思想,研发商户违约预测、“刷单套现”精准识别以及资金流向违禁领域探测等三大模型,覆盖客户准入、反欺诈及贷后资金流向监测等方面;三是制定综合化授信、差异化定价等业务应用策略,实现流畅的全线上运营,打造开放式商户融资服务新模式,为普惠业务发展再添新动能。89伴随着云计算、大数据、人工智能等新一代信息技术的落地应用,数据作为战略性和基础性资源,不但是连接虚拟空间和实体空间的纽带,也是数字经济体系中技术创新、需求挖掘、效率提升的重要动能。但数据在不断创造价值的同时,其数据共享、安全保护、合规应用等问题也成为政、产、学、研、用等各界关注的焦点。目前,多方主体的数据协作成为趋势,数据安全合规风险亟需消除。当前,全球数据总量呈现指数型增长态势,但从现阶段数据的从属来看,海量数据散落于不同的组织机构和信息系统中,即使是同一区域、产业和企业,也仍存在“数据孤岛”问题。多方的数据协作已经成为医疗、工业、零售、金融、政务等领域挖掘数据价值的重要路径,聚合态体系中的多方数据进行联合建模分析也是当下大数据价值的必然选择,但数据安全和合规仍是多方主体数据协作过程中的痛点问题。数据法律体系日益完善,推动企业加速构建数据应用安全合规体系。近年来,数据保护成为全球关注的焦点,一方面,数据保护法律法规体系逐渐清晰完善。2020 年,我国的民法典、出口管制法、数据安全法(草案)、个人信息保护法出台或公布,不断填补我国数据安全管理方面的空白,另一方面,90各国关于数据保护的监管执行日趋严格。隐私计算是保护数据本身不对外泄露前提下实现数据融合的一类新兴信息技术,隐私计算为实现安全合规的数据流通带来可能。隐私计算主要有多方安全计算和可信硬件两大流派。其中,多方安全计算是基于密码学理论,可以实现在无可信第三方情况下安全地进行多方协同计算。浙商银行是 2004 年成立的全国性股份制商业银行,随着数字经济逐步成为经济发展新引擎,浙商银行以数字化转型为主线,不断破题探路,主动融入浙江数字化改革大潮。其中,通过数字驱动,解决小微企业授信风控问题,是浙商银行数字化改革的目标之一。在以往的数字化和智能化的实践过程中,浙商银行已经具备高水平的风控建模能力,且已在本地建立起一套小微企业风控模型,模型中所使用的数据特征,是以存量企业客户的存贷款流水、产品持有情况为主,衍生出的金融行为特征。浙商银行在不断探索、持续优化模型的过程中发现,模型效果的提升已到达瓶颈,仅通强化本地的数据的特征工程,或进行模型层面的参数调优等操作,收效甚微。由于数据局限于本地,且外部合规数据无法以接口或其他形式导入行内参与模型优化,因此模型效果难以进一步提升。为了解决数据瓶颈问题,浙商银行向浙江省金融综合服务平91台(以下简称省金综平台)寻求合作。省金综平台是浙江银保监局联合浙江省发改委、浙江省大数据局等部门,为提升金融服务实体能力所打造的线上服务平台。平台在省公共数据平台专门建设“金融主题库”,对接市场监督管理局、法院、税务、环保等 55 个省级部门,由专门的数据团队对数据进行整理挖掘,构建专业化的数据质量评价和控制体系,开展数据清洗和治理工作,形成了一套庞大的企业标签体系。2022 年,浙商银行、浙江银保监局组建了专项组,针对企业数据共享的应用需求,运用隐私计算技术,经过深入分析研讨,设计提出了基于隐私计算的数据共享解决方案。方案总体思路是:以信息共享、供需对接、业务协同为原则,制定相关的数据使用审核机制,依托隐私计算技术,确保共享数据在跨机构之间的隐私保护,从而达到安全合规的数据共享需求。具体来说,方案包括四个方面内容。(一)隐私计算数据共享制度(一)隐私计算数据共享制度浙商银行是省金综平台首个通过隐私计算对外赋能的金融机构,为此,省金综平台根据浙江省公共数据条例的精神,充分研究了隐私计算在浙商场景应用的合规性,然后针对基于隐私计算技术的数据共享制定了 浙江省金融综合服务平台隐私计算平台管理方案,对金融机构使用省金综平台数据进行了制度上的规范。制度中包括了入驻条件、入驻流程、日常管理、数据管理以及退出机制。92(二)隐私计算数据申请和数据使用流程(二)隐私计算数据申请和数据使用流程为了确保金融机构对数据使用安全、合规,省金综平台制定了严格的数据申请流程。首先,入驻技术供应商开展工作所必需的数据导入工作应由合作银行方代为申请,入驻银行应参照省金综平台现行数据使用要求,向金综发起“隐私计算建模场景”相关业务的申请。第二步,对具体使用的场景数据进行 OA 申请。第三步是建模任务的审批,在平台开展建模任务前,需要在平台上发起任务申请。最后是应用审批,模型构建完成上线之后,在应用之前需要在平台上发起应用申请。整个流程如下图所示。图 1 省金综平台隐私计算数据使用流程(三)隐私计算技术平台(三)隐私计算技术平台隐私计算技术的使用必须通过合格的平台供应商提供的隐私计算平台进行,其中,供应商应同时满足三大条件:一是采用隐私保护及加密技术的项目产品获主管部门或第三方机构评测93通过;二是具有运营商、政务或银行等合规隐私数据源应用经验;三是已与拟合作银行确定一个隐私计算应用场景。浙商银行选择了杭州金智塔科技有限公司提供的隐私计算平台,该平台是国内唯一脱胎于国家重点研发项目的专业隐私计算应用平台,通过了信通院在内的多个权威机构的认证,并在政务和金融领域有多个成功应用。该平台内嵌了支持多应用场景的常用联邦学习和多方安全计算模型以及隐匿查询、联合 sql、自定义算子等功能,实现了数据分级分类管理、数据质量审计、模型效果审计、数据应用存证等数据安全与隐私保护全流程管理。具有节点扩展成本低、部署迭代便捷、运算效率高、算法扩展灵活等优势。(四)隐私计算数据建模(四)隐私计算数据建模隐私计算技术的利用,数据和模型通常是密不可分的。数据的共享是为了建模,在建模之前,省金综和浙商银行通过专线连接了双方的网络,并在双方部署金智塔隐私计算平台。隐私计算平台采用去中心化的部署方式,避免因数据交互产生的数据泄露风险。其中省金综部署了隐私计算调度节点和计算节点,浙商银行部署了计算节点。调度节点负责接受计算节点的多方安全计算任务,数据权限审核通过后,再将任务进行分解、协调并分发到各个计算节点,整个过程中不接触计算节点的任意数据。计算节点负责数据的载入、本地任务的计算、节点间加密样本对齐和加密交互计算,需94要在每个数据提供方部署计算节点。图 2 隐私计算建模流程如图 2 所示,该流程共分为七个步骤:一是由浙商银行发起计算任务,省金综调度节点下发任务给计算节点;二是两个节点分别将源数据导入前置数据区,前置区是隐私计算节点中的一块数据缓冲区,用于将数据方的内部数据读入隐私计算平台以及存放模型结果,起到隔离作用;三是计算节点分别读取前置数据;四是浙商银行和省金综做加密样本对齐;五是浙商银行和省金综做加密交互计算;六是浙商银行获得计算结果;七是浙商银行应用计算结果。针对上述方案,项目组还对方案所涉及的关键问题进行了梳理与深入探讨,并提出了相应的解决方案。(一)隐私计算加密方法的性能问题(一)隐私计算加密方法的性能问题相比明文计算,隐私计算的加密方法会导致计算量和网络开销的指数级增长,为了解决此问题,项目组提出了一种将随机排95列和秘密分享结合的隐私保护机器学习框架。这种方法比现有的加密方法更有效,可以显著减少计算开销。同时,相比联邦学习算法更加安全。实验结果表明,该方法不仅计算速度快了 5 倍,而且减少了 80%的网络开销,该项成果发表于 KBS。(二)数据稀疏性问题(二)数据稀疏性问题跨域推荐(CDR)被广泛研究以缓解推荐系统中普遍存在的冷启动和数据稀疏问题。大多数现有的 CDR 模型都假设信息可以直接跨域传输,而忽略了隐私问题。在准入模型中,风险数据也表现出了稀疏性特点。为了解决这个问题,项目组提出了一种基于两阶段的隐私保护 CDR 框架。该方法既可以保护数据源的隐私,又可以缓解数据稀疏性。实验结果表明,在两个基准数据集上,该方法具有普遍的有效性,该项成果见专利联邦推荐模型训练方法以及系统。(三)联邦学习算法的效率问题(三)联邦学习算法的效率问题常见的联邦算法大多是基于企业方提出的 FedAVG 范式实现。然而随着数据的复杂度与模型参数量的提升,模型采用这类算法训练时的数据通信量和迭代轮数都会显著提升,联邦学习中的算法效率成为了瓶颈。项目组创新性设计联邦学习算法,该算法根据模型参数构建初始全局业务模型,以及构建每个模型参数对应的噪音业务样本;利用噪音业务样本对初始全局业务模型进行训练,直至获得满足业务训练停止条件的目标全局业务模型。经验证,该算法成倍提升了联邦学习算法的效率。该项成果见专利 基96于噪音蒸馏的联邦学习系统及方法。(四)数据质量的监控问题(四)数据质量的监控问题由于对方的数据可用不可见,因此难以对对方的数据质量进行实时评估和监控。为了解决这个问题,项目组开发了对数据源质量的实时监控功能,将数据质量监控的时间维度从线下月度审查缩短至线上分钟级别审查,时效性提升 3 个数量级。基于上述方案,浙商银行利用金智塔隐私计算平台进行了企业准入模型,企业贷后预警模型的开发。该平台提供了丰富的应用功能。数据处理过程支持数据审计功能。界面如图 3 所示:图 3 数据审计97在建模过程中,可以拖入数据合作方算子,选择数据源、使用字段及其他相关设置,拖入数据预处理算子、特征工程算子进行相关配置,拖入隐私求交算子将多方异构数据通过选择 ID 进行融合对齐,最终拖入安全模型算子填写对应配置,点击运行,进行训练,运行时可以实时查看到运行结果及日志,并且可以实时中断训练。界面如下图所示:图 4 模型训练模型构建完成后,平台提供了模型结果报告,其中展示了训练效果、贡献评估等。界面如下图所示:98图 5 模型报告另外,平台还提供了通信存证、资源预警等功能。界面如下图所示:99图 6 通信存证图 7 资源预警从模型效果而言,浙商银行通过从金综平台引入 200 多维特征数据,和行内数据联合建模所产生的模型,相较于以往基于本地数据建立的模型,其 KS 值、AUC 值总体提升为 15%,效果显著。从发展角度而言,浙商银行在此次实践过程中,成功创建且100加入了一个数据联盟,打破了双方的数据孤岛,未来,此联盟将继续吸纳新的数据源,并不断尝试将隐私计算解决方案应用于包括营销、授信在内的各种业务模型,持续为浙商银行的数字化转型之路赋能。同时,浙商银行案例的成功实施,是金综平台通过隐私计算技术将公共数据向金融机构赋能的首次落地应用,标志着在隐私计算技术的发展道路上迈出了坚实的一步。101为加强集团内跨业跨机构的风险防范,强化消费者权益保护与履行社会责任,做好建行集团内的客户信息共享和数据安全保护,建行积极在集团内开展隐私计算技术应用。在获取用户授权,合法合规使用数据的基础上,也充分应用数据安全技术保护客户数据安全,发挥数据生产要素的价值。隐私计算多种技术在安全、效率、效果等方面各有侧重。针对不同的应用场景需求,可以使用某种技术或组合使用多种技术。金融行业的场景主要包括智能风控、智能营销、智能运营、匿踪私密查询、供应链金融、反洗钱、反欺诈等。从 2020 年起,建行运用隐私计算技术进行了集团一体化建模探索。以建信基金子公司与建行的探索为例,介绍建行在集团内实践的一些经验。该项目被中国信息通信研究院和中国信息标准化协会大数据技术标准推进委员会认定为“隐私计算优秀案例”,获得“星河”奖项。该“智能营销”案例是通过在生产环境中利用真实业务数据进行基于用户特征维度拼接的纵向联合建模,针对“速盈客群价值提升场景”,实现跨双方隐私计算模型建立,定位目标客群,提升客户价值。在实际的营销中,针对评分前 5%客群的响应率相对于单边模型提升 34%。本项目使用隐私计算技术里面的联邦学习技术(Federated102Learning),其核心思想是通过在多个拥有本地数据的数据源之间进行分布式模型训练,在不需要交换本地个体或样本数据的前提下,仅通过交换模型参数或中间结果的方式,构建基于虚拟融合数据下的全局模型,从而实现数据隐私保护和数据共享计算的平衡,即“数据可用不可见”、“数据不动模型动”的应用新范式。本项目在联合建模的过程中,利用金融机构的销售数据,与合作机构产品系列特征,在真实业务数据上进行了纵向联邦建模,实现跨机构的特征维度数据融合,实现跨双方模型训练,定位目标客群,助力客户价值提升。通过在集团内近 3 年的建设和推广,明确了建行集团内隐私计算技术的安全技术架构,厘清隐私计算技术与业务场景对应支持关系,以及隐私计算技术的业务管理模式。隐私计算平台在架构上采用了“中心化管理”和“分布式计算”相结合的安全技术架构,在不泄露源数据的前提下实现数据安全共享。建行作为平台管理者,管理所有计算节点,同一家子公司支持部署多个计算节点的模式。依托建行现有云基础设施能力,对于集团内有数据共享需求的机构提供快速搭建隐私计算节点的能力。由子公司数据共享安全计算平台承接子公司的计算节点,根据法人区分系统,归属子公司服务逻辑子系统。不同机构间访问需要通过双外联联通。从基础设施、应用、数据等多层面实现了数据的隔离和安全共享需求。103独创离线审计技术,解决隐私计算过程不透明问题,切实做到不同法人间数据使用过程的可追溯和可审计。除了常见的信息存证,建行采集了更多用于任务复现的关键信息,将任务配置,所用数据,密码学随机因子,交互报文等信息进行 Hash 上链存证,利用区块链的不可篡改特性,保证计算过程真实性。在审计时,通过模拟其他参与方,可实现离线审计功能。相比于简单的区块链存证,这种审计力度更强,更有效。对于数据提供方起到极大的约束力,增强了需求方信任,也为监管方提供了可监管能力。本项目通过为建行集团内不同法人单位提供隐私计算技术和平台,实现了数据的共享使用。在建信基金子公司与建行“智能营销”案例里,为消费者提供个性化与精准化的服务。在本项目中,双方在生产环境中利用真实业务数据进行了基于用户特征维度拼接的纵向联合建模,实现跨双方隐私计算模型建立,定位目标客群,助力客户价值提升,从而为客户提供更全面、更综合化的金融服务。104数据已经被列为与传统要素并列的新型生产要素。去年,国家出台数据安全法、个保法等一系列法案,数据安全的法律法规和监管逐渐趋严,数据无法直接在实体间转移、交换,各机构底层数据不互通形成“数据孤岛”。在应用隐私计算技术以前,尤其是营销场景下,行内与第三方支付机构彼此数据不互通,第三方机构作为营销渠道方,往往无法对客户进行精准营销,导致业务转化率低、银行方营销成本高等问题。本方案通过隐私计算中的隐私集合求交、匿踪查询等技术,帮助营销渠道方结合行内用户信息找到营销的目标用户,用于促活、促绑、交易失败挽回等业务场景,提升营销效率。一是过去通过第三方支付机构较为粗放的客群筛选逻辑下,客群精度很低,目标客户的比例很低,当前利用隐私集合求交技术可实现行方目标客群与第三方支付机构待营销客群的精准匹配,用于促活、促绑等业务场景,可有效降低营销投放成本。二是对于在第三方支付机构支付失败的用户,第三方机构可通过匿踪查询的方式提前识别行内储蓄卡、信用卡用户是否为足额可用状态,结合支付机构收银台首页、失败挽回、退出挽回等支付链路,优先推荐行内卡支付。匿踪查询的优势在于保护了双方权益,一方面行方并不会知道当前是哪个客户正在进行支付业务,同时第三方支付机构也不会知道除该客户是否卡余额足额可105用之外的任何信息。一是合法合规性问题。严格按照个人信息保护法相关要求推动项目进程,行内与第三方支付机构均需严格的法律合规审查,评估各场景下是否可能存在授权不足等不合规问题,若有则在业务流程中补充完全用户授权,再推进项目。二是技术安全性问题。本项目所运用的隐私集合求交 PSI、匿踪查询 PIR 等算法在学术界已获得广泛认可,也在很多场景下有进行实践应用。本项目一方面通过协议明确各合作方的责任边界并进行约束;一方面双方深度参与算法实现工作和技术测试,确保算法性能、安全性等符合预期;一方面在项目的各个环节增加审批存证等功能,确保事中可控制,事后可追溯。本项目方案已经通过技术、业务、法律合规等充分评估,确保项目技术安全可靠、业务真实、过程合法合规。106光大集团拥有银行、证券、保险、信托等金融全牌照,但以往受限于“数据孤岛”的问题,为客户提供的服务都是基于单一单位的产品、服务、渠道,以及对于客户单一金融属性的认知和数据沉淀。在搭建了集团级多方安全计算平台后,具备了打通集团内各单位的数据,在保护客户数据隐私的前提下,整合各业务线的客户信息,开展一站式客户服务、全生命周期营销和风控的能力。高净值客户价值倍增案例,就是通过集团级多方安全计算平台链接银行、保险、信托三方数据,统计客户在集团各单位的整体金融资产水平,识别集团视角下整体资产较高的客户,特别金融资产分散但总价值高的优质客户,并为这些客户提供集团视角的升级服务和有针对性的营销,提升整体竞争力、加强客户粘性、拓展市场规模。在保护客户隐私明细与计算逻辑前提下,对光大集团下的银行、保险、信托三方共同客户进行资产摸底,获取潜力私行客户,并进行专项客户营销推广。通过该场景的落实,集团在保证监管合规、数据安全的基础上,实现对客户的统一服务、精准识别、业务联动和价值挖掘,提高客户满意度和粘性,实现业务增长。107在传统的银行保险业务中,各自数据独立维护,双方间通常采取直接分享的方式进行数据使用和数据协作。随着数据安全和个人隐私保护相关政策的出台,对个人信息及敏感信息的收集、处理和使用提出了严格的要求。如何安全合规地使用银行保险间的数据进行协作,成为亟待解决的问题。隐私计算技术可以在不暴露原始数据的情况下进行数据协同计算,保护数据的隐私和安全。基于隐私计算技术的跨机构间数据融合成为银行保险业间数据生态建设的新方向。通过隐私计算技术,在确保用户隐私信息不泄露的前提下,双方机构利用数据进行协同计算和分析,既可以保护各自用户的隐私信息不泄露,也可以通过多个数据源的联合分析,挖掘更丰富的数据信息,构建更全面的用户画像,实现更精准的银保联合营销,提高联合营销的服务效率和客户体验,降低营销成本,提高业务收益。浦发银行通过结合对数据要素流通的研究和区块链、隐私计算等前沿技术,构建跨机构间的安全、可信、高效、有序的数据协作环境数据多方安全计算应用系统,通过数据确权、数据合规运营等建立数据资产化的完整流程,并支持在明文不出本机构的情况下,实现数据资产在密态情况下的联合计算、联合建模、108联合训练。并使用区块链技术对数据资产化、数据流通的关键交易步骤进行加密可信存证。打破机构间的数据孤岛,为机构间的“联合求交”、“联合风控”、“统一用户画像”、“联合营销”等场景提供技术与平台能力,使得数据的计算价值,在机构间自由的流动,为跨银行保险机构间的数据协作提供底层的技术解决方案。数据多方安全计算系统是完全基于 MPC 技术实现的,安全性高,数据以密文分片的形式进行流通,目前已支持数据安全求交、匿踪查询、统计分析、联合建模、联合预测等数据协作算法。系统已在浦发银行的行内环境完成具体场景验证,可支持千万级数据的计算,计算时间控制在分钟级以内,在性能上有了很大的突破,并与外部机构在生产环境已实现相关业务场景的应用落地。在该系统中还形成原生的穿透式的监管存证服务模式,能够实现对数据流通全流程的监管与维护,有助于业务场景的合规落地与推广。浦发银行车生态平台,通过数据多方安全计算应用系统与头部保险公司进行用户数据协同计算,发挥联动优势,共建客户流量池,刻画精准客户画像,为双方共有车生态用户提供更具个性化、定制化、专属化的银保服务。目前已通过浦发车生态平台对双方共有的临期车险客户进行相关业务营销。109传统的保险获客方式是以代理人线下地推、电销等为主,随着互联网的发展,企业的获客方式也发生翻天覆地的变化,互联网流量时代的到来,让企业想方设法去获取流量,实现流量变现。对于保险企业,如何在流量端获取到精准的客户,需要依靠流量端大量的用户特征,但是越来越多的企业涌入,以及各种数据安全法规,政策的出台,加大了流量变现的难度。针对流量端只有用户特征,保险公司仅有用户转化标签,数据彼此独立的情况下,隐私计算作为一种安全高效的方式,在数据隐私得到保护的情况下,通过联合建模,训练出更适合从流量端大量客户中筛选中对保险感兴趣的客户。根据双方的数据协同程度,可以有两种选择的技术方案。刚开始保险公司与互联网数据伙伴、营销渠道的数据协同不高的情况下,可以主要依赖保险公司的内部优质潜客挖掘,然后通过安全隐私求交的方式,输出共有标识进行营销投放(如图 1)。图 1 通过安全隐私求交的方式进行精准营销110如果保险公司与互联网数据伙伴、营销渠道的数据协同水平较高,可以通过联邦学习建模的方式,打通双方共有客户信息,进行针对性联合建模。然后再根据联邦模型预测优质潜客名单,精准度更高。图 2 通过联邦学习的方式进行精准营销这两种方式在数据处理的复杂程度、效果、提数风险、数据协作复杂度、操作复杂度等方面都有一定的差异。本项目创新在于针对不同的数据协作状态可以使用隐私计算的 2 种方式进行合作推进。首先通过安全隐私求交的方式快速地建立合作,进行精准营销投放。随着双方的数据积累的提升,可以升级到联邦建模的方式,进一步提升投放的精度,实现高质量投放来降低获客成本。通过安全隐私求交,获取流量公司和保险公司的共有客户,基于这种方式可以初步完成精准投放。之后,基于流量平台的用户特征和保险公司的目标,进行联合训练,获得模型,将模型应用于流量平台的非交叉客户,从中筛选出优质客户,通过流量平台的流量入口进行获客营销。整个从流量平台获取新客的协作过程中,对比传统的协作方式,要解决三个关键问题。111一是个人信息保护法要求的以个人权益影响最小方式原则进行精准投放。隐私计算的方式比传统的数据传输的方式,在去标示化方面,在保护非共有客户信息方面都有较高的改善。二是通过隐私计算的方式可以加强通信的安全性,隐私计算过程中,整个通信数据都是以伪随机数的方式进行数据通信的。对比传统的 API 通信方式,隐私计算的方式在网络攻击、信息泄露方面的风险大幅度降低。三是通过 2 种隐私计算方式的递进,方便协作的展开以及合作后投放精度的提升。可以兼顾金融公司与互联网公司合作的效率与效果。本项目方案在保险公司未来的精准营销获客上,大幅度提升了保险公司数据输出的合法性、安全性。并且通过 2 种隐私计算方法的配合,提升了解决方案的可行性。并且在获得用户授权方面,合作双方都只需针对自身客户进行授权协议的修改与补充。在此基础上,进一步配合改进营销获客双方的合作合同,进一步确保双方在投放数据的存储、使用、效果跟踪等方面的各自的义务与责任。综合上述隐私计算解决方案、用户授权以及营销投放合作合同三方面的配合,基于隐私计算的精准营销获客必将成为保险公司与互联网渠道合作实现精准营销获客的新范式。1122020 年居民可投资资产规模突破 180 万亿,各大券商纷纷提出财富管理转型。财富管理业务的关键是基于客户真实的财富水平、风险偏好以及所处生命周期为其提供匹配的资产配置服务,因此需要大量的客户数据。但目前机构对于客户的了解只局限于本机构的内部数据,而客户的数据往往分散、割裂在不同机构中,例如交易数据在券商、借贷数据在银行、消费数据在支付机构等,难以构建完整的客户画像进而为客户定制个性化的资产配置策略。同时,当前行业机构间缺乏数据安全共享机制和动能,导致金融机构普遍不愿意直接分享客户信息。最后,2021 年底,个人信息保护法 数据安全法的相继出台,对客户信息共享有了更为严格的规定,行业缺乏可参考数据共享案例,普遍面临着无数可用的困境。因此,金融行业财富管理转型亟需在以下三个方面寻求突破,一是丰富客户数据,完善客户画像,精准了解客户需求;二是保护敏感信息,共享数据内在价值,完善激励机制,鼓励创新业务落地;三是探索合法合规技术路线,打造可供行业参考的标杆应用。本项目提出了基于隐私计算和区块链技术的数据共享方案来解决上述难题。通过数据合作共享健全客户画像、挖掘客户需求、预测客户意图,为客户提供与自身风险承受能力和实际投资需求相匹配的财富管理服务,有助于提升客户服务体验,提高财113富管理机构服务效率,更加契合以客户为中心的“买方”财富管理思路,为财富管理从“卖方模式”到“买方模式”的转型提供业务参照。具体业务场景包括:一是开发潜在理财型客户。一般新开户客户信息较少,无法构建完整的客户画像,可通过人口属性、地域属性等信息进行建模,形成各自的潜在理财型名单,再利用隐私计算技术识别机构A 的客户是否在机构 B 的理财型客群中。二是定位潜在富裕客户。客户资产分散在各个机构中,部分资产量较小的客户可能为潜在的富裕客户。可通过对客户资产综合评分、基础属性、跨境消费属性等进行建模,形成三方各自的潜在富裕客户名单,再通过隐私计算技术进行名单的安全交集运算,最终识别机构 A 的客户是否在机构 B 的富裕客群中。三是财富客户身份互换。金融机构会根据客户的资产规模、行为特征、贡献情况等为客户设置会员等级,并提供相应的会员服务。可通过对客户会员等级、消费习惯等信息进行建模,形成各自的客户身份等级名单,再通过隐私计算技术获得属于同类等级的客户群体。传统数据共享方案,数据交换往往通过第三方中心化机构,数据主权难以保护,还可能由于黑客盗取、系统漏洞等原因造成数据大规模泄露。基于 PKI 等传统密码学的方案解决了数据传输过程中的保密和安全问题,但是在数据使用环节仍然是明文,这既有损数据源方对于数据保密性的利益,也易发生数据泄露风险。114隐私计算则是完全基于密文运算,运算过程中涉及的数据均经过了加密处理,从中反推回原始数据的可能性目前仅存在理论中。本项目创新性地将隐私计算与区块链技术有机融合,隐私计算借助区块链获得了可信执行环境,区块链经过隐私计算获得数据保密能力,两者相互赋能,形成跨行业数据融合应用的创新平台型基础设施,二者有机结合,逻辑上相互独立,采用 API 接口方式实现对接。通过使用隐私计算技术,基于密文对数据进行处理和安全计算,保护数据作为金融机构的核心资产而不泄露,解决数据共享过程中数据的“隐私性”问题;结合区块链存证、积分激励等机制,设计赏罚分明的积分奖惩机制,所有操作上链存证、可追溯,解决数据共享过程中的“不愿共享”问题。同时,设计合理的授权流程,满足个人信息保护法、数据安全法等新规要求,充分履行用户授权和个人信息使用告知义务,解决数据共享过程中数据的“合法合规”问题。本项目使用的核心隐私计算算法为隐私集合求交算法,该算法能找到两个集合的交集,但是双方都无法获知交集以外的对方集合数据。算法执行前,原始名单数据由双方内部建模后产生,且不透露给对方。算法执行中,运算过程中涉及的数据均经过了加密处理且不可反推。算法执行后,结果对于查询方和数据源方对等,相对于匿踪查询(OT)等算法能更好地履行用户授权和告知等个人信息保护义务。一是合法合规性问题。其中 个人信息保护法 第二十三条,115个人信息处理者向其他个人信息处理者提供其处理的个人信息的,应当向个人告知接收方的名称或者姓名、联系方式、处理目的、处理方式和个人信息的种类,并取得个人的单独同意。接收方应当在上述处理目的、处理方式和个人信息的种类等范围内处理个人信息。本项目采取了各种去标识化技术方案,同时还对 个人信息保护法第 23 条的全部要求进行了落实,如要求客户签署单独同意函,并且进行增强告知,告知接收方名称、联系方式、处理目的、如何形式权利等要求;同时也与合作机构都签署了合作协议,明确了各方的权利义务,如合作机构端不得留存试点过程任何投资者个人信息等。此外,依据个人信息保护法第55 条、第 56 条的相关要求,项目正式启动前,国泰君安及合作机构还会进行个人信息保护影响评估,聘请专业律师事务所出具项目合法合规报告,同时在通过监管部门创新试点审批后才正式上线运行,确保项目合法合规。二是技术安全性问题。本项目将在国泰君安与合作机构搭建隐私计算系统,可能存在信息系统安全、网络安全等风险。同时隐私集合求交 PSI 算法虽然经过了学术界论证,但是在行业应用案例较少,故也可能存在性能较差、潜在漏洞等风险。针对信息系统风险。项目将在系统上线前进行全链渗透性测试、安全扫描、压力测试,对相关操作人员进行应急处置培训;建立系统信息隔离机制,做好系统隔离和数据隔离;对数据共享关键过程进行存证留痕,做好备份审计工作;使用专线进行通讯通信加密传输,消除网络风险。项目采用了已被业界广泛认可的基于 RSA 的隐私求交算法,该算法已在合作机构内部经过多个项目验证安全有效,116性能指标符合预期。同时,项目组密切关注算法最新理论研究成果,通过协议明确合作方在算法出现风险后不得进行数据破解或者逆向工程,且约定了项目暂定、项目终止、项目退出等应急预案保障措施。本项目方案已经过技术、业务、法律合规、风险控制等充分评估,确保本项目技术安全可靠、业务真实有用、共享过程合法合规。项目未来在行业进一步推广,将有助于行业机构合法合规地利用外部机构丰富的数据资源来加深对投资者财富管理、风险承受、产品偏好的了解,从而为客户提供更全面、更综合化的金融服务,为金融行业高质量数字化转型奠定坚实的数据底座。117保险属于典型的“数字密集型产业”,“大数法则”决定了保险数字属性的与生俱来,保险经营的过程可以说就是数据处理的过程。随着信息技术的发展,社会正在快速进入数字化时代,在各类场景中都在不断产生数据,保险公司以往惯用的内部数据已经无法跟上新时代的需求,需要依赖大量外部数据来更好地识别和评估风险、制定更有效的营销运营策略。近几年国内外一系列数据安全与隐私保护相关政策法规密集出台,以往的粗放式数据收集、使用与交易模式将被严格规范和限制。为保障数据交易中的隐私安全,行业涌现出多种技术解决方案,中国人寿财险进行了深入研究,在考虑了安全性、可用性和自主可控性等因素的情况下,选择了隐私计算技术,在隐私计算框架下,参与方的数据明文不出私域,在保护数据安全的同时,能够实现多源数据跨域合作。因此,中国人寿财险通过建设隐私计算平台,破解数据融合价值安全释放的难题,真正实现“数据可用而不可见”的价值理念,促进内外部数据融合应用。中国人寿财险所建设的隐私计算平台是一款基于多方安全计算、联邦学习技术的数据智能应用平台,以保护数据隐私安全为前提,能够一体化地完成从数据集成、探索分析、联合运算、118多方建模、辅助决策等一系列流程,解决了数据协作时无法安全利用各方数据的困境,将智能化、数字化落地到实际业务应用功能中,助力以数据驱动为核心的开发、运营和产业升级。平台基于多方安全计算、联邦学习混合引擎,完成多方数据的融合计算、训练建模和在线推理,能够同时保证数据安全性和计算精确度。平台支持“图形化”方式进行联邦学习建模,流程简单、智能、可视,保证过程的不可篡改性与可溯源性,达到原始数据不出私域即能完成数据共享应用的效果。平台提供了互联互通框架,保留了与异构隐私计算平台之间的联合计算和训练建模的能力,解决了市场上不同隐私计算平台之间无法联通、影响数据应用的难题。平台具备多种功能,满足各类内外部数据融合应用需求。一是联合建模。在保护各参与方原始数据的前提下,平台只交换模型训练过程中加密计算的中间结果,结合内外部更为丰富的特征维度数据,实现多方的联合建模。可用于构建营销模型、风控模型、产品研发等多种机器学习建模场景。二是联合计算。平台支持各参与方在互不暴露任何客户隐私信息的前提下,自由配置指定计算条件进行统计计算、逻辑运算,以更加精准地挖掘满足业务场景所需的符合特定行为特征的客户。主要可用在高价值客群识别,客户风控类标签统计等场景中。三是匿踪查询。安全实现让数据拥有方无从知晓数据查询方的查询信息,而查询方也无从知晓拥有方除查询信息外的其余信息。适用于高价值客群查询、119黑名单用户查询等涉及数据查询的场景。四是联合筛选。在各方不暴露自有数据的前提下,利用多方安全计算联合外部数据勾勒出更加精准的存量客户画像和实现维度更广的行为特征筛选。可用于丰富客户画像、营销客群筛选、高风险客群筛查等业务场景。中国人寿财险建设隐私计算平台旨在解决三个方面的问题:一是如何在数据管理愈发严格的当下,仍能深挖数据价值,同时严防数据误用、滥用,切实保障金融数据和个人隐私安全;二是如何通过技术手段,真正实现数据“可用不可见”,护航数据价值,避免合规风险;三是如何利用一个平台的建设,由点到面地构建出保险领域数据生态,以“隐私计算”为着力点,支撑内外部机构、各公司之间的数据流通便利化,逐步培育金融领域数据流通体系。对于以上问题中国人寿财险隐私计算平台给出了其创新而独到的解决方案。在技术上,平台通过采用不经意传输、秘密共享、混淆电路、零知识证明、差分隐私等多方安全计算技术,在联通各数据孤岛的同时,规避数据泄漏风险。通过融合更丰富的数据维度,实现业务的探索、融合、提升与创新。在各项加密协议的辅助下,平台能够充分保障数据资产的安全,解决了数据流通中的关键问题,为数据流通模式带来了巨大变革,激发数据服务应用潜力,深入挖掘数据价值。在权威性方面,平台通过了工信部中国信通院的“联邦学习120基础能力专项评测”、“联邦学习性能专项评测”、“多方安全计算基础能力专项评测”、“多方安全计算性能专项评测”四项隐私计算评测,在联邦学习和多方安全计算的技术架构、算法实现、功能效果、稳定性、安全性及性能等方面均满足评测要求,获得了专业认可。在可用性方面,平台支持对数据配置、样本对齐、特征工程、模型训练、模型评估等全流程进行可视化拖拉拽建模的能力,能够降低数据分析师以及业务人员使用门槛,提升建模效率,缩短模型调优的周期。平台的建设不仅可用于解决当下出现的数据流通中的安全问题,也可为未来法律法规不断完善的数据行业开拓新思路,通过技术的应用改变使用数据难的问题,推动“以技驭数”,在各方数据不出私域的前提下,实现数据“可用不可得、可用不可见、可用不可拥”的价值理念,破解数据价值融合过程中的安全隐患。中国人寿财险隐私计算平台正式上线后,开始逐步对接外部数据。平台以安全方式促进保险公司内外部数据智能生态共建,以更加安全合规的方式开展联合营销和联合风控业务,既保护商业机密与客户隐私,又能充分发挥数据智能在保险业务中的应用价值。一是联合营销,丰富用户画像,实现精准营销。在面向以客户为中心的数字化保险业务转型期,精准客户营销是数字化转型121的重要阵地。通过隐私计算,可以打通同一客户在内外生态中的多领域数据,使各参与方无需共享数据资源即可实现联合构建营销模型,进一步丰富用户画像。为服务中国人寿集团共享共建,为集团内部提供隐私计算技术支持,并提升集团各成员单位精准营销能力,中国人寿财险与集团成员单位合作进行带标签的隐私求交,实现集团内部的标签共享,以便整合形成客户资产等级标签,用以综合评估客户资产水平,为各方推送高价值客户,提高展业质量,促进精准营销。二是联合风控,多方数据融合,提升风险评估准确率。保险公司是经营风险的公司,而风险发生在未来,具有很强的不确定性。通常来说,用户在保险机构的数据难以满足行业对风险评估的要求,因此需要结合其他机构的数据进行综合评估。利用隐私计算技术,可以在原始数据不出本地的前提下,实现跨机构间数据的联合挖掘,交叉验证实现风险分析,形成对业务的多维度认识,提升风控质量。中国人寿财险在业务开展中,涉及对某外部机构进行数据查询的需求,为保障查询中的个人信息安全,以及数据流通过程安全,助力业务高质量发展,采用了隐私计算的匿踪查询功能进行数据安全查询,在保障查询数据不被外部机构探查的同时,也能保证外部机构被查数据的绝对安全。中国人寿财险隐私计算平台的应用,有效解决了“数据孤岛”问题,为行业提供了更广阔的数据应用场景,未来将不断开拓数据应用场景。中国人寿财险隐私计算平台的建设为数据合作打开122了新局面,但是这其中的隐私计算技术作为一项创新技术应用,仍存在一些问题需要合作各方协调解决。中国人寿财险将继续协同行业内外各方,共同释放数据价值,赋能生态合作伙伴。123商业健康险作为促进多层次医疗保障体系建设的重要组成部分,对于国民医疗健康具有重要意义。2022 年 1 月,中国银保监会人身险部向全国各人身保险公司下发 关于印发商业健康保险发展问题和建议报告的通知:“争取与医疗机构信息系统实现充分信息共享,改进结算服务;在确保信息安全和个人隐私权的基础上,强化医疗健康大数据运用,推动医疗支付方式改革,更好服务医保政策制定和医疗费用管理。”随着大数据人工智能等技术的发展推动健康险迈入 3.0 时代,保险行业数字化转型中服务逐步实现向线上迁移,数据流通为保险理赔模式优化带来无限可能,监管趋严的环境下,保险公司在创新服务模式的过程中需要优先重视数据合规,隐私计算成为中立可信技术支撑。传统的线下理赔调查,需要根据用户的就医习惯推测用户患病的前序行为,通过多种形式的线下调查、走访判断用户是否带病投保,周期可长达 10 个工作日,单案成本非常高;另一方面,随着个保法的落地,对保险排查既往病史的数据有一定范围要求,但在用户全量的医疗数据中,往往会包含其他与条款无关的病史记录。为了解决千万级在保用户住院医疗险的理赔体验、成本和效124能问题,某保险公司与蚂蚁保险科技合作,构建了基于理赔科技平台和隐私计算框架“隐语”的“理赔大脑”智能理赔系统。在整个系统中,健康险定制多方数据联合分析解决方案是核心模块之一:保险公司基于“隐语”提供的多方安全分析(SecureCollaborative Query Language,简称 SCQL)功能,与其外部医疗数据 ISV 在原始数据不离开本地、数据价值有保护的前提下进行联合分析,能够有效发现阳性线索、降低错赔风险、提高理赔查勘效率。多方安全分析语言“SCQL”(这种语言继承了 SQL 作为常用数据分析语言的普及性、易学性和高成熟度,同时还拓展了标准SQL的语义,可以描述基于多个数据源的安全计算),通过“SELECTFROM”、“JOIN ON”、“GROUP BY”等语句的组合搭配,即可完成联合分析的统计结果生成。如何安全使用外部医疗数据并实现精准调查是重大挑战。为了有效发现阳性线索,降低错赔风险。险司需要合规使用外部医疗数据,充分发挥其价值。现有 MPC 技术更适用于多方联合建模,如联合风控场景。不适合策略驱动强规则计算的理赔阳性风险发现场景。对此,“好医保”基于“隐语”提供的 SCQL 的多方联合分析领域专用语言,构建了健康险定制多方数据联合分析解决方案,具体包含六大流程:125图 1“好医保”服务流程图一是节点部署。获取部署包,填入节点标识&token 信息后执行脚本,即可轻量化、小时内完成本地节点部署;二是数据准备(进行前置安全配置)。双方分别将各自的样本数据,加载至各自本地分析节点,并在平台上注册对应样本的数据表结构,同意授权进入多方安全分析项目。在这一环节中,用户可通过“隐语”的 CCL 前置安全配置功能,在 MPC 相关技术能力支撑下,可对数据资产进行分级分类,通过前置配置来保证安全级别高的数据的安全性,保证多方隐私数据在计算过程中不泄漏。三是规则开发。基于“隐语”的 MPC SQL 算子支持,双方在脚本中描述基于多个数据源的安全计算,通过“SELECT FROM”、“JOIN ON”、“GROUP BY”等语句的组合搭配,完成联合分析的统计结果生成;通过“SELECT INTO”语句将交集结果导出至节点本地。四是规则部署。使用 ISV 授权的数据,通过联合分析提供的在线 SCQLIDE,在平台完成在线调试优化规则,且经调试验证后126的规则可作为标准规则在更多数据源进行规模化部署。五是调用规则。规则部署完成后,在平台对规则发起调用,并通过“隐语”的数据分析结果可视功能,查看如就诊分布、就诊频次等分析结果。六是数据源拓展。险司还可基于此方案持续引入外部医疗数据,进一步丰富底层数据能力、提升理赔和风控能力、增加核保场景智能决策服务。险司基于 SCQL 多方联合分析领域专用语言的健康险定制多方数据联合分析解决方案,提升了阳性案件识别和调查路径规划能力,覆盖了全国 10 省份的医疗数据。此方案为医疗数据合规使用提供了一种典范,通过数字化调查审核控制了理赔运营成本。现阶段我国医疗行业的数据流通主要发生纵向同场景/同类型机构之间,横向跨场景/多类型机构间的数据流通发展较缓,此次健康险定制多方数据联合分析解决方案的落地有利于商业健康险的降本增效良好发展,拓展了应用于医疗行业中的前沿技术合作、创新药研发、高端医疗器械研发应用以及疾病风险评估、疾病预防、分类诊断等众多场景,联通多种类型的医疗健康数据。在我国,健康医疗大数据作为国家重要基础性战略资源在管理决策、公共卫生、临床科研、惠民服务、行业治理和产业发展等众多方面影响深远。医疗健康大数据生态的构建,有利于平衡医疗资源本身在地域分布上的差异,促进社会资源的合理分配,提升国民健康服务的整体水平。127

56人已浏览 2023-03-22 135页 5星级


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有