5月18日,以“智绘安全乘数而上”为主题的2024第十二届西湖论剑·数字安全大会在杭州举行。安恒信息董事长范渊作“AI+安全,智绘跨时代的数字‘富春山居图’”主题演讲。
他表示,当供得出、流得动、用得好的数据,遇上人工智能大模型与智能体,传统安全天花板已经消失,安全底座和工作协同关系也在被重塑。
数据分级分类效率提升30倍
从“供得出”角度,在静态的数据分类分级之下,数据资产入表仍是劳动力密集型产业,原因是工具的识别率和准确率非常低,需要大量的人工复核,而人工需要一定技术知识门槛、经验门槛,效率很低、成本大。
范渊指出,应结合场景进行数据动态分类分级、动态保护。在三个月前,安恒信息在一个真实项目中,把一个原本需要600人·天的数据分类分级项目,结合人工智能大模型“恒脑”的知识库、相关语义识别能力、关联推理能力,以及结合业务视角的字段理解与注释,协助人工快速决策判断,仅用了20人·天完成。
“当这个案例第一次出现时,我们的研究院院长还不太相信,结果是不仅完成,且数据质量还有所提升。”范渊说,后来发现,这恰恰是人工智能行业大模型的优势,过去三个月,不少案例是25倍到30倍的效率提升。
从“流得动”角度,“隐私计算”成为热词,数据既要保护又要利用。数据要素流得动的“不可能三角”中,既要性能高又要通用性强,又希望不依赖于可信的第三方,又希望原始数据不出域等,而结合机密计算与安全多方计算结合,目前市面上95%的场景都能以此解决,范渊认为,不用太纠结于过多的技术技巧,而应更注重真正场景化的落地打通。
范渊讲述了一个前期交付并开始使用的案例:深圳福田公共数据授权运营。此前,政府体系内部的政务数据、税务数据、统计数据未打通,后来通过集中式加分布式的平台,针对内部痛点,比如对准市场企业的挖掘,对相关特定类的精准筛选,内部真正实现打通与高效施策。
比如,用跨部门的商事主体表和税务表做“准四上企业”挖掘,实现对企业高效帮扶;用跨部门的房租租赁表、商事主体表、税务表、法人出租屋表计算承租人与法人是否一致,办公地址与注册地址是否一致,以此筛选出“皮包公司”。
对外方面,交通银行使用公共数据产品以来,从2023年11月至今年5月,已为4826人提供3.13亿贷款。
“流得动的关键是要形成真正的数据基础设施的核心部分,真正地建立信任,并与场景打通。”范渊说。
如何“用得好”,他指出,现在地方陆续搭建交易所,但95%的数据交易没有发生在交易所,存在很多信任问题、成本问题,既想要合规,但同时又不希望过多地打扰,不希望有过多的成本等。
安恒信息在杭州市发改委、杭州市大数据局等指导下,做了第一张数据合规流通的数字证书,数字证书在交易前是以场景为单位,明确相关关键要素;交易中,对各种形式的数据进行摘要存证;交易后,为监管机构提供便利的稽查工具。
“它有几个特点,不参与交易过程,不接触交易数据,不成为交易第三方,为非常轻量的方式。对未来激发更大的,在交易所之外的数据要素市场是非常新的尝试。”范渊说。
数据显示,2023年8月,全国首批“数据合规流通数字证书”发出,到今年3月已发出273张合规流通证书。
安全遭遇“海量警告”怎么破
范渊也在思考,人工智能安全大模型究竟给这个行业产业带来什么?究竟带来局部点上的,还是带来跨越式面上的变革?
范渊说,各方面越来越重视安全,合规越来越多,收集的告警越来越多,但每一个人真正能处理的告警是很有限的,甚至都没办法全量处理这些告警。
此外,“产品不够,服务来凑”,海量告警之下,真正有威胁的告警是隐藏在噪音里面的,但没法用很好的手段将这些噪音去除,于是只能“尽力而为”。
以一家大型央企为例,其数字化与安全部门负责人,已经体会到“永远做不够”——20个人的团队,每天不断地处置事件,每个人处理500个,一天处理10000个左右,但不幸的是,实际的量有几十万个问题,多的时候甚至是上百万个。
通过分析相关的可能后发现,安全事件的闭环率是不足5%的。用人工智能安全大模型与智能体,模拟无数个有经验的安全工程师,从这10万问题甄别哪些是不需要处理的,哪些是误报待优化的,还有哪些是可防御的,最后留下人工研判的是300条左右的告警。
“经过真实案例的之后,我们很清晰地发现,过去看起来似乎做得还不错的态势感知平台,数据安全体系以及从传统安全服务到安全运营的体系,需要重塑安全底座,这个安全底座是基于智能体、大模型和利用相关的‘手’和‘脚’之后形成的智能体,同时它也会重塑未来的工作协同关系,未来很多工作协同是人与智能体。”范渊说。
最后,范渊提到,AI安全防御框架中,还有几点需要注意,一是很多政府部门开放公共数据,用来训练和支持人工智能产业,与此同时,又很担心这些数据会带来隐私泄露,基于机密计算的大模型训练与推理会变得很重要。即我支持你训练,同时又能够保护相关数据。
二是在内容安全方面,无论是数据安全、模型安全、应用安全,都是未来让智能更安全的重要部分,既要及时发现与阻断虚假内容,也要避免侵犯知识产权、敏感数据泄露,以及防御提示词的注入、提示词的绕过等。
三是生态,未来与生态伙伴之间的关系,在人工智能安全大模型和智能体的场景之下会构建更加紧密的共创、共享、共生的关系。
南方+记者郜小平
[作者]郜小平
南方产业智库
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/553853.html