公共数据授权运营后, 如何为深圳福田揪出“皮包公司”

南方+客户端2024-05-19 17:55:12  121

5月18日,以“智绘安全乘数而上”为主题的2024第十二届西湖论剑·数字安全大会在杭州举行。安恒信息董事长范渊作“AI+安全,智绘跨时代的数字‘富春山居图’”主题演讲。

他表示,当供得出、流得动、用得好的数据,遇上人工智能大模型与智能体,传统安全天花板已经消失,安全底座和工作协同关系也在被重塑。

数据分级分类效率提升30倍

从“供得出”角度,在静态的数据分类分级之下,数据资产入表仍是劳动力密集型产业,原因是工具的识别率和准确率非常低,需要大量的人工复核,而人工需要一定技术知识门槛、经验门槛,效率很低、成本大。

范渊指出,应结合场景进行数据动态分类分级、动态保护。在三个月前,安恒信息在一个真实项目中,把一个原本需要600人·天的数据分类分级项目,结合人工智能大模型“恒脑”的知识库、相关语义识别能力、关联推理能力,以及结合业务视角的字段理解与注释,协助人工快速决策判断,仅用了20人·天完成。

“当这个案例第一次出现时,我们的研究院院长还不太相信,结果是不仅完成,且数据质量还有所提升。”范渊说,后来发现,这恰恰是人工智能行业大模型的优势,过去三个月,不少案例是25倍到30倍的效率提升。

从“流得动”角度,“隐私计算”成为热词,数据既要保护又要利用。数据要素流得动的“不可能三角”中,既要性能高又要通用性强,又希望不依赖于可信的第三方,又希望原始数据不出域等,而结合机密计算与安全多方计算结合,目前市面上95%的场景都能以此解决,范渊认为,不用太纠结于过多的技术技巧,而应更注重真正场景化的落地打通。

范渊讲述了一个前期交付并开始使用的案例:深圳福田公共数据授权运营。此前,政府体系内部的政务数据、税务数据、统计数据未打通,后来通过集中式加分布式的平台,针对内部痛点,比如对准市场企业的挖掘,对相关特定类的精准筛选,内部真正实现打通与高效施策。

比如,用跨部门的商事主体表和税务表做“准四上企业”挖掘,实现对企业高效帮扶;用跨部门的房租租赁表、商事主体表、税务表、法人出租屋表计算承租人与法人是否一致,办公地址与注册地址是否一致,以此筛选出“皮包公司”。

对外方面,交通银行使用公共数据产品以来,从2023年11月至今年5月,已为4826人提供3.13亿贷款。

“流得动的关键是要形成真正的数据基础设施的核心部分,真正地建立信任,并与场景打通。”范渊说。

如何“用得好”,他指出,现在地方陆续搭建交易所,但95%的数据交易没有发生在交易所,存在很多信任问题、成本问题,既想要合规,但同时又不希望过多地打扰,不希望有过多的成本等。

安恒信息在杭州市发改委、杭州市大数据局等指导下,做了第一张数据合规流通的数字证书,数字证书在交易前是以场景为单位,明确相关关键要素;交易中,对各种形式的数据进行摘要存证;交易后,为监管机构提供便利的稽查工具。

“它有几个特点,不参与交易过程,不接触交易数据,不成为交易第三方,为非常轻量的方式。对未来激发更大的,在交易所之外的数据要素市场是非常新的尝试。”范渊说。

数据显示,2023年8月,全国首批“数据合规流通数字证书”发出,到今年3月已发出273张合规流通证书。

安全遭遇“海量警告”怎么破

范渊也在思考,人工智能安全大模型究竟给这个行业产业带来什么?究竟带来局部点上的,还是带来跨越式面上的变革?

范渊说,各方面越来越重视安全,合规越来越多,收集的告警越来越多,但每一个人真正能处理的告警是很有限的,甚至都没办法全量处理这些告警。

此外,“产品不够,服务来凑”,海量告警之下,真正有威胁的告警是隐藏在噪音里面的,但没法用很好的手段将这些噪音去除,于是只能“尽力而为”。

以一家大型央企为例,其数字化与安全部门负责人,已经体会到“永远做不够”——20个人的团队,每天不断地处置事件,每个人处理500个,一天处理10000个左右,但不幸的是,实际的量有几十万个问题,多的时候甚至是上百万个。

通过分析相关的可能后发现,安全事件的闭环率是不足5%的。用人工智能安全大模型与智能体,模拟无数个有经验的安全工程师,从这10万问题甄别哪些是不需要处理的,哪些是误报待优化的,还有哪些是可防御的,最后留下人工研判的是300条左右的告警。

“经过真实案例的之后,我们很清晰地发现,过去看起来似乎做得还不错的态势感知平台,数据安全体系以及从传统安全服务到安全运营的体系,需要重塑安全底座,这个安全底座是基于智能体、大模型和利用相关的‘手’和‘脚’之后形成的智能体,同时它也会重塑未来的工作协同关系,未来很多工作协同是人与智能体。”范渊说。

最后,范渊提到,AI安全防御框架中,还有几点需要注意,一是很多政府部门开放公共数据,用来训练和支持人工智能产业,与此同时,又很担心这些数据会带来隐私泄露,基于机密计算的大模型训练与推理会变得很重要。即我支持你训练,同时又能够保护相关数据。

二是在内容安全方面,无论是数据安全、模型安全、应用安全,都是未来让智能更安全的重要部分,既要及时发现与阻断虚假内容,也要避免侵犯知识产权、敏感数据泄露,以及防御提示词的注入、提示词的绕过等。

三是生态,未来与生态伙伴之间的关系,在人工智能安全大模型和智能体的场景之下会构建更加紧密的共创、共享、共生的关系。

南方+记者郜小平

[作者]郜小平

南方产业智库

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/553853.html
0
随机主题
王思聪骂汪峰被吐槽五十步笑百步, 都不长情, 婚恋失败也没损失提供消费便利, 老字号“特产”再进社区邻里节平安警色丨江苏常熟公安: 多措并举护校安园, 织密未成年人保护网中国首批丁克族真实现状: 晚年没有儿孙照看, 躺在病床上无助哀嚎S36赛季更新确定, 玄策白虎志返场, 168碎片换传说皮肤!哈里王子抨击威廉: 太无趣了?无视美方停火敦促, 以色列空袭加沙, 80万难民被迫逃离1957年毛主席去看望儿子,闲聊间毛岸青想到一事:爸爸你说怪不怪提防降价背刺! 这四款车型大降价, 最高降幅达11.7万全无人化Robotaxi,居然有这种骚操作?【豪华配置】15.98万瑶光C-DM,价值超越价格新垣结衣老公被曝出轨 ,对象为一位新婚的NHK女主播15年攻关实现全人工繁殖 探秘“水中大熊猫”川陕哲罗鲑最高补贴8000元/辆! 成都崇州汽车消费补贴来了日本通运将预留1000亿日元用于海外并购卷价格, 卷新老车主权益, 纯电SUV铂智4X起步价14.98万元91年参加工作, 个人账户30万, 工龄30年, 退休金可以领多少?中国制造又杀回第一!再次超过美国,成印度第一大贸易伙伴“摇滚教父”汪峰:音乐学院的高材生,竟被高中毕业的选手给碾压卫报: 拜仁已经就孔帕尼补偿金问题与伯恩利展开谈判空位三分不敢投, 关键时刻甩锅坑队友, 球迷怒批: 最水的MVP
最新回复(0)