公共数据授权运营后, 如何为深圳福田揪出“皮包公司”

南方+客户端2024-05-19 17:55:12 121

5月18日，以“智绘安全乘数而上”为主题的2024第十二届西湖论剑·数字安全大会在杭州举行。安恒信息董事长范渊作“AI+安全，智绘跨时代的数字‘富春山居图’”主题演讲。

他表示，当供得出、流得动、用得好的数据，遇上人工智能大模型与智能体，传统安全天花板已经消失，安全底座和工作协同关系也在被重塑。

数据分级分类效率提升30倍

从“供得出”角度，在静态的数据分类分级之下，数据资产入表仍是劳动力密集型产业，原因是工具的识别率和准确率非常低，需要大量的人工复核，而人工需要一定技术知识门槛、经验门槛，效率很低、成本大。

范渊指出，应结合场景进行数据动态分类分级、动态保护。在三个月前，安恒信息在一个真实项目中，把一个原本需要600人·天的数据分类分级项目，结合人工智能大模型“恒脑”的知识库、相关语义识别能力、关联推理能力，以及结合业务视角的字段理解与注释，协助人工快速决策判断，仅用了20人·天完成。

“当这个案例第一次出现时，我们的研究院院长还不太相信，结果是不仅完成，且数据质量还有所提升。”范渊说，后来发现，这恰恰是人工智能行业大模型的优势，过去三个月，不少案例是25倍到30倍的效率提升。

从“流得动”角度，“隐私计算”成为热词，数据既要保护又要利用。数据要素流得动的“不可能三角”中，既要性能高又要通用性强，又希望不依赖于可信的第三方，又希望原始数据不出域等，而结合机密计算与安全多方计算结合，目前市面上95%的场景都能以此解决，范渊认为，不用太纠结于过多的技术技巧，而应更注重真正场景化的落地打通。

范渊讲述了一个前期交付并开始使用的案例：深圳福田公共数据授权运营。此前，政府体系内部的政务数据、税务数据、统计数据未打通，后来通过集中式加分布式的平台，针对内部痛点，比如对准市场企业的挖掘，对相关特定类的精准筛选，内部真正实现打通与高效施策。

比如，用跨部门的商事主体表和税务表做“准四上企业”挖掘，实现对企业高效帮扶；用跨部门的房租租赁表、商事主体表、税务表、法人出租屋表计算承租人与法人是否一致，办公地址与注册地址是否一致，以此筛选出“皮包公司”。

对外方面，交通银行使用公共数据产品以来，从2023年11月至今年5月，已为4826人提供3.13亿贷款。

“流得动的关键是要形成真正的数据基础设施的核心部分，真正地建立信任，并与场景打通。”范渊说。

如何“用得好”，他指出，现在地方陆续搭建交易所，但95%的数据交易没有发生在交易所，存在很多信任问题、成本问题，既想要合规，但同时又不希望过多地打扰，不希望有过多的成本等。

安恒信息在杭州市发改委、杭州市大数据局等指导下，做了第一张数据合规流通的数字证书，数字证书在交易前是以场景为单位，明确相关关键要素；交易中，对各种形式的数据进行摘要存证；交易后，为监管机构提供便利的稽查工具。

“它有几个特点，不参与交易过程，不接触交易数据，不成为交易第三方，为非常轻量的方式。对未来激发更大的，在交易所之外的数据要素市场是非常新的尝试。”范渊说。

数据显示，2023年8月，全国首批“数据合规流通数字证书”发出，到今年3月已发出273张合规流通证书。

安全遭遇“海量警告”怎么破

范渊也在思考，人工智能安全大模型究竟给这个行业产业带来什么？究竟带来局部点上的，还是带来跨越式面上的变革？

范渊说，各方面越来越重视安全，合规越来越多，收集的告警越来越多，但每一个人真正能处理的告警是很有限的，甚至都没办法全量处理这些告警。

此外，“产品不够，服务来凑”，海量告警之下，真正有威胁的告警是隐藏在噪音里面的，但没法用很好的手段将这些噪音去除，于是只能“尽力而为”。

以一家大型央企为例，其数字化与安全部门负责人，已经体会到“永远做不够”——20个人的团队，每天不断地处置事件，每个人处理500个，一天处理10000个左右，但不幸的是，实际的量有几十万个问题，多的时候甚至是上百万个。

通过分析相关的可能后发现，安全事件的闭环率是不足5%的。用人工智能安全大模型与智能体，模拟无数个有经验的安全工程师，从这10万问题甄别哪些是不需要处理的，哪些是误报待优化的，还有哪些是可防御的，最后留下人工研判的是300条左右的告警。

“经过真实案例的之后，我们很清晰地发现，过去看起来似乎做得还不错的态势感知平台，数据安全体系以及从传统安全服务到安全运营的体系，需要重塑安全底座，这个安全底座是基于智能体、大模型和利用相关的‘手’和‘脚’之后形成的智能体，同时它也会重塑未来的工作协同关系，未来很多工作协同是人与智能体。”范渊说。

最后，范渊提到，AI安全防御框架中，还有几点需要注意，一是很多政府部门开放公共数据，用来训练和支持人工智能产业，与此同时，又很担心这些数据会带来隐私泄露，基于机密计算的大模型训练与推理会变得很重要。即我支持你训练，同时又能够保护相关数据。

二是在内容安全方面，无论是数据安全、模型安全、应用安全，都是未来让智能更安全的重要部分，既要及时发现与阻断虚假内容，也要避免侵犯知识产权、敏感数据泄露，以及防御提示词的注入、提示词的绕过等。

三是生态，未来与生态伙伴之间的关系，在人工智能安全大模型和智能体的场景之下会构建更加紧密的共创、共享、共生的关系。

南方+记者郜小平

[作者]郜小平

南方产业智库

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/553853.html

随机主题

王思聪骂汪峰被吐槽五十步笑百步, 都不长情, 婚恋失败也没损失提供消费便利, 老字号“特产”再进社区邻里节平安警色丨江苏常熟公安: 多措并举护校安园, 织密未成年人保护网中国首批丁克族真实现状: 晚年没有儿孙照看, 躺在病床上无助哀嚎 S36赛季更新确定, 玄策白虎志返场, 168碎片换传说皮肤!哈里王子抨击威廉: 太无趣了?无视美方停火敦促, 以色列空袭加沙, 80万难民被迫逃离 1957年毛主席去看望儿子，闲聊间毛岸青想到一事：爸爸你说怪不怪提防降价背刺! 这四款车型大降价, 最高降幅达11.7万全无人化Robotaxi，居然有这种骚操作？【豪华配置】15.98万瑶光C-DM，价值超越价格新垣结衣老公被曝出轨，对象为一位新婚的NHK女主播 15年攻关实现全人工繁殖探秘“水中大熊猫”川陕哲罗鲑最高补贴8000元/辆! 成都崇州汽车消费补贴来了日本通运将预留1000亿日元用于海外并购卷价格, 卷新老车主权益, 纯电SUV铂智4X起步价14.98万元 91年参加工作, 个人账户30万, 工龄30年, 退休金可以领多少?中国制造又杀回第一！再次超过美国，成印度第一大贸易伙伴 “摇滚教父”汪峰：音乐学院的高材生，竟被高中毕业的选手给碾压卫报: 拜仁已经就孔帕尼补偿金问题与伯恩利展开谈判空位三分不敢投, 关键时刻甩锅坑队友, 球迷怒批: 最水的MVP

最新回复(0)