网易易盾总经理朱浩齐：做数字内容安全的“守夜人”

网易智企副总经理、网易易盾总经理朱浩齐

安全，需要被看见。

任何技术的发展，都是一把双刃剑，互联网亦是如此。

新一代信息技术发展至今，互联网已经成为我们生活中不可或缺的一部分，网民们获取信息的渠道不断变宽，这极大地提高了生产效率和日常生活的便捷程度。

但是另一方面，隐私信息窃取、AI换脸进行的诈骗、谣言信息传播等黑客攻击问题也随之而来。

有黑客的攻击，就要有“盾”的守护。于是网易易盾在2016年诞生了。

从服务于网易内部业务的安全部门到服务外部客户的完全商业化品牌，网易易盾面向娱乐社交、游戏、电商、金融、零售、政企等多个行业相继推出了行业定制安全方案，同时秉持“助力客户内生成长”的服务理念，持续上线AIGC内容安全、出海安全合规、未成年人网络保护等数十个场景化安全方案。现如今，易盾已经服务了数千家企业，包括B站、知乎、汽车之家、招商银行、央视网等开展数字化业务的企业，也为如小鹏、蔚来、小米等实业企业提供服务。

累计检测数据量超3万亿，抵御外挂威胁1000多亿次，处理超过1800次移动安全风险。7年的时间，网易易盾让数字内容风控通过互联网惠及了99%以上的网民。这7年是PGC与UGC极速演变的7年，也是数字内容风控行业高速发展的7年。这其中，网易易盾是参与者，亦是推动者。

没消息，就是好消息

“对于做网络安全的人来说，没消息就是好消息。”网易易盾总经理朱浩齐是这样描述自己的职业属性的，“不过我觉得在今年，安全业务需要更多发声。”

多媒体信息技术的发展带来了“信息爆炸”，但随之而来的大量垃圾信息也会给用户造成困扰。另一方面，提供互联网服务的企业也需要检测注册用户的真实性以及用户所发布内容的合规性。上升到政策层面，政府也需要制度和政策来维护“清朗网络空间”。

为了满足用户、企业和政府三方的共同需求，需要有人提供专业的数字内容安全服务。

易盾基于服务网易内部业务二十多年的技术和经验积累，率先向市场推出了专业的安全服务。

易盾一经发布，就获得了大量企业客户的一致好评。多年来易盾也一直以着数字内容安全行业领军者的身份，结合不懈的技术创新和深刻的市场洞察，在内容安全、业务安全、应用安全三大领域推出了多模态数字内容识别、智能风控、生物识别、安全加固等十多个产品和服务。

同时易盾也积极参与行业规范化建设，主导和参与了《网络与信息安全管理员国家职业技能标准》《网络治理能力评估规范：有害信息内容识别服务系统》等多项国家标准和行业标准的起草编撰工作。

作为国内新一代数字内容风控品牌，易盾为面向数字化业务的客户提供专业可靠的安全服务，为全行业提供具备场景属性的高标准解决方案，全方位保障客户业务合规、稳健和安全运营。

易盾在商业化的过程中经历了从作品到产品再到商品的过程。

“从技术验证通过到产品商业化中间隔了十万八千里”，朱浩齐说。

易盾最早在2015年就用深度学习技术训练图像识别模型，但是商业化需要考虑可用性、稳定性、性价比等诸多条件。

产品需要增加针对各种图片格式的支持，弱网环境下图像稳定传输的能力，底层GPU等硬件共享和加速的能力，甚至还要支持图片自定义裁剪、压缩、区域检测、智能标签等等功能。随便一个功能都需要很专业的知识和技术投入。

”商业化不只是针对产品本身的功能打磨，还有市场定位、产品推广、渠道建设、客户线索发现、客户关系的维护等一系列难以忽视的平常功夫”。

只在办公室做需求设计是不够的。“我们的语音识别模型能够自动识别音频中的断句、停歇部分，因此我们设计了根据音频断句智能分段并ASR文本转译的功能，结果客户实际需要的是简单粗暴的一刀切10秒断句功能，因为在审核场景中，数据结构标准化带来的效率提升更加重要。AI只要辅助预警和提示就可以了，不能轻易改变数据结构。”为了更好地了解客户需求，易盾内部提倡一种做法叫“去一线”，说白了就是要实时去了解、发掘客户最新的需求并且在产品和技术上进行升级来满足这种需求。

“ToB产品是千人千面的，尤其是我们做的还是安全业务，是产品的生命线。并且我发现，安全业务其实更容易被忽视，安全人员（白帽子）总是低调地待在‘隐秘的角落’，但实际上不论是终端用户还是企业用户都需要对‘安全’了解得更多。”

安全服务大部分时间都是风平浪静，但一有消息往往就是被攻击了的“坏消息”，所以朱浩齐认为及时同步安全情况，刷刷“存在感”，能够让客户更深刻地感知到安全业务的重要性以及严谨的服务态度。

这是一个酒香还怕巷子深的时代。即便是“没消息就是好消息”的安全行业，也需要更多“被看见”。

做暗夜里的守护者

“安全业务比任何其他的业务都更难做，因为安全是一个‘强对抗’的业务，我们无时无刻不在和黑灰产做对抗。”

作为白帽子，易盾不断修炼自己的功力，作为对手的黑灰产也没闲着。

比如以往一个“僵尸设备”都会在系统上安装一个外挂来辅助完成各种抢票、领券或者发布广告等任务，这可能通过对设备系统的外挂进程检测来识别。

现在黑产“更聪明”了，他们将一个“干净”的没有做过任何手脚的设备通过数据线连上一个负责运行“外挂”的机器，再通过这个外挂机器来操控和篡改设备信息，由于被直接监测的设备本身是没问题的，就导致这种问题很难识别。

还有更彻底的就是通过“众包”的模式进行作弊，比如在数百人的群里发红包，然后给大家发布任务。这种账号和设备更难识别，从实名和系统等信息来看数据完全是真实的。

为了对抗新的黑产手段，易盾也在不断精进技术，在发现“外挂作弊”的手段后，易盾最新的技术已经可以识别这样的情况。

针对“众包”的作弊模式，易盾也研发了新的DCRN算法进行对抗，该算法在2023年底，在由蚂蚁集团和浙江大学联合主办的IEEE ICDM大赛中，以综合指标第一名的成绩击败来自海内外的数十支队伍，在Adjusted Rand Score（ARI）评价指标上达到0.5006，大幅领先第二（0.425）和第三名（0.368）对手，并于技术答辩阶段凭借方法创新性、工业应用价值等方面的优异表现，斩获大赛唯一一项一等奖。

安全业务的难点除了长期高强度的对抗，还有对用户隐私的保护以及监测数据准确之间的微妙权衡。

易盾极其关注用户隐私的维护，在易盾的官网和与客户的合作协议中易盾都有非常详细的隐私说明，根据工信部的隐私合规要求，易盾所有要采集的这些字段都会公示，并且都是在符合工信部要求的情况下，用户同意之后才可能获取。

保护用户隐私就会带来一个困扰——数据采集得太少会导致判断的失误。

如何去解决这个问题，易盾采用了两个方法——采集数据维度的变化以及验证手段分级。

在采集数据的维度上，比起个人隐私数据，易盾用行为数据来取代。什么是行为数据？简单来说就是用户打开一个APP之后的轨迹。“行为数据可以帮助我们进行反向筛选。正常的用户都会通过APP的首页点击进入某一个活动页面，但是异常用户由于直接是被僵尸设备控制的，不会有这些正常的行为轨迹，会直接‘闪现’在需要完成任务的页面。因此，行为数据是一个既不会涉及隐私也能帮助我们准确筛选异常用户的数据。”

验证手段分级则是另一个办法，易盾会把一些需要验证信息的步骤分级嵌入在必要的业务流程中，比如在支付的时候进行人脸识别，在领奖的时候进行身份验证，在异常网络环境下要求号码认证等。

“安全总是被人们认为是一个理所当然的存在，其实网络内容的安全正是整个行业从业者努力维护的结果。之前有学者指出由于媒体传播的加速，大家总是能听到更多的坏消息，而我们就像是暗夜里的守护者，在这些危险的内容触达用户之前有效地识别、标记、筛选”。

对于这两年不断加速进步的AI技术，朱浩齐也表示，一方面人工智能技术的提升能够提高内容识别的准确性和处理速度，另一方面由于大语言模型的发展，机器也时常会产出超出目前规则范围的内容，这也给安全业务带来了更多的复杂性。“我们应该意识到任何技术都是一把双刃剑，在积极探索的同时，也应该有相应更新的规则。”

跟着时代走，用AI加持安全

“往前看，别回头”这句话也适合说给每一个白帽子听。

易盾的业务主要包括内容安全、业务安全、应用安全，还有最新推出的安全专家服务，这也正是随着互联网发展而不断衍生的企业数字化服务需求。随着互联网红利逐渐触及天花板，易盾的业务也跟着进入了2.0时代。

新的环境，诞生了新的机遇。朱浩齐表示，以前企业现金流充沛的时候他们更倾向于自己去研发所有的产品，但是随着大部分互联网企业开始从高速增长进入到高质量增长，更多的企业开始剥离非核心业务，将安全这样的底层业务交给供应商去做。这对易盾来说反而是个不可多得的机会。

“当企业有了更强的成本意识后，他们对于合规的要求也就会增强。因而，数字内容安全的需求会逐渐被发现、被放大。随着互联网红利逐渐进入一个平台期，反而修炼‘内功’成了企业主们关注的重点，这正是易盾的机会。”

另外，近两年出海也成了很多企业的关键词，易盾也跟随服务的企业向海外市场进行拓展。“目前我们主要的海外客户集中在中东、东南亚以及北美地区。”为了满足处于弱网络环境或者海外网络环境的客户需求，易盾在亚洲、欧洲以及北美洲均有布局服务节点，来加强安全服务的准确性和时效性。

“现在易盾海外市场的获客渠道主要是老客户的介绍，以及国内客户有出海业务的话我们也会去负责海外安全业务的跟进，未来易盾会更加主动对海外市场进行拓展和进一步的探索。不同国家对于内容安全的政策也是有不同的侧重点的。比如泰国就不允许网络出现谈论皇室的内容、阿拉伯地区则对女性头巾等关键词比较敏感。易盾既有识别各地政策的经验，也有及时识别这些标签的运算能力，所以我们对海外市场的发展是非常乐观的。”

面对市场的变化，易盾积极乐观。面对技术的革新，易盾也积极拥抱。

实际上，易盾一直都在采用人工智能和机器学习来进行内容的有效识别，对于2023年伊始突然爆火的AIGC大模型技术与应用，易盾并不感到意外。很快地，易盾就推出了AIGC内容安全解决方案，全面覆盖大模型算法层与应用层。多年来在AI技术上的研发投入与深耕，易盾看到了回报。

“目前来看，AI大模型对易盾产品最大的提升就是对机器‘认知力’的升级。”

在传统的机器学习中，算法工程师需要事先提炼有害内容的特征，并将其输入到机器中，以便机器能够提取和识别具有这些特征的内容。随着大模型和AIGC技术的发展，网易易盾可以实现在传统的单一识别技术基础上增加“提示词”的功能。这种“提示词”类似于人类可理解的指令，例如，易盾可以向大型模型输入指令：“包含女性裸露大腿的图片包含表情包的垃圾广告”，这样一来，大型模型就能根据指令自动召回更多具有潜在风险的内容。

除了日常对内容安全的维护，易盾还可以做直播内容安全的监测。直播相比于日常内容维护主要的难度在于：不同平台规则不同带来的规则复杂加深、实时性要求下维护成本的提升以及对技术准确性的要求的提升。

为了突破这些实践痛点，易盾技术团队秉持“去一线”的理念，与各个合作的直播平台进行深入交流，及时掌握不同平台的最新规则；和直播技术厂商合作定制关键帧检测技术将传输宽带降到最低来控制成本；同时，易盾推出面向自研模型的推理加速框架，该框架针对易盾业务量身定做，同等硬件条件下可以提升一倍以上的吞吐量。

随着技术的不断升级，易盾也推出了不同的新的识别模型，比如识别是否存在挂机直播、睡觉直播、主播在直播镜头前放照片或者放视频等“作弊行为”... 拥抱市场和技术的变化，易盾在跟着时代往前走。

此外，结合大模型技术，易盾目前也在全力投入数字内容风控行业大模型的研发工作，预计将在今年对外发布。AI全面来临的时代，如同朱浩齐多次告诉我们的那样，“网易易盾要持续加大对AI技术的研发和应用力度，继续做AI时代的数字内容安全‘守夜人’。"

网易易盾总经理朱浩齐：做数字内容安全的“守夜人”

快手举办“短视频与直播赋能产业高质量发展论坛”，探讨短视频直播新方向

唯品会孙格非：折扣零售市场打开新空间，希望加强国际品牌合作

蔡崇信：阿里巴巴落后了

3月107款版号下发：腾讯网易“空军”，三七巨人豪腾产品在列

成都新茶嫩茶经纪人工作室的雅韵悠然