每经记者:可杨 每经编辑:张海妮

顶级赛车比赛中,速度与激情令人血脉偾张,但真正的胜负往往不在于直道狂飙,而在于每一个精准拿捏的刹车点,一辆没有强大刹车系统的赛车,无论动力多么澎湃,都只是一场失控的冒险。

人工智能也是如此,有人追求更强的算力,有人押注更大的参数规模,有人则选择做技术狂奔中的“安全派”。

网络安全到AI(人工智能)安全,朱萌深耕安全领域多年,作为瑞莱智慧(RealAI)合伙人、高级副总裁,在行业竞争日趋激烈、技术变革不断加速的今天,她和团队正在做一件“难而正确的事”——让人工智能变得更安全、更可靠、更可控。

朱萌坦言,当前大模型的竞争,已经从单纯的技术突破进入到商业化落地的关键阶段,而安全性正成为决定成败的“隐形门槛”,AI安全不是附属品,而是产业的“基座”。

面对AI技术的爆炸式增长,行业正在经历一场从“无安全”到“有安全”、从“被动防御”到“主动对抗”的深刻变革。在这场变革中,朱萌希望自己成为人工智能时代的“守护者”,为AI的未来撑起一张安全的保护网。

瑞莱智慧合伙人朱萌:在技术狂奔中做“安全派”-编程日记
AI安全的“猫鼠游戏”

朱萌认为,技术攻击与安全防护相当于AI时代的“猫鼠游戏”,“魔高一尺”就需要“道高一丈”,需要持续对抗博弈。

当前,AI安全行业正站在变革关口。以往依靠规则驱动的传统安全防御体系,正在面对大模型时代的新型威胁——深度伪造、越狱攻击、数据投毒等新型技术倒逼防御系统持续开展攻防对抗和迭代升级。

“大模型时代面临越来越多的新型安全风险挑战,AI安全领域也正经历从被动防御到主动防御的范式转换。”朱萌如此形容当下的行业变局。过去,安全系统依赖的是事后处置的模式;但如今,智能化、动态应对成为迫在眉睫的需求。事实上,在AI安全领域,攻与防的较量从未停歇,每一次技术的突破,都会带来新的对抗升级。

朱萌开门见山地指出,现阶段,以深度学习为主要技术、以数据驱动为主要模式的人工智能技术,在决策逻辑和链路上存在天然不确定性。

例如,“诱导攻击”能够利用大语言模型的漏洞,绕过大语言模型的基础防护机制,引导其生成包含敏感数据泄露、非法操作指引等高危内容。在金融和医疗系统中,这类漏洞可能导致隐私泄露甚至关键决策被操控。

与此同时,大模型的“幻觉”问题也构成了新的安全隐患。在大模型领域,在自然鲁棒性(Robustness,指系统、算法或模型在面对不确定性、变化或干扰时,能够保持其功能和性能稳定的能力)下,容易出现事实不符、逻辑错误、答非所问等问题。另一方面,在外部攻击下,大模型面对对抗样本、诱导越狱、数据投毒等新型攻击手段时表现脆弱,安全框架被突破后造成不良信息输出、错误信息输出等风险。

在大模型的竞速场上,安全性或许正成为决定最终胜负的筹码之一,朱萌试图和RealAI一起成为这场博弈中的“守门人”。

2025年年初,DeepSeek引爆科技圈。热潮中,朱萌提供了另一个视角。在测试中,RealAI发现:DeepSeek R1在回复相关性、拒答率上表现优异,但在模型安全性上却呈现出两极分化的表现。

朱萌介绍,在中文语境安全数据集的测试中,DeepSeek的回答均能够生成合理且正向的响应内容,模型安全度高达100%,证明其基础安全框架已具备基本的安全防护能力和实用价值。但在面对越狱攻击的1553条测试用例时,DeepSeek的模型安全得分率为77.4%,有350条为不安全回复,占比22.6%。

“DeepSeek不安全的本质原因在于太‘善良’。”朱萌认为,DeepSeek本身已经有着良好的安全性分析能力,但是其倾向于满足用户需求,协助用户完成任务,因此可能会输出少量有害内容。“在82.3%的不安全回复案例中,模型在思考过程中已经识别出用户的诱导性输入,但最终仍选择顺从指令。”

基于这一发现和DeepSeek优化,RealAI团队发布的大模型RealSafe-R1改造了DeepSeek R1的思维链处理方式,使其在识别到潜在风险时,不再单纯地“服从”,而是能够在推理过程中调整决策,确保生成结果的安全性。

防守是另一种“进攻”

从商业世界的运行逻辑来说,技术对抗的升级,意味着AI安全领域同时存在着挑战与机遇。

在技术路径上,RealAI始终选择了一个“更强调安全与可靠性”的路径。

朱萌表示,当前主流的深度学习模式,在可解释性、鲁棒性和对抗攻击防御能力上仍存在短板。因此,RealAI的解决方案是“知识与数据双轮驱动”,即结合贝叶斯深度学习,使AI在复杂决策环境中具备更高的可靠性。

朱萌认为,对于AI安全公司而言,新型安全威胁,如深度伪造、诱导攻击以及数据投毒等正在日益增多,这些都倒逼防御系统与时俱进,进行持续的攻防对抗与技术迭代。其次,数据安全问题形势愈加严峻。大模型的训练依赖海量的多模态数据,生物特征等敏感信息的滥用风险日益加大,这要求在高效利用与合规管控之间找到一个微妙的平衡点。

更深层次的问题是,传统安全防御体系本质上是“事后补救”式地被动响应攻击,而在AI时代,攻击发生的时间窗口极短,对算法与算力的协同提出了更高的要求。

挑战背后,隐藏着巨大的机遇。

AI安全,也许最终会演变成AI与AI之间的对抗。随着主动防御能力的不断突破,大模型在多模态风险感知、动态防御等方面展现出强大的赋能潜力。特别是在“AI对抗AI”的闭环构建中,人工智能技术与防御系统的深度融合使得安防领域不再是单纯的防护层,而是逐步向智能化方向迈进,形成了一种新型的安全生态系统。

产业化进程并非一蹴而就,AI安全企业在商业化过程中始终面临重重挑战。许多人认为,AI安全市场主要由监管驱动,企业的发展路径受制于政策红利的时间窗口。

对此,朱萌持不同观点。她认为,政策驱动的需求往往是短期的,但AI安全的价值验证周期比想象中要短。不管监管力度大小,AI安全都会成为企业刚需。

当前,大模型竞争的焦点已经从“技术验证”转向“场景落地”,企业需通过垂直场景深度适配(如医疗、教育、工业质检)实现商业化闭环,而非依赖通用模型泛化能力。朱萌认为,真正的突破点在于能效优化与场景渗透率,而非盲目扩张算力。“DeepSeek的出圈说明,大模型行业正在重构产业逻辑,即能效优化将取代算力‘军备’,场景渗透率提升将替代用户规模扩张。”朱萌说。

“早在2015年,就有很多人预测刷脸支付、自动驾驶、AI医疗诊断会迅速落地。但我们认为,严肃、高价值场景对AI系统的鲁棒性、安全性要求极高,如果这些问题无法解决,AI就很难真正落地。”朱萌表示,在任何一波技术热潮中,人工智能想从技术迈向应用,现实总是比预期更加严苛。

朱萌认为,时至今日,现实依然符合自己当初的预判,大模型在安全方面的严重不足,正使产业链闭环出现风险“缺口”,这也成为阻碍人工智能赋能生产生活的最大掣肘。

人工智能产业“守护者”

技术从互联网奔向人工智能,AI安全是否会像网络安全一样,形成完整的产业链和生态?

朱萌认为答案是肯定的。在加入RealAI之前,她长期深耕网络安全领域。她认为,未来AI安全将形成与网络安全类似的完整产业链和生态体系。

“AI安全产业链的雏形已经显现。”朱萌解释道,当前,“技术研发-产品服务-场景应用”三大环节链条已经逐步成型,覆盖安全研究、安全治理与安全应用等方向。与此同时,技术融合与专业化趋势也在加速,尤其是大模型安全评估、AI伪造内容检测等前沿领域,已经形成热点需求。此外,政策引导和行业协作机制的完善,使得AI安全正从碎片化走向系统化,政府、科研机构、企业共同推动标准化建设,形成完善的AI安全生态协作机制。

与此同时,随着人工智能成为发展新质生产力的重要引擎,展现出赋能千行百业的强劲势能,对安全的要求也水涨船高。随着技术不断渗透,AI安全的应用范围将进一步拓展,自动驾驶、医疗诊断等新兴领域的复杂性和风险也对安全技术提出更高要求,“这正是我们要做的难而正确的事,需要持之以恒地攻坚和探索”。

从更宏观的角度看,随着AI产业未来发展路径的逐渐清晰,AI安全也将成为所有大模型企业的“必选项”。

“需要强调的是,安全可控能力是技术广泛应用的前提、关键和挑战。”朱萌认为,更强大的生成能力和更安全可控的发展并非对立,它们相辅相成、互为支撑。

她进一步剖析道,生成式人工智能技术仍未彻底解决第二代人工智能的固有安全问题,决策链路的不确定性、可解释性弱、鲁棒性低等难题依旧存在。而在应用层面,AI规模化落地,尤其是在涉及国计民生的重要领域,安全保障能力更是不可或缺。换句话说,安全可控能力不仅是技术突破的核心挑战,也是其广泛应用的前提条件。

人工智能的技术探索是一场旷日持久的掘金,朱萌希望自己在这条路上的角色是一个“守护者”。她坦言,自己的职业生涯都与安全行业相关,从网络安全到AI安全,虽然技术不断变化,但安全对发展的重要意义始终如一。

Facebook(脸书)前女高管谢丽尔·桑德伯格在《向前一步》中提到,有能力的人因自我怀疑而苦恼,无论男女都容易出现这样的症状,但女性会更严重,也会更多地受其限制。

回望职业生涯,朱萌也曾像许多女性一样,因“能力不足”的自我怀疑而犹豫不前。“我在很长的时间内都怀疑自己能力不足,但随着年龄的增长和工作经验的丰富,我逐渐认识到,完成比完美更重要,全力以赴的努力往往会带来意想不到的美好结果。”她认为,唯一值得惧怕的是恐惧本身,因为恐惧,才会反复内耗,错失很多机会和成长的可能。所以,一旦突破了这种心理障碍,就会发现,摆在面前的永远都是解决问题的办法,而不是问题本身。

朱萌对AI行业的年轻从业者,尤其是女性科技人才充满信心。“这个行业对人的要求非常高,女性群体所展现的洞察力、统筹力、学习力和坚韧性等特质,能够很好地适应和满足行业发展需求。”她认为,人工智能行业的发展和变化速度极快,算法与模型都在飞速演进,甚至是以周或者日为单位在变化。“AI真正发挥价值,需要融入各行各业的场景中去,这就要求我们不仅是AI专家,更应该是懂行业的AI专家。”朱萌说。