微软安全大模型的应用架构

发布时间 - 2024-10-12 16:05:16    点击率:1788次

微软有最全的安全产品,以云上为主,也就有了最好的数据。他们用了OpenAI的模型,最好的,团队,也基本没有哪个公司可比。

所以微软做了Security Copilot非常炫酷,上一篇已经介绍过了,可以参考

那么,微软是如何使用大模型的?本文作一分析。

本文共分四部分

一、大模型基本能力

二、大模型的缺陷

三、微软的应用架构

四、总结

01 大模型的基本能力

我们最常使用大模型的方法,是对话。另外,还有一种方法,是API调用,用于基于大模型的软件开发。

无论是对话,还是API调用,大模型的运作是一样的,就是根据一个请求,作出相关的响应,就这一个主要功能。其实这也是大模型的基本能力。

在API调用上,对这个功能再细化,有两个能力需要重点强调:

  1. 函数调用(Function Calling)

Function Calling(函数调用)是大模型与外部系统或API交互的能力。简单地理解,你有一些函数,用于处理问题。以前的做法,是在代码里写死,流程走到哪,调用哪个函数,使用什么参数。

用大模型不一样了,你可以把函数描述和要求给到大模型作为请求,大模型会根据你的要求,找到合适的函数,并填上适当的参数给你。

函数可以是多个,大模型会根据对话内容,自动选择合适的函数及参数。

2.Sql生成

Sql生成和函数调用类似。以前需要自己写Sql,现在不用了,你把数据库的描述和查询需求给它,述数据库结构和查询需求同时给到大模型,它可以生成一个Sql语句,这个功能实际有很多用法,不过深讨论。

02 大模型的缺陷

大模型的函数调用能力,用于对外部工具的调用,是个非常有价值的工具。毕竟,相对原来根据需求,一行一行写代码调用,现在只要说一句话,它就能调用哪个工具,并准确输入参数,这对软件是个巨大的进步。

但它有个致命的缺陷:大模型并没有临时记忆,就是每次请求,都需要完整地输入所有的函数描述。你没看错,是每一次。你跟大模型聊天,看上去大模型记住了你前边说过的话,实际上,是浏览器每一次都把前边所有的对话也发给了大模型,每一次调用,都要带上所有历史记录,而大模型本身并没有会话的概念,它什么都记不住。

这是个令人崩溃的事情,一来每次调用都是巨大的tokens消耗,费用巨大,性能非常差。二是针对大的系统,函数的描述是海量的,而大模型的输入又有长度限制,很可能prompt放不下。

针对这个问题,openai最初给的方案是微调。微调就是给出一系列指令,比如说A需求,调用FA函数,B需求,调用FB函数。这个方案显然降低了大模型的智能,比传统写代码确实强点,但大模型的智能显然是没用好。

最近,OpenAI和Claude又有了一个相对优化的解决方案,是Prompt caching.

Prompt caching是一种优化大型语言模型(LLMs)性能和效率的技术。这个概念相对较新,主要应用于需要频繁使用LLMs的场景。以下是对prompt caching的详细介绍:

概念定义:Prompt caching是指将常用的prompt及其对应的模型输出存储起来,以便在后续相同或相似的查询中快速检索和重用。

这个方案,减少了延迟,降低了成本,但仍然不算最终的理想方案。

这个问题,绕不过。看看微软是怎么解决的。

03 微软的应用架构

图一

上图是微软的应用架构,重点看copilot周边的六条数据流,黄色数字标识的部分。

  1. 用户输入提示
  2. Copilot根据用户提供,找到合适的插件(plugin,连接目标系统,取数据,函数表)
  3. Copilot根据插件取到的信息,重新修改prompt(增加信息),送给大模型
  4. 大模型根据要求,针对Copilot的请示返回结果
  5. Copilot把大模型的返回转给插件,作后处理,比如进一步的数据处理,函数调用要求等
  6. Copilot 将插件处理的结果,返回给应用,包括响应,应用命令等,由具体的安全进行处理,再将结果返回给用户。

这里边,比较关键的点有两个,一个是插件(plugin),一个是Copilot的插件选择(路由能力)

1.插件(plugin)的原理

它通过标准接口与copilot对接,可与外部数据进行交互。按,每个安全产品对应一个插件,可以获取相关数据。

2.路由

如何根据用户的请求(自然语言)找到合适的插件?微软没有明确说明。但这个功能,如果用大语言模型实现是非常容易的。两个方法都可以,一是在进行步骤3之前先调用一下大模型(这与图示不符),还有一个办法是在Copilot里再放一个小一点的模型。微软用了openai的模型,但也反复强调自身的模型训练,我认为后一种可能性更大。这个方法一般称为意图识别。当然,看花容易养花难,理论上好实现,和实际上实现好,还是有很大的差距。

CrowdStrike的Charlotte AI也非常强调路由能力,说的也是这个意思。

04 总结

大模型在近两年的发展中,表现出无比巨大的能力,但仅有大模型是不够的,结合大模型,做必要的外围开发,形成Agent,具备理解用户,挖掘分析数据,外部环境感知和工具调用能力,才是应用的完整方案。客户需要的不仅仅是通识问答,而是结合客户自身情况的完整答案,这个关键在于数据获取能力。

微软的Security Copilot就是个非常完整的Agent方案。

如果再具体一点,它就是个RAG(检索增强生成)方案。目前的方案已经表现的很好,相信随着大模型技术的发展,agent能力更多的由大模型承载,未来会有更强的能力。

声明:本文来自AI与安全,稿件和图片版权均归原作者所有。所涉观点不代表本站立场,转载目的在于传递更多信息。如有侵权,请联系本站,我们将及时按原作者或权利人的意愿予以更正。
最新文章 第十二版《网络安全企业100强》发布 开源推荐算法为什么并不“可靠”? 虹膜写真风靡年轻人:小心泄露敏感个人信息 国内最大IT社区CSDN被挂马,CDN可能是罪魁祸首? Apache Struts文件上传漏洞 (CVE-2024-53677) 安全风险通告 工信部:关于防范新型勒索病毒Ymir的风险提示 美国报告揭示俄罗斯战略信息攻击:从攻击方法到战略效果 最危险的网络攻击:云勒索软件 个人信息保护合规审计:个人信息删除落地与审计 Forrester:Akamai创新微分段技术引领企业安全升级,实现 152%高ROI Fortinet发布《2025年网络威胁趋势预测报告》 揭秘四大威胁挑战 榜上有名!360入选2024年天津市网络安全应用场景优秀案例 只需一个暗号,即可戳穿语音克隆骗局 写在IDCC2024数字基础设施国际合作大会之前 IETF的运行方式及RFC的形成 《AI时代深度伪造和合成媒体的安全威胁与对策(2024版)》报告发布 UnitedHealth勒索软件攻击事件应吸取的六个备份教训 网络安全产品奥斯卡 2024年度赛可达优秀产品奖(SKD AWARDS) “危“”机“并存,五位网络安全大咖预警2025年安全态势 赋能智算未来,CDCE2024国际数据中心展12月5日上海璀璨开幕 俄罗斯黑客组织渗透和利用巴基斯坦黑客组织服务器案揭秘 国家安全部:警惕开源信息成为泄密源头 “清朗·网络平台算法典型问题治理”专项行动中的排名算法 游戏玩家请注意!Winos4.0木马已“潜伏” 2024 DAMS中国数据智能管理峰会即将在上海举办 WAF气数已尽? 网安巨头Palo Alto全球数千防火墙被攻陷:因开发低级错误造成零日漏洞 数字城市AI安全运营中心签约揭牌,360赋能长三角城市安全新篇章 勒索软件忙招人,2024年网络威胁五大新趋势 360发布全球首份《大模型安全漏洞报告》,曝光近40个大模型相关安全漏洞 值得关注的十二大网络安全风险评估工具及选型指南 俄黑客通过“近邻攻击”远程入侵美国企业WiFi网络 四校签约、六家授牌!360与河南高校再摘网络安全人才培育新果实 Apple多个在野高危漏洞在野利用通告 苹果官方警告:零日漏洞攻击瞄准Mac电脑用户 《密码法》颁布五周年:法治成效、实施难点与未来走向 27天!揭秘身份管理中凭证修复为何如此艰难? 微软“清理门户”,禁止杀毒软件访问Windows内核 云原生环境下的七大网络安全威胁及应对建议 ​透析恶意软件“四大家族”
在线客服
联系方式

热线电话

18556842815

上班时间

周一到周五

公司电话

027-85365976

二维码
线