加国无忧旗下站点

加国无忧APP下载

微软发布PyRIT工具识别生成式AI风险

发布：2024年02月24日 20:00 来源：IT之家

发布：2024年02月24日 20:00

来源：IT之家

IT之家 2 月 24 日消息，微软近日发布了开源自动化框架 PyRIT，这是一款 Python 风险识别工具包，主要帮助安全专家和机器学习工程师识别生成式 AI 的风险，阻止他们的人工智能系统失控。

微软的 AI Red Team 已经使用该工具，检查包括 Copilot 在内生成式人工智能系统中风险。

微软强调通过向公众提供内部工具，以及分享 AI Red Team 方面的其他投资成果，其目的是推动人工智能安全民主化。

IT之家注：Red Team 是在军事演习、网络安全演习等领域中扮演敌人或竞争对手角色的群体，扮演己方角色的则称作蓝队。Red Team 通常定义为敌方部队，通过攻击网络来提高产品安全性。

微软 AI Red Team 专门成立了一个跨学科的安全专家小组，管理复杂的攻击演习。PyRIT 框架的工作原理如下：

PyRit Agent 向目标 Gen AI 系统发送恶意提示词；当它收到 Gen AI 系统的回应时，就会向 PyRIT 评分引擎发送回应。

评分引擎将响应发送给 PyRit 代理；然后，代理根据评分引擎的反馈发送新的提示。

这一自动化过程一直持续到安全专家得到所需的结果为止。

微软已经将相关代码托管到 GitHub 上，感兴趣的用户可以深入阅读。

生活服务

★易达搬运★ (只要你需要，我们一定“搬”到)

服务

★易达搬运★

扬帆屋顶、水槽、铝片、天窗、外墙、彩钢瓦

服务

园艺有车会开车小工

招聘

密市公司诚聘仓库男工

招聘

密市食品分配公司

网友评论

网友评论仅供其表达个人看法，并不表明 51.CA 立场。

15人遇难的南京火灾，本可以避免的



中国 4 评论 02-24 19:17
安徽小学生挖出未爆弹徒手搬到校长室

社会 1 评论 02-24 14:20
8折$13.8 THAYERS PH 平衡每日洁面乳 237ML

推广
2024的初创公司，不蹭AI就融不到资？

国际 02-23 23:56
Meta 首席 AI 科学家：Sora“注定失败”

国际 2 评论 02-23 23:26
从深伪政治背书到聊天机器人竞选者：人工智能正在改变选举方式



国际 02-23 17:46
比AI毁灭人类更值得关注的，是个人隐私被窥探



国际 02-23 15:01
市场良心？中美两大佬共同看空英伟达

中国 02-23 14:09
卸任重庆市公安局一把手后，胡明朗已进京履新

中国 02-23 10:46
浙江一游乐场设200米高网状游乐项目,网友:风...

中国 02-23 10:02
发表3天就被撤稿！西安医生用AI画的离谱插图



中国 02-22 23:14