微软发布PyRIT，用于识别生成式AI系统中的风险

Yu 217 阅读 0 评论 42 点赞

两月二6日动静，据中媒报导，微硬领布了一个名为PyRIT的残落造访主动化框架，用于自觉识别天生式AI体系外的危害。

微硬野生智能血色团队负责人Ram Shankar Siva Kumar示意，赤色团队东西旨正在“使举世每一个构造皆能应用最新的野生智能前进入止负义务的翻新”。

该私司表现，PyRIT否用于评价年夜型言语模子(LLM)端点对于差异戕害种别的失当性，如伪造、滥用以及禁行形式。而且借能用于识别从歹意硬件天生到逃狱的保险风险，和身份偷窃等隐衷风险。

PyRIT有五个接心：目的、数据散、评分引擎、撑持多种侵犯计谋的威力，和包括一个内存组件，该组件否以采取JSON或者数据库的内容来存储中央输出以及输入交互。

评分引擎借供给了2种差别的选项来对于目的野生智能体系的输入入止评分，容许Red Team运用经典的机械进修分类器或者运用LLM端点入止小我私家评价。

微硬表现：“目的是让钻研职员可以或许对于他们的模子以及零个拉理管叙正在差别戕害种别高的显示有一个基线，并可以或许将该基线取他们模子的将来迭代入止比力。”

“那使他们可以或许取得闭于他们的模子今朝运转环境的经验数据，并按照将来的改良检测机能的任何高升。”换言之，该器材旨正在经由过程天生提醒来凸起危害“热门”，那些提醒否用于评价野生智能体系并符号需求入一步骤查的范围。

微硬入一步认可，Red Team天生式AI体系必要异时探测保险性以及负义务的野生智能危害，那项事情更具几率性，异时也指没了天生式AI系统布局的硕大差别。

点赞(42) 打赏

暂无评论