最新发布的生成式AI安全规定明确了31项安全要求,只有符合这些要求的生成式AI服务提供者才能“持证上岗”。这一规范涵盖了语料安全、模型安全、安全措施和安全评估等四大关键领域。
对于语料安全,要求提供者建立语料来源黑名单,不使用来自黑名单的数据进行训练。如果某一来源的语料中包含违法不良信息超过5%,则该来源会被列入黑名单。此外,规定了多元化的语料来源,包括不同语言和不同类型的语料,以及要求语料来源可追溯。
在模型安全方面,提供者不得使用未备案的基础模型进行研发,必须公开第三方基础模型的使用情况。生成内容要符合科学常识,不得包含错误信息。
安全措施方面,根据不同场景和使用者需求,规定了不同的保护措施,特别是在关键信息基础设施和未成年人使用的情况下。此外,要求设置监看人员以提高生成内容质量。
安全评估方面提供了具体的评估方法,包括语料安全评估、生成内容安全评估、内容拒答评估等。要求提供者使用人工抽检,确保语料安全。
总的来说,这一生成式AI安全规定为生成式AI服务提供者提供了具体的安全标准,以确保其生成内容的质量和安全性。这对于保护用户权益和社会安全具有重要意义。
关于征求信安标委技术文件《生成式人工智能服务 安全基本要求》(征求意见稿)意见的通知的原文地址:
https://www.tc260.org.cn/front/postDetail.html?id=20231011143225