中国信通院孙小童等：平衡立异与安然解读新加坡《生成式人工智能治理模型框架》_人工智能_框架

2024-12-08 08:35:00 科技快讯

一、《框架》发布背景

中国信通院孙小童等：平衡立异与安然解读新加坡《生成式人工智能治理模型框架》_人工智能_框架科技快讯

2019年1月，新加坡个人数据保护委员会发布了亚洲首个《人工智能管理模型框架》，并于2020年对其进行了更新，框架奠定了“透明性”“以人为中央”两项基本管理原则，形成了新加坡人工智能管理框架的雏形。

面对天生式人工智能放大传统风险和引发新兴风险的问题，新加坡政府认为有必要更新早期的模型管理框架，以全面办理新涌现的问题。
因此，2023年6月，新加坡通讯与信息部下的资讯通信媒体发展管理局（IMDA）与多家环球领先科技企业发起建立“AI Verify”基金会，专门推进AI管理研究与工具开拓事情。
2024年1月，基金会在谈论文件《天生式人工智能：对信赖和管理的影响》的根本上，整合多方反馈见地，发布《天生式人工智能管理的模型框架草案》，并于5月正式发布《天生式人工智能管理模型框架》，细化9个管理维度内容，以期打造更可信的人工智能环境，为环球人工智能管理供应参考。

二、《框架》紧张内容

《框架》涵盖问责、数据、可信研发和支配、事宜报告、测试和担保、安全、内容来源、安全与对齐研发、人工智能促进***9个管理维度。
框架示意图如下所示：

图1 新加坡天生式人工智能管理模型框架示意

来源：中国信息通信研究院根据《框架》整理

源头上，《框架》在问责机制上区分事前任务分配和事后“安全网”的创新路径，“事前”明确了人工智能家当链上各方能够按照其掌握水平分担任务，“事后”将开拓商承诺承担任务、产品危害任务与无过失落保险统筹结合，确保风险发生时能够获得救济。

流程上，《框架》看重数据、开拓支配、实践报告和测试担保方面的管理。
数据方面，从数据可信、可访问、高质量三个方面提出建议，包括明确法律适用例外环境、促进各利益攸关方加强沟通、培植环球可信数据集库等详细举措。
可信开拓和支配方面，建议开拓阶段通过来自人类反馈的强化学习等微调技能减少幻觉和缺点；表露阶段利用“食品标签”形式公开信息；评估阶段推动形成更加全面且具有同等性的评估方法，同时关注不同行业的分外须要。
事宜报告方面，提失事前采纳漏洞报告勉励机制，主动采纳方法避免事宜发生；事后侧重表露补救机制，并将“严重人工智能事宜”及时向政府和"大众作出解释。
测试和担保方面，看重第三方测试的主要性，利用具有共识性的基准和测试方法。

保障上，《框架》看重安全、内容来源、安全和对齐研发以及促进***方面的管理。
安全方面，提出了安全设计与安全保障两类安全举措。
内容来源方面，建议利用数字水印和加密出处等技能方法标记人工智能天生合成内容；与出版者、分发平台等内容天生的关键方开展互助以嵌入水印；匆匆进用户对数字水印识别、验证的理解，并供应可验证的工具。
安全和对齐研发方面，开拓过程中促进对齐，利用人工智能反馈的强化学习等预演习；演习后进行对齐验证，以便创造问题并探求缘故原由。
人工智能促进***方面，《框架》从技能获取、公共做事供应、劳动力和可持续性4个关键点提出促进人工智能促进***运用的详细路径。

三、《框架》亮点

亮点一：事后问责的“安全网”模式

这一模式为事件构建了三层防护网，第一层是开拓者志愿承诺承担某些任务，以便为用户供应可预期、可阐明的问责空间，并依据其便捷地保护个人权柄；第二层是更新产品任务等干系法律框架，使人工智能产品（常日是虚拟产品）的危害任务证明更加明确；第三层是在自律与法律之外的第三方保险，既能供应技能创新所需的监管冗余空间，也能给予因意外事宜受害的用户得到兜底性救援的机会，虽然《框架》认为这一不雅观点还处于早期的设想阶段，但干系谈论值得进一步展开。

亮点二：“食品标签”式表露方法

《框架》提出的“食品标签”式表露方法考试测验的是一种更广泛的透明，通过统一标签的种类和内容颗粒度哀求，这种表露方法能够将数据来源、模型风险、安全方法等用户关心的紧张问题逐一列举，并反向促进行业安全基准的统一和实现。
这种表露方法在一些运用程序分发平台上起先已有初步实践，例如Apple Store会公开APP的开拓者名称、适用年事、隐私政策和版本历史记录等信息。
此外，这种表露方法也同时关注对付政府监管的透明，将模型风险标签项的阈值定义交由政府，以履行高风险模型的监督。

亮点三：数字水印的技能、嵌入与公众年夜众认识

由于天生式人工智能天生合成内容的便捷性、广泛性特点，《框架》对付其带来的内容安全问题给予了特殊关注，提出了研发、运用和遍及数字水印技能的哀求。
考虑到缺少可互操作的标准，只能通过编码水印的同一公司对水印进行解码这一问题，《框架》提出打造运用闭环的验证工具，为终极用户供应渠道去便捷验证内容的真实性。
这一工具将有助于公众年夜众及时辨别人工智能天生合成内容，提高对付造假信息的认知能力，也对付企业之间数字水印技能能力与技能方法的共享和互操作提出了新的哀求。

四、《框架》对我国启迪

总体来看，《框架》是新加坡面向天生式人工智能管理的一套全方位指引手册，虽然仅具有“软约束”效力，但相较于之前“轻触”式的监管模式无疑更向前了一步——将“以人为中央”和“透明度”两大原则着落至实践，为新加坡AI家当各方指明了管理前路，也为我们供应了一些启迪。

一是《框架》中提出的创新举措值得后续参考借鉴。
我国此前发布的《新一代人工智能管理原则——发展负任务的人工智能》《环球人工智能管理倡议》等政策文件，中国信息通信研究院发布的《可信人工智能白皮书》《可信AI研发管理指南》等标准指南基本全面涵盖了《框架》9个维度的内容。
但《框架》创新提出的“无过失落保险”、“食品标签”式表露方法、打造数字水印验证工具、培植符合哀求的测试职员库等建议，具有实践性和可操作性，在后续管理实践中可以予以适当参考借鉴。

二是框架中提出的匆匆进基准与测试共识应引起重视。
为了避免管理的进度差异和维度错位，《框架》多次提及应在行业间乃至国际间就测试和评估基准保持同等性。
此前，新加坡曾宣告其“AI Verify”与美国NIST 《人工智能风险管理指南》在管理框架上实现了互操作性，为其AI家当融入国际标准和外洋市场奠定了规则根本。
为推动我国进一步参与国际管理互助，实现基于海内管理的互操作性，应重视提升规则间的折衷同等。
中国信息通信研究院此前推出的“人工智能风险管理体系”即是在凝聚家当共识的根本上与ISO/IEC 42001《人工智能管理体系》、NIST《人工智能风险管理指南》交融贯通，兼顾本土管理需求和国际互操作性的规范化指引。

随着天生式人工智能的不断发展和演化，新加坡正不断在政策方法上寻求和扩展环球互助。
《框架》中的9个维度为新加坡系统化开展人工智能管理实践、探索可信AI生态系统供应了根本。
未来，新加坡“AI Verify”基金会已明确将连续推动《框架》内容的落地履行，中国信息通信研究院将持续跟踪其发展变革，促进形成人工智能行业生态系统中的最佳实践。

作者简介

孙幼童，中国信息通信研究院人工智能研究所工程师，紧张研究方向为人工智能政策、监管、国际管理及个人信息保护等，长期跟踪并深入研讨国际人工智能管理，承担系列课题、白皮书及政府报告的研究、咨询等事情。

联系办法：

17854221701

sunxiaotong@caict.ac.cn

呼娜英，中国信息通信研究院人工智能研究所工程师，ITU FG-MV WG6副主席，AIIA安全管理委员会管理组组长。
紧张研究人工智能管理、算法管理、个人信息保护等。
牵头编写《人脸信息处理合规操作指南》，牵头编辑天下互联网大会《发展负任务的天生式人工智能研究报告及共识文件》，参与编写多份白皮书研究报告。
具备中国及美国纽约州状师职业资格。

联系办法：

15321699969

hunaying@caict.ac.cn