Open AI发布人工智能安全路径报告-每日看点
【编者按】
2023年4月5日,Open AI在其官网上发布了《我们迈向人工智能安全的路径》(Our approach to AI safety)一文,对包括ChatGPT在内的AI产品安全问题进行回应。这一公告内容从六个角度对其AI产品的安全愿景进行了声明。此前,韩国三星称ChatGPT导致其数据泄露、科技界对巨型AI暂停研发进行联合主张、意大利对ChatGPT的全面封禁等将AI产品安全问题推至风口浪尖,Open AI此举也恰是对此前安全问题质疑的回应。
(资料图片)
在这份报告中,Open AI首先强调,其致力于兼顾AI的安全与开发利益,基于此,其报告内容主要分为六大角度:1. 围绕安全、不断升级;2.立足现实、完善保障;3.保护儿童;4.尊重隐私;5.精准产出、尊重事实;6.持续投入、促进合作。
以下将对该报告每一部分内容进行简要编译和评价。
01围绕安全、不断升级
Open AI表示,其将通过测试、外部专家反馈、政府安全监管等方式,建立其AI安全系统。其指出,此前在GPT-4发布之前,Open AI内部曾花费6个多月的时间来进行相应的安全工作。
此前,Open AI也在《关于语言模型安全和误用的经验教训》(Lessons learned on language model safety and misuse) 一文中就其安全工作进行了说明,表明其正在通过新的基准(benchmarks)和分类器(classifiers)来改善API语言模型滥用的问题。
02立足现实、完善保障
Open AI认为,其在实验室中对AI安全工作的开展是有限的,必须通过在实践中获得反馈来不断迭代提升其AI安全系统。而在AI通过实践完善自身安全系统时,社会应当给予充分的尊重和理解,“我们认为社会必须有时间更新和调整,以适应日益强大的人工智能”。
(Open AI 在《关于语言模型安全和误用的经验教训》中对其安全工作流程的示意图)
03保护儿童
Open AI强调,其要求年满18岁、在获得父母批准后且年满13岁的儿童才能使用其AI产品。此外,其建立了“安全护栏”(safety guardrails),GPT-4对于仇恨、骚扰、暴力或成人内容的响应可能性相对于GPT-3.5降低了82%。另外,其还通过与非营利组织Khan Academy等合作,以构建人工智能辅助系统的方式来保护未成年人。
这一声明也与呼应了当日(4月5日)美国拜登政府在会见总统科学技术顾问委员会时提及的内容,即呼吁国会通过两党隐私立法,重视人工智能应用过程中对儿童的保护。
04尊重隐私
在隐私层面,Open AI声明其收集的数据都是公开的内容,且这些内容经过人类评审。此外,这些数据并不会直接被商用,只是用于机器学习和模型改进。另外,Open AI还表示其会尽力从训练数据集中删除个人信息。
当然,Open AI对个人信息删除的力度如何,仍然是一个“黑箱”问题。
05精准产出、尊重事实
Open AI强调,其要求年满18岁、在获得父母批准后且年满13岁的儿童才能使用其AI产品。此外,其建立了“安全护栏”(safety guardrails),GPT-4对于仇恨、骚扰、暴力或成人内容的响应可能性相对于GPT-3.5降低了82%。另外,其还通过与非营利组织Khan Academy等合作,以构建人工智能辅助系统的方式来保护未成年人。
这一声明也与呼应了当日(4月5日)美国拜登政府在会见总统科学技术顾问委员会时提及的内容,即呼吁国会通过两党隐私立法,重视人工智能应用过程中对儿童的保护。
(GPT-4与GPT-3.5回应的精准度对比)
06持续投入、促进合作
Open AI认为,提升AI系统的安全性并非一个简单的过程,需要长期投入,并与政策制定者等主体开展广泛的合作。随着AI在全球范围内的普及,AI生态系统已经在逐步建立,这对全球范围内的技术和制度创新都将是一个新的挑战。
在此前发布的《部署语言模型的最佳实践》(Best practices for deploying language models) 中,Open AI曾呼吁其他组织参与AI软件的部署,共同致力于语言模型的安全建设。
参考资料
1.https://openai.com/blog/our-approach-to-ai-safety
2.https://cdn.openai.com/papers/gpt-4-system-card.pdf
3.https://openai.com/research/language-model-safety-and-misuse
4.https://openai.com/blog/best-practices-for-deploying-language-models
文稿:张旭阳,网络法理论与实务前沿公众号执行主编
编辑:陆愿晟,网络法理论与实务前沿公众号数据治理组编辑
标签:
相关阅读
-
Open AI发布人工智能安全路径报告-每日看点
【编者按】2023年4月5日,OpenAI在其官网上发布了《我们迈向人工智... -
国际标准《数字化供应链成熟度模型》正...
近日,数字化供应链国际标准ITU-TY 4910Maturitymodelofdigitalsupplychainforsmartsusta -
《信息安全技术 公钥基础设施 在线证...
信安秘字〔2023〕38号全国信息安全标准化技术委员会归口的《信息安... -
新动态:美国佛州多所大学宣布封杀TikTo...
据多家美国媒体报道,在共和党籍州长执政的美国佛罗里达州,当地多... -
权力斗争、暗使绊子:拜登政府网络安全...
今年3月2日,拜登政府发布了明确提出美国企业应加强其网络安全性、... -
基于内生安全的云服务平台安全度量指标...
作者简介董航中国信息通信研究院安全研究所工程师,主要从事网络安...