您的位置:首页 >科技 >

Open AI发布人工智能安全路径报告-每日看点

2023-04-09 06:07:01    来源:互联网

【编者按】

2023年4月5日,Open AI在其官网上发布了《我们迈向人工智能安全的路径》(Our approach to AI safety)一文,对包括ChatGPT在内的AI产品安全问题进行回应。这一公告内容从六个角度对其AI产品的安全愿景进行了声明。此前,韩国三星称ChatGPT导致其数据泄露、科技界对巨型AI暂停研发进行联合主张、意大利对ChatGPT的全面封禁等将AI产品安全问题推至风口浪尖,Open AI此举也恰是对此前安全问题质疑的回应。


(资料图片)

在这份报告中,Open AI首先强调,其致力于兼顾AI的安全与开发利益,基于此,其报告内容主要分为六大角度:1. 围绕安全、不断升级;2.立足现实、完善保障;3.保护儿童;4.尊重隐私;5.精准产出、尊重事实;6.持续投入、促进合作。

以下将对该报告每一部分内容进行简要编译和评价。

01围绕安全、不断升级

Open AI表示,其将通过测试、外部专家反馈、政府安全监管等方式,建立其AI安全系统。其指出,此前在GPT-4发布之前,Open AI内部曾花费6个多月的时间来进行相应的安全工作。

此前,Open AI也在《关于语言模型安全和误用的经验教训》(Lessons learned on language model safety and misuse) 一文中就其安全工作进行了说明,表明其正在通过新的基准(benchmarks)和分类器(classifiers)来改善API语言模型滥用的问题。

02立足现实、完善保障

Open AI认为,其在实验室中对AI安全工作的开展是有限的,必须通过在实践中获得反馈来不断迭代提升其AI安全系统。而在AI通过实践完善自身安全系统时,社会应当给予充分的尊重和理解,“我们认为社会必须有时间更新和调整,以适应日益强大的人工智能”。

(Open AI 在《关于语言模型安全和误用的经验教训》中对其安全工作流程的示意图)

03保护儿童

Open AI强调,其要求年满18岁、在获得父母批准后且年满13岁的儿童才能使用其AI产品。此外,其建立了“安全护栏”(safety guardrails),GPT-4对于仇恨、骚扰、暴力或成人内容的响应可能性相对于GPT-3.5降低了82%。另外,其还通过与非营利组织Khan Academy等合作,以构建人工智能辅助系统的方式来保护未成年人。

这一声明也与呼应了当日(4月5日)美国拜登政府在会见总统科学技术顾问委员会时提及的内容,即呼吁国会通过两党隐私立法,重视人工智能应用过程中对儿童的保护。

04尊重隐私

在隐私层面,Open AI声明其收集的数据都是公开的内容,且这些内容经过人类评审。此外,这些数据并不会直接被商用,只是用于机器学习和模型改进。另外,Open AI还表示其会尽力从训练数据集中删除个人信息。

当然,Open AI对个人信息删除的力度如何,仍然是一个“黑箱”问题

05精准产出、尊重事实

Open AI强调,其要求年满18岁、在获得父母批准后且年满13岁的儿童才能使用其AI产品。此外,其建立了“安全护栏”(safety guardrails),GPT-4对于仇恨、骚扰、暴力或成人内容的响应可能性相对于GPT-3.5降低了82%。另外,其还通过与非营利组织Khan Academy等合作,以构建人工智能辅助系统的方式来保护未成年人。

这一声明也与呼应了当日(4月5日)美国拜登政府在会见总统科学技术顾问委员会时提及的内容,即呼吁国会通过两党隐私立法,重视人工智能应用过程中对儿童的保护。

(GPT-4与GPT-3.5回应的精准度对比)

06持续投入、促进合作

Open AI认为,提升AI系统的安全性并非一个简单的过程,需要长期投入,并与政策制定者等主体开展广泛的合作。随着AI在全球范围内的普及,AI生态系统已经在逐步建立,这对全球范围内的技术和制度创新都将是一个新的挑战。

在此前发布的《部署语言模型的最佳实践》(Best practices for deploying language models) 中,Open AI曾呼吁其他组织参与AI软件的部署,共同致力于语言模型的安全建设。

参考资料

1.https://openai.com/blog/our-approach-to-ai-safety

2.https://cdn.openai.com/papers/gpt-4-system-card.pdf

3.https://openai.com/research/language-model-safety-and-misuse

4.https://openai.com/blog/best-practices-for-deploying-language-models

文稿:张旭阳,网络法理论与实务前沿公众号执行主编

编辑:陆愿晟,网络法理论与实务前沿公众号数据治理组编辑

标签:

相关阅读