数字等同于近亲繁殖可能导致人工智能自行崩溃

人工智能(人工智能)先知新闻贩子预测生成式人工智能炒作将结束,并谈论即将发生的灾难性“模型崩溃”。

但这些预测有多现实呢?到底什么是模型崩溃?

讨论于2023,但普及了最近,“模型崩溃”是指一种假设的场景,即由于互联网上人工智能生成的数据的增加,未来的人工智能系统会逐渐变得愚蠢。

对数据的需求

现代 AI 系统是使用机器学习.程序员设置了底层的数学结构,但实际的“智能”来自训练系统模仿数据中的模式。

但不仅仅是任何数据。当前的生成式人工智能系统需要高质量的数据,而且需要大量的数据。

为了获取这些数据,OpenAI、谷歌、Meta 和 Nvidia 等大型科技公司不断在互联网上搜寻,以收集信息数 TB 的内容为机器供料。但自从广泛可用有用生成式 AI 系统 2022 年,人们越来越多地上传和分享部分或全部由 AI 制作的内容。

2023 年,研究人员开始思考他们是否能够摆脱仅依赖 AI 创建的训练数据,而不是人类生成的数据。

有巨大的激励措施来完成这项工作。除了在互联网上激增之外,人工智能制作的内容也是便宜得多比人类数据的来源。它也不是道德合法可疑集体收集。

然而,研究人员发现,如果没有高质量的人类数据,人工智能系统就会在人工智能制造的数据上进行训练变得越来越笨因为每个模型都从前一个模型中学习。这就像近亲繁殖问题的数字版本。

这 ”反刍训练“似乎导致了模型行为的质量和多样性的降低。这里的质量大致意味着乐于助人、无害和诚实的某种组合。多样性是指反应的变化,以及人们的文化和社会观点在人工智能输出中得到体现。

简而言之:通过如此频繁地使用人工智能系统,我们可能会污染我们首先需要使它们有用的数据源。

避免坍塌

大型科技公司不能过滤掉人工智能生成的内容吗?没有。科技公司已经花费了大量的时间和金钱来清理和过滤他们抓取的数据,一位业内人士最近分享说,他们有时会丢弃高达 90%他们最初为训练模型收集的数据。

随着专门删除 AI 生成内容的需求增加,这些工作可能会变得更加艰巨。但更重要的是,从长远来看,区分人工智能内容实际上会越来越难。这将使合成数据的过滤和删除成为(财务)收益递减的游戏。

归根结底,迄今为止的研究表明,我们无法完全消除人类数据。毕竟,这是人工智能中的“我”的来源。

我们是否正在走向一场灾难?

有迹象表明,开发人员已经不得不更加努力地获取高质量的数据。例如文档随着 GPT-4 的发布,参与该项目数据相关部分的工作人员数量空前。

我们也可能正在耗尽新的人类数据。一些估计说,人类生成的文本数据池最早可能在2026年被挖掘出来。

这可能就是 OpenAI 和其他公司的原因竞相巩固独家合作伙伴关系与行业巨头合作,例如Shutterstock,美联社新闻集团.他们拥有大量专有的人类数据,这些数据在公共互联网上并不容易获得。

然而,灾难性模型崩溃的可能性可能被夸大了。到目前为止,大多数研究都着眼于合成数据取代人类数据的情况。在实践中,人类和人工智能数据可能会并行积累,这降低塌陷的可能性.

最有可能的未来情况还将看到一个由某种程度上多样化的生成式人工智能平台组成的生态系统被用于创建和发布内容,而不是一个单一的模型。这也增加了抗崩溃的鲁棒性。

对于监管机构来说,这是一个很好的理由,可以通过以下方式促进良性竞争限制垄断在人工智能领域,并为公益技术开发.

真正令人担忧的问题

过多的人工智能内容也会带来更微妙的风险。

大量的合成内容可能不会对人工智能的发展构成生存威胁,但它确实威胁到(人类)互联网的数字公共利益。

例如,研究人员发现下降了 16%ChatGPT 发布一年后,编码网站 StackOverflow 上的活动。这表明,在一些在线社区中,人工智能辅助可能已经减少了人与人之间的互动。

超生产来自 AI 驱动的内容农场也使得找到不是的内容变得更加困难塞满广告的点击诱饵.

可靠地区分人工生成的内容和人工智能生成的内容变得越来越不可能。解决这个问题的一种方法是对人工智能生成的内容进行水印或标记,就像我和许多其他人一样最近突出显示,正如最近的澳大利亚政府所反映的那样暂行立法.

此外,还存在另一个风险。随着人工智能生成的内容变得系统性地同质化,我们面临着失败的风险社会文化多样性一些人群甚至可以体验到文化擦除.我们迫切需要跨学科研究社会和文化挑战由人工智能系统提出。

人与人之间的互动和人的数据很重要,我们应该保护它们。为了我们自己,也许也是为了未来模型崩溃的可能风险。

亚伦·斯诺斯韦尔(Aaron J.Snoswell),人工智能问责制研究员,昆士兰科技大学 (Queensland University of Technology)

本文重新发表自对话根据知识共享许可。阅读原文.

宝宝起名

本站所有相关知识仅供大家参考、学习之用,部分来源于互联网,其版权均归原作者及网站所有,如无意侵犯您的权利,请与小编联系,我们将会在第一时间核实并给予反馈。
相关期刊推荐
湖北农机化

湖北农机化

农业基础科学 - 省级期刊

文化学刊

文化学刊

合作期刊 - 省级期刊

时代农机

时代农机

农业综合 - 省级期刊

军民两用技术与产品

军民两用技术与产品

合作期刊 - 国家级期刊

经济研究导刊

经济研究导刊

合作期刊 - 省级期刊

四川建材

四川建材

合作期刊 - 省级期刊

新丝路

新丝路

史学理论 - 省级期刊

文体用品与科技

文体用品与科技

合作期刊 - 国家级期刊

智能城市

智能城市

合作期刊 - 省级期刊

信息记录材料

信息记录材料

一般化学工业 - 国家级期刊

石化技术

石化技术

合作期刊 - 国家级期刊