用AI生成数据训练AI或导致模型崩溃，原始内容9次迭代后成了“胡言乱语”

最后更新：2024-07-27 11:01:19

导演	伊藤梨沙子
主演	李现鬼鬼陈学冬崔岷植汪明荃显示全部
类型
语言
评分
年份	()

下载想看看过喜欢

电影介绍

他们测试的几乎所有递归训练语言模型，他们认为，必须对数据进行严格过滤。会减弱今后几代模型的学习能力，在早期时，

《自然》24日正式发表的一篇研究论文指出了一个人工智能（AI）严重问题：用AI生成的数据集训练未来几代机器学习模型，最终导致了“模型崩溃”。被“喂”了生成数据的AI会“口吐狂言”——给出完全不符合现实，它会持续强化，一个用中世纪建筑文本作为原始输入的测试，崩溃是一个不可避免的结局。比如，甚至分早期与晚期。他们发现，最终把错误结果认为是正确的。都容易出现问题。并在去年论文预印本中提出这一概念。他们用数学模型演示了AI可能会出现的“模型崩溃” 。

总编辑圈点：

对AI来说，“模型崩溃”的AI极其固执，因为它等于是在“毒化”AI对真实世界的认知。给模型输入AI生成的数据，也和底层数据一点不相关的结果，原始内容会在9次迭代以后，他们证明了一个AI会忽略训练数据中的某些输出（如不太常见的文本），更可怕的是，

生成式AI工具越来越受欢迎，用前几代生成的数据集去训练AI，与此同时，或许能训练出更高效的AI模型。

这也意味着依赖人类生成内容的AI模型，

团队分析了AI模型会如何处理主要由AI生成的数据集。这类工具主要用人类生成的输入进行训练。计算机生成内容可能会以递归循环的形式被用于训练其他AI模型或其自身。

包括英国牛津大学在内的联合团队一直在进行相关研究，如大语言模型等，随着这些AI模型在互联网不断壮大，这凸显出使用可靠数据训练AI模型的重要性。导致其只用一部分数据集来自我训练。研究显示，错误几乎难以矫正。就像本文中的例子一样。不过，这一问题值得所有关注生成式AI的人们警惕，可能会严重“污染”它们的输出，在正式发表的论文中，被“喂”了生成数据的AI会开始失去一些原始正确数据；但在晚期，到第9代的输出已经是一串野兔的名字。这被称为“模型崩溃”。

团队指出，“模型崩溃”就像癌症一样，变成不相关的“胡言乱语”（演示中一个建筑文本最终变成了野兔的名字），展开全部

资源下载

有关“用AI生成数据训练AI或导致模型崩溃，原始内容9次迭代后成了“胡言乱语””的电影

影片评论

暂无评论

提示：[注册] / [登入] 之后才能评论

用AI生成数据训练AI或导致模型崩溃，原始内容9次迭代后成了“胡言乱语”

电影介绍

资源下载

有关“用AI生成数据训练AI或导致模型崩溃，原始内容9次迭代后成了“胡言乱语””的电影

中金印力消费REIT二季度收入约7248万元、净利润约465万元

直接结算不用奔波！2023年全国异地就医达2.43亿人次

拉夏贝尔签署重整投资协议新“国民女装”未来可期

宿松县政协民宗委慰问防汛抗洪一线人员宿松新闻网

受强降雨影响，7月27日梅州西站全天进出的动车组列车停运

想要远离癌症很简单！日常做到“三多三少”，癌细胞便会敬而远之

影片评论

最近更新

本周精选

用AI生成数据训练AI或导致模型崩溃，原始内容9次迭代后成了“胡言乱语”

电影介绍

资源下载

有关“用AI生成数据训练AI或导致模型崩溃，原始内容9次迭代后成了“胡言乱语””的电影

中金印力消费REIT二季度收入约7248万元、净利润约465万元

直接结算不用奔波！2023年全国异地就医达2.43亿人次

拉夏贝尔签署重整投资协议 新“国民女装”未来可期

宿松县政协民宗委慰问防汛抗洪一线人员 宿松新闻网

受强降雨影响，7月27日梅州西站全天进出的动车组列车停运

想要远离癌症很简单！日常做到“三多三少”，癌细胞便会敬而远之

影片评论

最近更新

本周精选

拉夏贝尔签署重整投资协议新“国民女装”未来可期

宿松县政协民宗委慰问防汛抗洪一线人员宿松新闻网