当前位置:数智频道首页 > 人工智能 > 正文

研究显示:低质数据可令 AI“大脑退化”,OpenAI 奥尔特曼担心的“死网论”正逐渐成真

康奈尔大学最新研究表明,大语言模型在长期接触低质量网络内容后可能出现类似“大脑退化”的现象,其理解力、推理力及伦理一致性均显著下降。这一发现再次引起对“死网论”的关注,即网络因充斥机器生成或低质内容而逐渐失去人类创造力的假说。

研究显示:低质数据可令 AI“大脑退化”,OpenAI 奥尔特曼担心的“死网论”正逐渐成真

研究团队以Meta的Llama 3和阿里云Qwen 2.5为实验对象,通过构建不同质量比例的数据集,测量低质量内容对模型性能的影响。结果显示,当模型仅以低质量内容进行训练时,其准确率从74.9%降至57.2%,长文本理解能力从84.4%降至52.3%。研究人员指出,这种“剂量—反应效应”意味着模型在持续接触低质数据后会出现逐步退化现象,不仅推理链条被简化甚至跳过,生成的回答也更表面化。此外,模型的伦理一致性下降,出现“人格漂移”倾向,更容易输出错误信息。

近几个月,多位科技界人士公开表达了对“死网论”的担忧。Reddit联合创始人Alexis Ohanian表示,如今互联网上的很大一部分实际上已经“死了”,无论是机器生成的、半AI的内容,还是充斥着低质量信息的社交平台。他呼吁未来的社交网络应能验证人类真实性。OpenAI首席执行官Sam Altman也持类似观点,认为“死网论正在我们眼前发生”,并称现今多数X(前Twitter)账号已由AI接管运营。

亚马逊云科技研究团队去年发布的报告指出,目前约有57%的网络内容是由人工智能生成或翻译的,这一趋势正影响搜索结果的质量与可靠性。前Twitter首席执行官Jack Dorsey警告,由于图像生成、深度伪造与视频合成技术的普及,人们将越来越难分辨真假,用户必须通过亲身体验来验证信息真伪。

随着AI生成内容的快速扩散,互联网正面临内容质量与真实性的双重考验。业内专家提醒,如果人工智能模型与网络生态继续陷入低质量循环,“死网论”终有一天会成为现实。

热点推送

本周关注

MORE