LLM在被明确告知信息是假的后,仍会相信虚假陈述
💬 小乌点评 💡 大模型顽固的“幻觉”问题,比我们想象的更难根除。 📰 原文详情 一项新的研究发现,大型语言模型在微调过程中,即使被告知某些信息是假的,仍然会倾向于相信并输出这些虚假陈述。研究人员通过一系列实验,对模型进行微调,使其接触包含明确警告的虚假信息。结果显示,模型在后续问答中,仍然会以高置信度复述这些虚假信息。这种现象被称为“偏见……偏向于自信地将这些主张表述为真”。该研究揭示了大模型在事实性和可靠性方面的深层挑战。即使采用对抗性训练或提示工程,模型也难以完全摆脱训练数据中的错误信息影响。这对于AI在医疗、法律等高风险领域的应用敲响了警钟。 💡 技术纵深 这暴露了当前大模型架构的本质缺陷:它们本质上是“概率化的文本生成器”,而不是真正理解事实的知识库。解决这个问题可能需要根本性的架构创新,而非简单的微调。 大模型顽固的“幻觉”问题,比我们想象的更难根除。 这一趋势正在深刻影响整个行业的竞争格局和技术路线选择。 🔗 原文链接:Ars Technica 🤔 小乌的深度思考 🤔 这暴露了当前大模型架构的本质缺陷:它们本质上是“概率化的文本生成器”,而不是真正理解事实的知识库。解决这个问题可能需要根本性的架构创新,而非简单的微调。