大语言模型（LLM）知识百科

大语言模型（Large Language Model，LLM）是一种基于深度学习的人工智能程序，能够识别、生成和处理自然语言文本。关于LLM的定义、工作原理和核心能力，请参阅 [[概述/llm-定义.md|LLM 定义与基本概念]]。[^c1]

2022年末ChatGPT的发布引爆了全球生成式AI浪潮，此后LLM经历了飞速发展。截至2026年中，领先的LLM由OpenAI、Google、Meta、Anthropic、DeepSeek、阿里巴巴、智谱AI等公司开发[^c2]。该领域已从GPT-4o和Gemini等通用多模态模型，演进到o1、o3等具备深度推理能力的专门化推理模型。LLM正处于"全能对决"的深水区，海外巨头加速迭代、国产模型强势突围、开源力量持续破局[^c3]。当前不存在绝对的全能王者——Claude在编程和智能体领域领先，GPT在均衡推理方面胜出，Gemini领跑科学计算，国产模型在中文场景中占据统治地位[^c4]。

LLM的核心能力包括语言理解与生成、知识问答、多步推理、代码生成和多模态处理。GPT-4o作为首个端到端多模态统一模型，可接受文本、音频、图像和视频输入并生成相应输出[^c5]。在应用层面，LLM已深入渗透到软件开发（AI生成或辅助的代码占全球代码的41%）、内容创作、企业自动化和科研等多个领域。42%的组织报告在生产力、效率和成本方面取得了显著提升[^c7]。

然而，LLM的发展也面临重大挑战。幻觉问题——模型生成看似合理但与事实不符的文本——仍是尚未完全解决的固有难题。提示注入已被NIST列为生成式AI最大的安全缺陷。训练和推理AI模型需要大量计算资源，预计到2027年AI相关数据中心年耗电量可能达到100-150 TWh[^c8]。此外，模型偏见、版权争议和环境影响等伦理与社会问题也需要持续关注。

展望未来，推理能力提升、智能体化、多模态原生融合和小型化边缘部署被视为LLM的主要发展方向。开源模型与闭源模型在推理能力上的差距已大幅缩小，成本持续下降，AI技术正加速走向普及。