大语言模型(LLM)知识百科
大语言模型(Large Language Model,LLM)是一种基于深度学习的人工智能程序,能够识别、生成和处理自然语言文本。关于LLM的定义、工作原理和核心能力,请参阅 [[概述/llm-定义.md|LLM 定义与基本概念]]。[^c1]
2022年末ChatGPT的发布引爆了全球生成式AI浪潮,此后LLM经历了飞速发展。截至2026年中,领先的LLM由OpenAI、Google、Meta、Anthropic、DeepSeek、阿里巴巴、智谱AI等公司开发[^c2]。该领域已从GPT-4o和Gemini等通用多模态模型,演进到o1、o3等具备深度推理能力的专门化推理模型。LLM正处于"全能对决"的深水区,海外巨头加速迭代、国产模型强势突围、开源力量持续破局[^c3]。当前不存在绝对的全能王者——Claude在编程和智能体领域领先,GPT在均衡推理方面胜出,Gemini领跑科学计算,国产模型在中文场景中占据统治地位[^c4]。
LLM的核心能力包括语言理解与生成、知识问答、多步推理、代码生成和多模态处理。GPT-4o作为首个端到端多模态统一模型,可接受文本、音频、图像和视频输入并生成相应输出[^c5]。在应用层面,LLM已深入渗透到软件开发(AI生成或辅助的代码占全球代码的41%)、内容创作、企业自动化和科研等多个领域。42%的组织报告在生产力、效率和成本方面取得了显著提升[^c7]。
然而,LLM的发展也面临重大挑战。幻觉问题——模型生成看似合理但与事实不符的文本——仍是尚未完全解决的固有难题。提示注入已被NIST列为生成式AI最大的安全缺陷。训练和推理AI模型需要大量计算资源,预计到2027年AI相关数据中心年耗电量可能达到100-150 TWh[^c8]。此外,模型偏见、版权争议和环境影响等伦理与社会问题也需要持续关注。
展望未来,推理能力提升、智能体化、多模态原生融合和小型化边缘部署被视为LLM的主要发展方向。开源模型与闭源模型在推理能力上的差距已大幅缩小,成本持续下降,AI技术正加速走向普及。