Gemini

Gemini是Google DeepMind开发的多模态大语言模型系列，继承LaMDA和PaLM 2的技术路线，于2023年12月6日正式发布[^c1]。该系列以原生多模态能力为核心特征——从设计之初就联合预训练文本、图像、音频、视频和代码。2025年9月美国DOJ反垄断庭审披露，Gemini的预训练数据主要来自Google内部维护的Google Common Corpus（GCC）[^c23]。

Gemini系列包含多个规模层级：Ultra（旗舰版本，面向高度复杂任务）、Pro（通用版本）、Flash（轻量高效变体）和Nano（端侧设备版本）。Gemini 1.0 Ultra在发布时成为首个在MMLU基准上超过90%的模型[^c2]，在32项学术基准中的30项上达到当时最优水平[^c4]。Gemini 1.5引入了稀疏混合专家架构，支持最高1000万token的上下文窗口[^c3]。2025年，Gemini 2.5系列正式引入"思考模型"概念[^c7]。同年11月发布的Gemini 3 Pro将上下文窗口扩展至100万token[^c8]，并推出Deep Think并行推理模式[^c9]。

2026年5月的Google I/O大会将战略重心全面转向AI智能体基础设施。Google历史上首次将搜索描述为"25年来最大规模更新"[^c18]，AI生成答案取代传统链接列表成为主要回应方式。Gemini 3.5 Flash以"为行动而生，而非仅为回答"的定位成为Google默认AI模型[^c5]，在编码和智能体基准测试中超越Gemini 3.1 Pro[^c11]。同月发布的Gemini Omni作为多模态生成模型，支持任意输入到任意输出的转换。此次I/O推出全天候个人AI代理Gemini Spark[^c24]、CodeMender安全智能体、Antigravity 2.0等一系列产品，标志着AI竞争从模型能力进阶到Agent经济学阶段[^c13]。两项支撑科学研究——Co-Scientist和ERA——同日发表于Nature，在药物发现和流行病学预测中展示了AI加速科研的能力[^c37]。

2026年6月，Gemini生态进入密集的产品交付与挑战并存的阶段。Gemini Spark正式面向美国AI Ultra订阅用户开放，被评测为"最令人惊叹的AI体验之一"[^c25]。同月，Gemini 3.5 Pro未能按计划于6月全面可用，Google将公开发布推迟至7月——这是Google在2026年第二次重大AI交付延期（此前Gemini Ultra 1.5曾被推迟三个月）[^c31]。更引人关注的是，同一周内四位资深Gemini研究员宣布离职加入Anthropic[^c34]，引发了业界对Google AI人才保留能力的关注。6月10日，Google发布Gemini 3.5 Live Translate实时语音翻译模型，支持70余种语言[^c33]。6月19日，Google Cloud伦敦峰会全面展示了企业智能体战略，推出Agent Gateway跨云治理工具，联合利华成为首批部署企业[^c27]。6月26日，Gemini应用集成Google Play商店，支持通过自然语言搜索、安装应用并进行应用内购买[^c35]。NotebookLM同步升级，新增自动Drive同步和多媒体生成等功能，Lyria 3 Pro支持最长3分钟的音乐生成。

在基础设施层面，Gemini API需求急剧增长导致算力供应紧张。2026年3月前后，Google告知Meta无法足额供应其所需的Gemini模型算力额度，打乱了Meta多项内部AI项目[^c36]。5月17日起，Google对所有Gemini应用实施基于算力额度的使用限制。这一问题凸显了AI基础设施建设仍难以跟上生成式AI快速扩张的需求。

在治理层面，Google于5月22日向DC Circuit法院提交了反垄断上诉状，请求推翻2024年的搜索垄断裁定和已生效的数据共享补救措施[^c32]。6月12日，Google首次就Gemini被滥用提起诉讼，指控中国网络犯罪团伙利用该模型构建钓鱼网站。此外，Google为Gemini推出"Help is available"心理健康危机干预功能[^c28]，SynthID数字水印技术已标记超过1000亿张图像和视频[^c29]。

Gemini的快速迭代得益于Google在软硬件垂直整合方面的系统性优势——自研TPU加速器、OCS光交换网络、JAX/XLA软件栈和RLAIF自动化训练流程共同构成了其技术护城河，使完整训练周期可压缩至约三个月[^c12]。Google服务的月度token处理量已达3.2千万亿[^c19]，资本支出从2025年的914亿美元激增至2026年的1866亿美元[^c20]。Alphabet 2026年第一季度财报显示Google Cloud营收同比增长63%，企业生成式AI产品营收同比增长近800%[^c22]。

在硬件层面，Google于The Android Show 2026上推出Gemini Intelligence高端AI品牌和Googlebooks新硬件品类，将Android定位为Gemini落地的硬件骨架[^c21]。该系列已深度集成到搜索、广告等全线产品中，并通过与Apple的合作伙伴关系覆盖超过22亿台活跃设备[^c10]。