Gemini
Gemini是Google DeepMind开发的多模态大语言模型系列,继承LaMDA和PaLM 2的技术路线,于2023年12月6日正式发布[^c1]。该系列以原生多模态能力为核心特征——从设计之初就联合预训练文本、图像、音频、视频和代码。2025年9月美国DOJ反垄断庭审披露,Gemini的预训练数据主要来自Google内部维护的Google Common Corpus(GCC)[^c23]。
Gemini系列包含多个规模层级:Ultra(旗舰版本,面向高度复杂任务)、Pro(通用版本)、Flash(轻量高效变体)和Nano(端侧设备版本)。Gemini 1.0 Ultra在发布时成为首个在MMLU基准上超过90%的模型[^c2],在32项学术基准中的30项上达到当时最优水平[^c4]。Gemini 1.5引入了稀疏混合专家架构,支持最高1000万token的上下文窗口[^c3]。2025年,Gemini 2.5系列正式引入"思考模型"概念[^c7]。同年11月发布的Gemini 3 Pro将上下文窗口扩展至100万token[^c8],并推出Deep Think并行推理模式[^c9]。
2026年5月的Google I/O大会将战略重心全面转向AI智能体基础设施。Google历史上首次将搜索描述为"25年来最大规模更新"[^c18],AI生成答案取代传统链接列表成为主要回应方式。Gemini 3.5 Flash以"为行动而生,而非仅为回答"的定位成为Google默认AI模型[^c5],在编码和智能体基准测试中超越Gemini 3.1 Pro[^c11]。同月发布的Gemini Omni作为多模态生成模型,支持任意输入到任意输出的转换。此次I/O推出全天候个人AI代理Gemini Spark[^c24]、CodeMender安全智能体、Antigravity 2.0等一系列产品,标志着AI竞争从模型能力进阶到Agent经济学阶段[^c13]。两项支撑科学研究——Co-Scientist和ERA——同日发表于Nature,在药物发现和流行病学预测中展示了AI加速科研的能力[^c37]。
2026年6月,Gemini生态进入密集的产品交付与挑战并存的阶段。Gemini Spark正式面向美国AI Ultra订阅用户开放,被评测为"最令人惊叹的AI体验之一"[^c25]。同月,Gemini 3.5 Pro未能按计划于6月全面可用,Google将公开发布推迟至7月——这是Google在2026年第二次重大AI交付延期(此前Gemini Ultra 1.5曾被推迟三个月)[^c31]。更引人关注的是,同一周内四位资深Gemini研究员宣布离职加入Anthropic[^c34],引发了业界对Google AI人才保留能力的关注。6月10日,Google发布Gemini 3.5 Live Translate实时语音翻译模型,支持70余种语言[^c33]。6月19日,Google Cloud伦敦峰会全面展示了企业智能体战略,推出Agent Gateway跨云治理工具,联合利华成为首批部署企业[^c27]。6月26日,Gemini应用集成Google Play商店,支持通过自然语言搜索、安装应用并进行应用内购买[^c35]。NotebookLM同步升级,新增自动Drive同步和多媒体生成等功能,Lyria 3 Pro支持最长3分钟的音乐生成。
在基础设施层面,Gemini API需求急剧增长导致算力供应紧张。2026年3月前后,Google告知Meta无法足额供应其所需的Gemini模型算力额度,打乱了Meta多项内部AI项目[^c36]。5月17日起,Google对所有Gemini应用实施基于算力额度的使用限制。这一问题凸显了AI基础设施建设仍难以跟上生成式AI快速扩张的需求。
在治理层面,Google于5月22日向DC Circuit法院提交了反垄断上诉状,请求推翻2024年的搜索垄断裁定和已生效的数据共享补救措施[^c32]。6月12日,Google首次就Gemini被滥用提起诉讼,指控中国网络犯罪团伙利用该模型构建钓鱼网站。此外,Google为Gemini推出"Help is available"心理健康危机干预功能[^c28],SynthID数字水印技术已标记超过1000亿张图像和视频[^c29]。
Gemini的快速迭代得益于Google在软硬件垂直整合方面的系统性优势——自研TPU加速器、OCS光交换网络、JAX/XLA软件栈和RLAIF自动化训练流程共同构成了其技术护城河,使完整训练周期可压缩至约三个月[^c12]。Google服务的月度token处理量已达3.2千万亿[^c19],资本支出从2025年的914亿美元激增至2026年的1866亿美元[^c20]。Alphabet 2026年第一季度财报显示Google Cloud营收同比增长63%,企业生成式AI产品营收同比增长近800%[^c22]。
在硬件层面,Google于The Android Show 2026上推出Gemini Intelligence高端AI品牌和Googlebooks新硬件品类,将Android定位为Gemini落地的硬件骨架[^c21]。该系列已深度集成到搜索、广告等全线产品中,并通过与Apple的合作伙伴关系覆盖超过22亿台活跃设备[^c10]。