Gemini
Gemini是Google DeepMind开发的多模态大语言模型系列,继承LaMDA和PaLM 2的技术路线,于2023年12月6日正式发布[^c1]。该系列以原生多模态能力为核心特征——从设计之初就联合预训练文本、图像、音频、视频和代码,而非像传统方法那样将不同模态的组件分别训练后拼接。2025年9月美国DOJ反垄断庭审披露,Gemini的预训练数据主要来自Google内部维护的Google Common Corpus(GCC),包含近期被Googlebot爬取的网页文档,且Google明确未使用用户点击和搜索查询数据进行预训练[^c23]。
Gemini系列包含多个规模层级:Ultra(旗舰版本,面向高度复杂任务)、Pro(通用版本)、Flash(轻量高效变体)和Nano(端侧设备版本)。Gemini 1.0 Ultra在发布时成为首个在MMLU基准上超过90%的模型[^c2],在32项学术基准中的30项上达到当时最优水平[^c4]。Gemini 1.5引入了稀疏混合专家架构,支持最高1000万token的上下文窗口并实现近乎完美的检索召回率[^c3]。
2025年,Gemini 2.5系列正式引入"思考模型"概念——模型在生成回答前先进行推理[^c7]。同年11月发布的Gemini 3 Pro将上下文窗口扩展至100万token[^c8],并推出Deep Think并行推理模式,可同时评估多条推理路径以提升复杂任务准确率[^c9]。2026年5月,Gemini 3.5 Flash以"为行动而生,而非仅为回答"的定位成为Google默认AI模型[^c5],在编码和智能体基准测试中超越Gemini 3.1 Pro[^c11]。同月发布的Gemini Omni作为多模态生成模型,支持任意输入到任意输出的转换。Gemini 3.5 Pro于2026年6月3日由Alphabet官方确认将于当月正式推出。
2026年5月的Google I/O大会将战略重心全面转向AI智能体基础设施。Google历史上首次将搜索描述为"25年来最大规模更新"[^c18],AI生成答案取代传统链接列表成为主要回应方式。AI Mode上线一年即突破10亿月活用户,查询量每季度翻倍;AI Overviews(AI摘要)拥有25亿用户[^c14];Gemini月活用户从一年前的4亿增长至9亿[^c15]。Sundar Pichai在主题演讲中指出,前沿智能体"可能只触达过世界上0.1%的人",核心挑战在于将这种能力规模化交付给更广泛的用户[^c17]。美银分析师在会后研报中评价Google"不再追赶,搜索与代理发布展示了领先的产品创新"[^c16]。
此次I/O推出多模态生成模型Gemini Omni、全天候个人AI代理Gemini Spark、搜索智能体、通用商业协议等一系列产品,标志着AI竞争从模型能力进阶到Agent经济学阶段[^c13]。Gemini Spark于2026年6月初正式面向美国AI Ultra订阅用户开放,其基于个人数据执行个性化任务的能力令评测者印象深刻,同时也引发了对隐私边界的深度忧虑——该智能体可自动从Gmail提取家庭成员信息、购票记录等数据进行任务编排[^c25][^c24]。但分析人士也指出,Google的AI代理品牌过多、高端功能被锁定在每月100美元的Ultra订阅之后,普通用户可能难以体验这些新能力。
Gemini的快速迭代得益于Google在软硬件垂直整合方面的系统性优势——自研TPU加速器、OCS光交换网络、JAX/XLA软件栈和RLAIF自动化训练流程共同构成了其技术护城河,使完整训练周期可压缩至约三个月[^c12]。Google服务的月度token处理量已达3.2千万亿[^c19],资本支出从2025年的914亿美元激增至2026年的1866亿美元,显示公司正以前所未有的力度投资AI基础设施[^c20]。Alphabet 2026年第一季度财报显示这一投资正转化为营收增长:Google Cloud营收同比增长63%,企业生成式AI产品营收同比增长近800%[^c22]。
在硬件层面,Google于The Android Show 2026上推出Gemini Intelligence高端AI品牌和Googlebooks新硬件品类,将Android定位为Gemini落地的硬件骨架。分析认为AI时代的竞争胜负由硬件层面而非云端模型决定[^c21],Gemini Intelligence通过对标Apple Intelligence划定AI功能的高端设备门槛。该系列被描述为Google"最强大、最通用的AI模型"[^c6],已深度集成到搜索、广告等全线产品中,并通过与Apple的合作伙伴关系覆盖超过22亿台活跃设备[^c10]。2026年6月,Gemini品牌进一步扩展至体育赞助领域,与约旦足协签署合作协议,成为约旦国家足球队的AI赞助商[^c26]。
Gemini同时在安全性和准确性方面经历了多起争议,包括AI诱导自杀诉讼、图像生成偏见、事实性错误和内容过滤问题,Common Sense Media将其未成年人版本评为"高风险"。Google持续加强模型的安全防护机制。