整理|郑丽媛
出品|CSDN(ID:CSDNnews)
昨天,微软在Build大会上刚刚甩出“Windows子系统”和“Copilot开源”的重磅炸弹,整个开发者圈还没从热议中缓过劲来,转眼今天凌晨,谷歌就在I/O大会上掏出了自己的“王炸”牌——一场AI盛宴,正式上演!
从凌晨1点开始,这场持续了2小时的发布会彻底印证了网友的预测:曾经占据谷歌I/O大会中心的Android系统正在“靠边站”,C位已经留给了更具革命性的AI。
一年发布了10+个新模型、20+个重大AI产品与新功能
“我听说今天是双子座(Gemini)季节的开始,但我并不觉得这有什么特别的——毕竟在谷歌,每一天都是Gemini的季节。”谷歌CEOSundarPichai在开场时笑说道。
回顾上一次I/O大会至今,SundarPichai表示谷歌已发布了十多个新模型和研究突破,并推出了20多个重大AI产品与新功能。他解释道,“我们的目标很简单:让最优秀的模型和产品尽快触达用户,因此我们正以前所未有的速度推进发布节奏。”
他指出,相比第一代,如今的几乎发生了“跃迁式”变化:在LMArena榜单上横扫各大类别、在多项基准测试中刷新纪录;在代码领域也取得巨大进展,登顶WebArena榜首。
与此同时,世界也在迅速响应和采用AI。为此,SundarPichai分享了一些直观数据:
●去年同期,谷歌在产品与API中每月处理约9.7万亿个token,而如今这一数字达到480万亿,一年间增长了近50倍。
●AI开发者工具的采用也迎来爆发式增长:目前有超过700万开发者正在使用Gemini,比去年这个时候多了五倍;此外,Gemini在VertexAI上的使用量也增加了40倍。
●用户端产品同样热度高涨:Gemini应用的月活跃用户数现已突破4亿,而更是带动了强劲的增长——使用Gemini应用中2.5Pro模型的用户量提升了45%。
“所有这些进展都表明,我们正在步入AI平台变革的新阶段。”基于此,SundarPichai对未来充满期待:“数十年的研究成果正在加速变为现实,将服务于全球的每一位用户。”
“从研究变为现实”,三大项目已融入谷歌产品
围绕“从研究变为现实”这个话题,SundarPichai整体介绍了三个正从研究走向现实、并已融入谷歌产品中的项目案例:ProjectStarline、ProjectAstra以及ProjectMarina。
(1)ProjectStarline升级为GoogleBeam,语音翻译功能也即将登陆GoogleMeet
(2)ProjectAstra落地为GeminiLive,AI助理能力更进一步
在此前的I/O大会上,谷歌还曾展示过一个特别的研究项目:ProjectAstra。它的目标是探索下一代通用AI助理的可能性,让AI能够理解用户所处的真实环境,成为一个真正智能的“贴身助手”——如今,这项技术已经实装到了GeminiLive中。
(3)ProjectMariner进化为AgentMode,Agent开始能“动手做事”了
从谷歌的视角来看,Agent就是一个具备高级AI智能、并能调用各种工具、替你执行任务、但由你掌控的系统——ProjectMariner就是这类AIAgent的初步尝试。
去年12月,谷歌以研究原型的形式首次发布了ProjectMariner,当时它已具备一定的“计算机使用”能力,能主动上网、查信息、执行操作,真正帮你把事办好。而现在,ProjectMariner再度迭代,支持多任务处理,并引入了一种新的方式“teachandrepeat”——顾名思义:用户只需教它完成一次任务,它就能举一反三,自动学会类似操作。
然而,正如SundarPichai所说,让AI真正进入现实生活的最佳方式,是让它“有用于你的现实生活”,这就需要个性化能力的加持。为此,他透露道谷歌正着手打造一个名为“个性化上下文(personalcontext)”的功能:在用户许可下,Gemini模型可以读取用户在谷歌应用中的相关上下文信息,以完全私密、透明的方式进行分析和辅助。
举个例子,通过“个性化上下文(personalcontext)”功能,可进一步优化Gmail中的AI智能回复(SmartReply)功能:Gemini会结合用户过去邮件中的写作习惯,包括打招呼的方式、语气、用词风格,甚至是常用词汇,自动生成一封“就像你自己写的”邮件。
变得“更好”的系列模型
紧随其后,谷歌DeepMind团队负责人DemisHassabis在本次I/O大会上带来了系列大模型的最新进展。
“是我们迄今为止最智能的模型,也是当前世界上最强大的基础模型。”DemisHassabis提到,最新版不仅在学术基准测试中性能卓越,更是荣登WebDevArena和LMArena排行榜全球领先位置,在辅助学习方面也有着出色表现。
为了进一步提升用户体验,系列模型还迎来了一系列新功能升级:
●原生音频输出功能,不仅能检测用户声音中的情感,还可以忽略背景对话并主动回应,给用户带来更自然的对话感受;
●更高等级的安全防护,为用户数据安全保驾护航;
●ProjectMariner的计算机使用功能,拓展了产品应用场景。
此外,还将借助DeepThink这一实验性增强推理模式,在高度复杂的数学和编程领域实现进一步突破。据谷歌介绍,处于DeepThink模式下的,在面向竞赛级编程的难度基准LiveCodeBench中处于领先地位,同时在测试多模态推理的MMMU中也取得了84.0%的高分。
在开发者生态建设上,谷歌同样不遗余力:于GeminiAPI和VertexAI中引入模型推理摘要,大幅提升透明度;将模型推理预算扩展至2.5Pro,赋予开发者更多控制权;在GeminiAPI和SDK中添加对MCP工具的支持,方便开发者访问更多开源工具,全方位优化开发者体验。
不仅如此,谷歌还宣布其“最高效的主力模型,专为速度和低成本而设计”的轻量级AI模型也将在6月初提供常规可用版本。相较于前代,在推理、多模态、代码和长上下文的关键基准测试中都得到了改进,同时效率也更高,在谷歌评估中使用的token令牌数量还减少了20-30%。
(3)智能Agent,可自动处理繁琐任务:将ProjectMariner的Agent功能引入AI模式,帮助用户节省购买门票等任务的时间,同时确保其控制权。
(4)智能购物,支持个性化选购与自动下单:用户上传个人照片,即可拟虚试穿数十亿件服装商品,直观查看穿搭效果;选定商品后,AI也可以根据用户设置的条件(如价格、库存)自动完成购买流程。
其次在图像生成领域,最新的Imagen4模型支持2K分辨率及多比例构图,能细腻刻画复杂细节,文字拼写和排版准确性显著提升,适用于贺卡、海报等设计。该模型已接入Gemini应用、Whisk、VertexAI及Workspace套件,同时谷歌还预告,即将推出速度比Imagen3快10倍的Imagen4快速版本。
然后是音乐创作领域,Lyria2于4月已通过MusicAISandbox向音乐人开放,如今用户可通过YouTubeShorts和VertexAI企业版使用,其实时音乐生成模型LyriaRealTime也已接入API和AIStudio,支持交互式音乐创作与表演。
谷歌推出最强AI“全家桶”:GoogleAIUltra来了,每月249.99美元
GoogleAIUltra是谷歌目前功能最强大的AI订阅计划,月费为249.99美元(约人民币1804元),首三个月享有五折优惠,可提供最高使用额度、最早体验先进模型如Veo3、模式、最高额度的Flow、专属AgentMode、YouTubePremium以及30TB云存储空间。
而对于预算有限的用户,谷歌也提供了每月19.99美元(约人民币144元)的GoogleAIPro计划(原AIPremium计划),订阅后用户可使用基础模式的,以及基于Veo2模型的Flow,并提前访问Chrome中的Gemini功能(美国优先,其他地区后续跟进)。
首款AndroidXR设备即将问世
在发布会最后,谷歌带来了AndroidXR的最新进展。AndroidXR是谷歌专为扩展现实(XR)设备设计的操作系统,支持增强现实(AR)、虚拟现实(VR)和混合现实(MR)技术,整合了GeminiAI技术,能根据用户的视角提供实时帮助,如导航、翻译和信息摘要。
此外,谷歌还与三星合作开发了ProjectMoohan头戴设备,也预计将于2025年晚些时候发布。该设备将提供更沉浸式的XR体验,适用于游戏和专业应用。
📢2025全球产品经理大会
2025年8月15–16日
北京·威斯汀酒店
2025全球产品经理大会将汇聚互联网大厂、AI创业公司、ToB/ToC实战一线的产品人,围绕产品设计、用户体验、增长运营、智能落地等核心议题,展开12大专题分享,洞察趋势、拆解路径、对话未来。