据量子位,在刚刚举办的Google I/O 2025大会上,谷歌给Gemini来了个大升级,使其正式转型为“AI操作系统”,涵盖语音、图像、视频、搜索、代码生成等多个应用场景。
以下是大会首日公布的重点内容:
1、摄像头对准物体,就能与Gemini沟通;
2、搭载最新的文生图模型Imagen4,文本更准、分辨率更高、出图更快;
3、视频配音模型Veo3,角色对白更真实了;
4、Deep Research深度研究功能,支持上传文件了,包括PDF和图片;
5、Canvas画布功能,现在能一句话生成APP并可视化了;
6、一句话生成作业题,考完直接出答案的那种;
7、通用Agent功能(即将推出),官方展示了Gemini自动浏览房源、做筛选、发送邮件等一连串操作。
二、Gemini 2.5模型升级:
Gemini 2.5 Pro引入“Deep Think”推理模式,提升了复杂问题处理能力;Gemini 2.5 Flash优化多模态效率,以更低算力完成任务;新增自然语音生成功能,支持情绪表达与主动交互。
三、谷歌搜索内置Gemini:
Chrome浏览器将集成Gemini,右上角点开即聊
四、Android XR与远程交互:
与Samsung、Xreal合作推出Android XR智能眼镜,具备导航、翻译、摄像等功能;Google Beam整合3D通信技术,提升远程、沉浸式交流体验。
大会第二天预期亮点:
谷歌预计将介绍Android Studio中集成的Gemini能力,发布Google Cloud与Vertex AI新功能;展示Gemini在Wear OS 6与Android Auto中的应用;探讨AI安全与隐私保护等内容。

Linux, PHP, C,C++,JavaScript,verilog 老师