2024 Google I/O 发布会汇总

币圈资讯 阅读:29 2024-05-15 19:51:36 评论:0
美化布局示例

欧易(OKX)最新版本

【遇到注册下载问题请加文章最下面的客服微信】永久享受返佣20%手续费!

APP下载   全球官网 大陆官网

币安(Binance)最新版本

币安交易所app【遇到注册下载问题请加文章最下面的客服微信】永久享受返佣20%手续费!

APP下载   官网地址

火币HTX最新版本

火币老牌交易所【遇到注册下载问题请加文章最下面的客服微信】永久享受返佣20%手续费!

APP下载   官网地址
0.png"/>

最后,谷歌称,他们正在开发一个名为 Gemini Live 的新应用,这是一个集成了最新 Gemini 技术的直播视频平台。从百万级六秒钟短视频中选择一系列关键信息,Gemini 可以从 Gmail 电子邮件、Google Keep 笔记或了解 Excel 表格中的信息,用最少手动努力将其传递给观众。


Finally, Google said that they are developing a new application called, which is a live video platform integrating the latest technology. A series of key information can be selected from a million-level six-second short video, which can be delivered to the audience with minimal manual efforts from email notes or information in the table. 比特币今日价格行情网_okx交易所app_永续合约_比特币怎么买卖交易_虚拟币交易所平台

2. 新的 Android 版本')>

来源:有新Newin

5 月 15 日凌晨,Google I/O 开发者大会正式召开,以下是长达 2 小时发布会内容总结:

1. 关于 Gemini

1)Gmail 中的 Gemini

Gmail 用户将能够使用 Gemini AI 技术搜索、总结和起草电子邮件。它还能够对电子邮件采取行动以执行更复杂的任务,例如通过搜索收件箱、查找收据和填写在线表格来帮助你处理电商退货。

2)Gemini 1.5 Pro & Flash

另一个升级是 Gemini 现在可以分析比以前更长的文档、代码库、视频和音频记录。谷歌目前的旗舰机型 Gemini 1.5 Pro 新版本的私人预览中,据透露,它最多可以容纳 200 万 token。这是之前的两倍,新版 Gemini 1.5 Pro支持所有商用型号中最大的输入。

对于要求较低的应用,谷歌推出了公共预览版 Gemini 1.5 Flash,这是 Gemini 1.5 Pro 的“精炼”版本,是专为“窄”、“高频”生成 AI 工作负载而构建的小型高效模型。Flash 拥有多达 200 万个 token 上下文窗口,与 Gemini 1.5 Pro 一样是多模式的,这意味着它可以分析音频、视频和图像以及文本。

此外,超过 150 个国家/地区和超过 35 种语言的 Gemini Advanced 用户可以利用 Gemini 1.5 Pro 的更大上下文,让聊天机器人分析、总结和回答有关长文档(最多 1,500 页)的问题。 

Gemini Advanced 用户可以从今天开始与 Gemini 1.5 Pro 进行交互,还可以从 Google Drive 导入文档或直接从移动设备上传文档。

在接下来的几个月中,Gemini Advanced 将获得一种新的“规划体验”,可以根据提示创建自定义旅行行程。考虑到飞行时间(来自用户 Gmail 收件箱中的电子邮件)、膳食偏好和当地景点信息(来自 Google 搜索和地图数据)以及这些景点之间的距禀。Gemini 将生成自动更新的行程以反映任何变化。 

在不久的将来,Gemini Advanced 用户将能够创建 Gems,这是由 Google Gemini 模型提供支持的自定义聊天机器人。沿着 OpenAI 的 GPT 的思路,Gems 可以从自然语言描述生成 - 例如,“你是我的跑步教练。给我一个每日跑步计划”——并与他人分享或保密。

很快,Gems 和 Gemini 将能够利用与 Google 服务的扩展集成,包括 Google 日历、任务、Keep 和 YouTube Music,以完成各种省力任务。

3)Gemini Live

最后,谷歌称,他们正在开发一个名为 Gemini Live 的新应用,这是一个集成了最新 Gemini 技术的直播视频平台。从百万级六秒钟短视频中选择一系列关键信息,Gemini 可以从 Gmail 电子邮件、Google Keep 笔记或了解 Excel 表格中的信息,用最少手动努力将其传递给观众。

2. 新的 Android 版本')```html 谷歌发布Gemini Live、Gemini Nano和Android上的Gemini

谷歌发布Gemini Live、Gemini Nano和Android上的Gemini

谷歌预览了Gemini中名为Gemini Live的新体验,它可以让用户在智能手机上与Gemini进行“深入”的语音聊天。

用户可以在聊天机器人说话时打断Gemini,提出澄清问题,它会实时适应他们的语音模式。Gemini可以通过智能手机摄像头拍摄的照片或视频来查看用户的周围环境并对其做出反应。

谷歌表示,它利用生成式AI新技术来提供卓越的、不易出错的图像分析,并将这些技术与增强的语音引擎相结合,以实现更一致、情感表达和现实的多轮对话。

从某种程度上来说,Gemini Live是Google Lens和Google Assistant的演变。

DeepMind首席科学家Oriol Vinyals表示,这是一个实时语音界面,具有极其强大的多模式功能和长上下文。

推动Live的技术创新部分源于Project Astra,这是DeepMind内部的一项新举措,旨在创建AI驱动的应用和智能体,以实现实时、多模式理解。

DeepMind CEO Demis Hassabis表示,谷歌一直希望打造一款在日常生活中有用的通用智能体,想象一下代理可以看到和听到我们所做的事情,更好地了解我们所处的环境并在对话中快速做出反应,从而使交互的速度和质量感觉更加自然。

Gemini Live直到今年晚些时候才会推出,它可以回答有关智能手机摄像头视野内(或最近视野内)事物的问题,例如用户可能位于哪个社区或损坏的自行车上的某个部件的名称。指向计算机代码的一部分,Live可以解释该代码的作用。或者,当被问及一副眼镜可能在哪里时,Live可以说出它最后一次“看到”眼镜的位置。

Live还被设计为某种虚拟教练,帮助用户排练活动、集思广益等。例如,Live可以建议在即将到来的工作或实习面试中强调哪些技能,或者提供公开演讲建议。

新的ChatGPT和Gemini Live之间的一个主要区别是Gemini Live不是免费的。一旦推出,Live将是Gemini Advanced的专属版本,Gemini Advanced是Gemini的更复杂版本,受Google One AI Premium Plan保护,价格为每月20美元。

4)Gemini Nano

谷歌还从Chrome 126开始,将最小的AI模型Gemini Nano直接构建到Chrome桌面客户端中。谷歌表示,这将使开发人员能够使用设备上的模型来支持自己的AI功能。例如,谷歌计划利用这一新功能来支持Gmail中Workspace Lab现有的“帮助我写作”工具等功能。

5)Android上的Gemini

谷歌在Android上的Gemini是Google Assistant的AI替代品,很快将利用其与Android移动操作系统和谷歌应用程序深度集成的能力。

用户将能够将AI生成的图像直接拖放到他们的Gmail、Google Messages和其他应用程序中。

谷歌表示,与此同时,YouTube用户将能够点击“询问此视频”,从该YouTube视频中查找特定信息。

购买升级版Gemini Advanced的用户还可以使用“询问此PDF”选项,让您无需阅读所有页面即可从文档中获得答案。Gemini Advanced订阅者每月支付19美元。

``````html 谷歌发布Gemini AI和Trillium TPU的新功能

现在,您只需支付99美元即可访问AI,并获得2TB存储空间以及其他Google One福利。

谷歌表示,Android版Gemini的最新功能将在未来几个月内推广到数亿受支持的设备。随着时间的推移,Gemini将不断发展,提供与屏幕上的内容相关的其他建议。

与此同时,Android设备上的基础模型Gemini Nano将升级以包含多模态。这意味着它将能够处理文本输入以及其他处理信息的方式,包括视觉、声音和口语。

6)谷歌地图上的Gemini

从Places API开始,Gemini模型功能将登陆Google地图平台供开发者使用。开发人员可以在自己的应用程序和网站中显示地点和区域的生成AI摘要。这些摘要是基于Gemini对Google地图社区超过3亿贡献者的见解分析而创建的。

这些摘要是基于Gemini对Google地图社区超过3亿贡献者的见解分析而创建的。借助这项新功能,开发人员将不再需要编写自己的自定义地点描述。

例如,如果开发人员有一个餐厅预订应用程序,这项新功能将帮助用户了解哪家餐厅最适合他们。当用户在应用程序中搜索餐厅时,他们将能够快速查看所有最重要的信息,例如餐厅特色菜、欢乐时光优惠和餐厅氛围。

新的摘要适用于多种类型的场所,包括餐馆、商店、超市、公园和电影院。谷歌还将AI驱动的上下文搜索结果引入Places API。当用户在开发者的产品中搜索地点时,开发者现在可以显示与其搜索相关的评论和照片。

7)TPU性能得到提升

谷歌推出了下一代——确切地说是第六代——TPU AI芯片。它们被称为Trillium,将于今年晚些时候推出。如果您还记得的话,宣布下一代TPU已成为I/O大会上的一项传统,尽管这些芯片仅在今年晚些时候推出。

与第五代相比,这些新型TPU的每芯片计算性能将提高4.7倍。Trillium具有第三代SparseCore,谷歌将其描述为“用于处理高级排名和推荐工作负载中常见的超大型嵌入的专用加速器。

Pichai将新芯片描述为谷歌迄今为止“最节能”的TPU,随着对AI芯片的需求持续呈指数级增长,这一点尤其重要。

他表示,过去六年,行业对ML计算的需求增长了100万倍,每年大约增长十倍,如果不投资降低这些芯片的功耗需求,这是不可持续的。谷歌承诺,新型TPU的能效比第五代芯片高67%。

此外,谷歌在Gemma 2中添加一个新的270亿参数模型。下一代谷歌Gemma模型将于6月推出。谷歌表示,这个尺寸经过Nvidia优化,可以在下一代GPU上运行,并且可以在单个TPU主机和顶点AI上高效运行。

2. 新模型&项目

1)Imagen3

``````html 谷歌推出多项AI新产品

谷歌推出多项AI新产品

1)Imagen 3模型

谷歌今日发布了Imagen模型的最新版本 —— Imagen 3。DeepMind首席执行官Demis Hassabis表示,相较于前身Imagen 2,Imagen 3能够更准确地理解翻译成图像的文本提示,并且比前几代产品更具创意和细致。

为了缓解人们对深度伪造的担忧,谷歌表示,Imagen 3将采用DeepMind开发的一种名为SynthID的方法,该方法能够将不可见的加密水印应用于媒体。

Google的ImageFX工具现已开放Imagen 3的私人预览版注册。谷歌表示,该模型将“很快”提供给使用谷歌企业生成式AI开发平台Vertex AI的开发人员和企业客户。

2)Veo视频生成模型

谷歌正在竞争OpenAI的Sora with Veo,这是一种AI模型,可以根据文本提示创建大约一分钟长的1080p视频剪辑。Veo可以捕捉不同的视觉和电影风格,包括风景和延时镜头,并对已生成的镜头进行编辑和调整。

它还建立在谷歌四月份预览的视频生成方面的初步商业工作的基础上,该工作利用该公司的Imagen 2系列图像生成模型来创建循环视频剪辑。

Demis Hassabis表示,谷歌正在探索故事板和生成更长场景等功能,以了解Veo的功能,谷歌在视频方面取得了令人难以置信的进步。

Veo接受了大量镜头的训练。这就是生成式AI模型的工作原理:输入某种形式数据的一个又一个示例,模型会拾取数据中的模式,使它们能够生成新数据——在Veo的例子中是视频。

然而,谷歌已经向选定的创作者提供了Veo,其中包括Donald Glover(又名Childish Gambino)和他的创意机构Gilga。

3)LearnLM模型

谷歌推出了LearnLM,这是一个针对学习进行“微调”的新生成AI模型系列。这是谷歌DeepMind AI研究部门和谷歌研究院之间的合作。谷歌表示,LearnLM模型旨在“对话式”辅导学生一系列科目。

LearnLM已经在Google的多个平台上可用,且正在通过Google Classroom的试点项目来使用LearnLM。谷歌表示,LearnLM可以帮助教师发现新的想法、内容和活动,或者找到适合特定学生群体需求的材料。

4)Project IDX

Project IDX是谷歌下一代、以AI为中心、基于浏览器的开发环境,现已进入公开测试阶段。

谷歌副总裁兼Developer X总经理兼负责人Jeanine Banks表示,随着AI变得越来越普遍,部署所有这些技术所带来的复杂性确实变得越来越困难、越来越大,谷歌希望帮助解决这一挑战。开发商关系,这就是构建Project IDX的原因。

IDX是一种多平台开发体验,可以让构建应用程序变得快速、轻松,你可以通过Next.

``` Google I/O 2022 大会:Google 推出 Project IDX 开发环境,表明 AI 将成为开发的主要驱动力

Google I/O 2022 大会:Google 推出 Project IDX 开发环境,表明 AI 将成为开发的主要驱动力

在 Google I/O 2022 大会上,Google 推出了 Project IDX 开发环境,这个开发环境是基于开源 Visual Studio Code 构建的,与 GitHub 集成,同时还支持与现有工作流程的集成。此外,Google 还将支持将应用程序部署到 Cloud Run,这是 Google Cloud 的无服务器平台,用于运行前端和后端服务。

Google 还宣布将把 Google Maps Platform 的集成添加到 IDE 中,帮助向应用程序添加地理定位功能,并与 Chrome 开发工具和 Lighthouse 集成以帮助调试应用程序。

此外,谷歌还将支持将应用程序部署到 Cloud Run,这是 Google Cloud 的无服务器平台,用于运行前端和后端服务。

此开发环境还将与 AI 驱动的合规平台 Checks 集成,该平台已从测试版转为正式版。通过 IDX,开发人员不仅可以构建支持 AI 的应用程序,还可以在编码过程中使用 AI。

为了实现 AI 驱动的编码过程,IDX 包括了许多标准功能,例如代码完成和聊天助手侧边栏,以及新颖功能,例如突出显示代码片段和类似于 Photoshop 中的生成填充功能,询问 Google 的 Gemini 模型更改代码片段。

此外,在 IDX 的最新版本中,Google 还在 IDE 中为移动开发人员添加了内置 iOS 和 Android 模拟器。

3. 应用&工具更新

1)AI 在搜索中的应用

谷歌搜索主管 Liz Reid 表示,谷歌为搜索构建了定制的 Gemini 模型,将实时信息、谷歌排名、长上下文和多模态特征结合在一起。

谷歌正在其搜索中添加更多 AI ,缓解了人们对该公司正在将市场份额输给 ChatGPT 和 Perplexity 等竞争对手的疑虑。

谷歌正在向美国用户推出 AI 驱动的概述。此外,该公司还希望使用 Gemini 作为旅行计划等事务的智能体。

谷歌计划使用生成式 AI 来组织某些搜索结果的整个搜索结果页面。这是对现有 AI 概述功能的补充,该功能会创建一个简短的片段,其中包含有关您正在搜索的主题的聚合信息。经过谷歌 AI 实验室计划的一段时间后, AI 概述功能将于周二全面开放。

自去年以来,谷歌一直在通过其搜索生成体验(SGE)测试 AI 驱动的概述。现在,它将于本周在美国向“数亿用户”推出,目标是在今年年底前向超过 10 亿人提供服务。

她还表示,在其 AI 概述功能的测试期间,谷歌观察到人们点击了更加多样化的网站。当传统搜索足以提供结果时,用户将看不到 AI 概述,该功能对于比较复杂、信息分散的查询更有用。

此外,谷歌还希望使用 Gemini 作为智能体 Agent 来完成膳食或旅行计划等任务。用户可以输入诸如“为四口之家计划三天的膳食”之类的查询,并获取这三天的链接和食谱。

2)圈选搜索

由 AI 驱动的“圈搜索”功能允许 Android 用户使用转圈等手势立即获得答案,现在将能够解决更复杂的心理学和数学应用题。

它的设计目的是让用户在手机上的任何地方都可以更自然地通过一些操作(例如圈选、突出显示、涂鸦或点击)来使用 Google 搜索。

3)在通话过程中检测诈骗

文字格式和图片示例

注册有任何问题请添加 微信:MVIP619 拉你进入群

弹窗与图片大小一致 文章转载注明 网址:https://netpsp.com/?id=64022

美化布局示例

欧易(OKX)最新版本

【遇到注册下载问题请加文章最下面的客服微信】永久享受返佣20%手续费!

APP下载   全球官网 大陆官网

币安(Binance)最新版本

币安交易所app【遇到注册下载问题请加文章最下面的客服微信】永久享受返佣20%手续费!

APP下载   官网地址

火币HTX最新版本

火币老牌交易所【遇到注册下载问题请加文章最下面的客服微信】永久享受返佣20%手续费!

APP下载   官网地址
可以去百度分享获取分享代码输入这里。
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

发表评论

平台列表
美化布局示例

欧易(OKX)

  全球官网 大陆官网

币安(Binance)

  官网

火币(HTX)

  官网

Gate.io

  官网

Bitget

  官网

deepcoin

  官网
关注我们

若遇到问题,加微信客服---清歌

搜索
排行榜
扫一扫,加我为微信好友加我为微信好友