你的位置:开云(中国)Kaiyun·官方网站 - 登录入口 > 新闻动态 > 欧洲杯体育而不是画面中的树、云等其他物体-开云(中国)Kaiyun·官方网站 - 登录入口

欧洲杯体育而不是画面中的树、云等其他物体-开云(中国)Kaiyun·官方网站 - 登录入口

时间:2025-05-23 08:07 点击:92 次

欧洲杯体育而不是画面中的树、云等其他物体-开云(中国)Kaiyun·官方网站 - 登录入口

欧洲杯体育

作家 | ZeR0

剪辑 | 漠影

智东西 12 月 5 日报谈,AGI 竞赛愈演愈烈!就在 OpenAI 晓谕将于畴昔 12 天直播新发布和 demo 前,昨夜,Google DeepMind 发布大型基础天下模子 Genie 2,能生成各式可狂放看成、可玩的 3D 环境,还不错用于磨练和评估具身 agent。

只好给一张教唆图像,Genie 2 就能按照你输入的文本教唆,生成对应的交互式造谣天下。不管是东谈主类如故 AI agent,齐不错使用键盘和鼠标来在由 AI 生成的 3D 游戏天下里探索和互动。

Genie 2 是一个自记挂潜在扩散模子,磨练于大型视频数据集。经由自动编码器后,视频中的潜在帧被传递到大型 Transformer 能源学模子。该模子使用与大言语模子访佛的因果掩码进行磨练。

在推理时,Genie 2 能以自记挂模式进行采样,逐帧得回单个看成和往时的潜在帧。Google DeepMind 使用 CFG(无分类器指导,classifier-free guidance)来提升看成可控性。

博客著述放出大宗由未蒸馏的基础模子生成的视频示例,来展示 Genie 2 在行径狂放、生成反设事实、长视界牵挂、长视频生成、千般环境、3D 结构、物体交互、复杂变装动画、NPC、物理、烟雾、光影、快速原型盘算方面的遵循与上风。蒸馏版块支撑及时交互,但运行时的视觉质地会镌汰些。

输入果真天下的相片后,它也能很好模拟一些物理限定,比如可模拟风中摇曳的草或河中流动的水。

一、超强空间牵挂本领,模拟果真天下环境

此前天下模子在很猛进程上局限于建模窄小的限度。Genie 1 引入了一种生成各式 2D 天下的身手。Genie 2 则进一步在通用性上取得阐明,不错生成种类众多的丰富 3D 天下。

以下是与 Genie 2 互动的一些示例视频。模子会使用文生图模子 Imagen 3 生成的单个图像,按照教唆词生成一个可交互的 3D 天下。东谈主或 agent 进行键鼠操作,进入这个新创建的天下并与之互动。Genie 2 不错生成长达 1 分钟的一致天下,大多数示例握续 10-20 秒(本文将部分视频示例转成 gif 动图并只截取片断,无缺视频请到原博客著述寻查)。

1、智能反应键盘按键操作

Genie 2 不错智能地反应键盘上的按键操作,正确地识别并出动变装。比如下图中的几个示例,模子必须能弄泄露标的按键对应要出动的是机器东谈主,而不是画面中的树、云等其他物体。

树林里的一个可儿的东谈主形机器东谈主。

古埃及的东谈主形机器东谈主。

紫色星球上的机器东谈主的第一视角。

大城市阁楼公寓中的机器东谈主的第一视角。

2、生成反设事实

Genie 2 不错从归拢肇始帧生成不同的轨迹,为磨练 agent 模拟不共事实的体验。在每一瞥中,每个视频齐从归拢帧启动,但东谈主类玩家给与的看成不同,生成的画面骨子也反应不同。

3、长视界牵挂

Genie 2 不详记着视线中不再存在的天下部分,并在它们再次可见时准确呈现。

4、使用重生成的骨子生成长视频

Genie 2 可动态生成新的合理骨子,并在长达 1 分钟的工夫内保管一致的天下。

5、千般化环境

Genie 2 可创建不同的视角,举例第一视角、等距视图或第三视角驾驶视频。

6、3D 结构

Genie 2 会创建复杂的 3D 视觉场景。

7、模拟对象相互作用

Genie 2 能模拟各式物体的相互作用,举例爆破气球、大开门和射击火药桶。

8、变装动画

Genie 2 学习了怎么为不同类型的变装制作动画来引申不同的行径。

9、NPC

Genie 2 不详模拟其他 agent,致使与它们进行复杂的交互。

10、物理

Genie 2 模拟水遵循。

11、烟雾

Genie 2 模拟烟雾遵循。

12、重力

Genie 2 模拟重力。

13、灯光

Genie 2 模拟光点和定向照明。

14、反射

Genie 2 模拟反射、喷雾减光和彩色灯光。

二、清楚物理天下相反,可将主见图转动成交互式环境

Genie 2 模子可快速创建各式交互体验的原型。举例用 Imagen 3 生成不同图像,让 Genie 2 生成模拟纸飞机、龙、鹰、降落伞遨游的视频。不错看到 Genie 2 生成的视频不详清楚并模拟出它们遨游的相反。

主见艺术和画图也不错被 Genie 2 转动周密齐交互式环境,以便艺术家、盘算师能快速制作商榷环境主见的原型。

三、AI agent 也能玩,为具身智能提供绝佳磨练场

Genie 2 可快速为 AI agent 创建丰富千般的环境,从而生成 agent 在磨练工夫未见过的评估任务。

举例,Google DeepMind 与游戏建树商配合建树了 SIMA agent。SIMA agent 被盘算成通过盲从当然言语指示来完成一系列 3D 游戏天下中的任务,因此不错在 Genie 2 合成的、未见过的环境引申指示。

输入底下 Imagen 3 生成的第三通达天下探索游戏图,Genie 2 可生成一个带有两扇门(一扇是红门,一扇是蓝门)的 3D 环境。

然后向 SIMA agent 忽视大开某扇门的指示,Genie 2 则能生成稳妥条件的画面。

在这个示例中,SIMA 通过键盘和鼠标输入狂放变装,而 Genie 2 生成游戏帧。

也不错使用 SIMA 来匡助评估 Genie 2 的功能。通过指导 SIMA 环视四周、探索房屋背面等,测试 Genie 2 生成一致环境的本领。

再比如凭据底下这张图来生成视频。

输入不同教唆词"上楼"、"去有植物的方位"、"走中间门",Genie 2 会生成对应的不同视频画面。

固然这项商榷仍处于早期阶段,agent 和环境生成本领齐还有很大的更动空间,但 Google DeepMind 确信 Genie 2 是处步骤全磨练具体 agent 的结构性问题的阶梯,同期驱散迈向 AGI 所需的广度和通用性。

结语:天下模子,AI 限度的下一件大事

游戏是安全测试和股东 AI 本领的理念念环境。磨练更通器用身 agent 的传统瓶颈在于穷乏填塞丰富和千般化的磨练环境。

Google DeepMind 正将越来越多资源进入于天下模子商榷。Genie 2 展示了基础天下模子在创建千般化 3D 环境、定制交互式游戏场景、加快 agent 商榷等方面的后劲,可让畴昔的 Agent 在无穷的新天下中经受磨练和评估。

该商榷标的尚处于早期阶段,Google DeepMind 策动在通用性和一致性方面不时更动 Genie 的天下生成本领。

与 SIMA 通常,其商榷戮力于构建更通用的 AI 系统和 agent,使其不详清楚和安全地引申各式任务,从而匡助在线和践诺天下中的东谈主们。

Google DeepMind 还放了一些道理的"彩蛋":Genie 2 生成出一些奇怪视频,比如莫得给与行径的情况下一个幽灵出现时花圃,在雪场的东谈主物变装比较滑雪更爱跑酷、一个魔法球把周遭炸成灰。

起头:Google DeepMind欧洲杯体育

【太平洋科技快讯】12月11日,型号为OPPO“PKG110”的一加Ace 5手机已通过UFCS交融快充契约认证,展望为。新机电板额定容量为6285mAh欧洲杯体育,取舍Type-C接口输入,为用户带来更快的充电体验。 就了解,UFCS交融快充契约由信通院、、vivo、小米、OPPO等企业连合鼓吹,旨在融合快充尺度,处罚市面上快充尺度复杂、互不兼容的问题,同期提高用户体验,助力节能环保。 一加Ace 5尺度版已曝光确立信息: 屏幕:2D 6.78英寸1.5K BOE X2 8T LTPO纯直屏
财联社12月11日电,iPhone SE 4据悉将在来岁3月份傍边认真发布,新机或为SE系列带来一次要紧的升级。新机将经受刘海屏缠绵,引入了Face ID,取消带有Touch ID的Home键,但莫得灵动岛功能。据古尔曼显现,苹果缠绵了一款代号为Sinope的新调制解调器,与自家的其他组件无缝整合。这一缠绵不仅量入为用空间,还不错缩小电耗。与当今苹果正在使用的调制解调器比拟,Sinope仍有较大差距,联系芯片性能逊于高通,举例Sinope仅相沿Sub-6 GHz 5G频段,不相沿(mmWave
时代来到12月份,对于Galaxy S25系列手机的新品爆料也越来越多了。 最新爆料炫耀,三星瞻望将于来岁1月22日举办Unpacked主题活动,带来S25、S25 + 和 S25 Ultra 三款新机,甚而可能推出S25 Slim。 此外,还有传说称三星将在活动上展示其全新的XR智能眼镜。 其中,三星 Galaxy S25 Ultra升级幅度较大、爆料信息也较多。 皆集渲染图片来看,该机将提供钛银、钛蓝、钛黑和钛金四种模样;去掉了屏幕外部的金属边框想象,R角变得愈加动听,中框瞻望会被收窄,有
本站讯息,凭据12315耗尽者投诉信息公示平台数据,益客食物新增3件耗尽者投诉公示,笃定如下: 被投诉企业:江苏益客食物集团股份有限公司投诉基本信息:2024年12月06日,耗尽者孙**(手机尾号 2129,用户ID ****9951)反馈其于2024年12月06日通过现场购买其他商品。投诉问题:可能存在其他投诉问题,条款罢手侵权、审定侵权包袱,补偿赔本,退赔用度。处理服从:2024年12月12日,未已毕妥洽条约处理部门:宿迁市宿豫区市集监督管理局被投诉企业:江苏益客食物集团股份有限公司投诉基
本站音问,凭据12315陡然者投诉信息公示平台数据,三诺生物新增10件陡然者投诉公示,确定如下: 被投诉企业:三诺生物传感股份有限公司投诉基本信息:2024年11月23日,陡然者覃**(手机尾号 9198,用户ID ****4299)反馈其于2024年11月23日通过现场购买体外会诊试剂。投诉问题:可能存在历练检测问题,条件退货,补偿蚀本。处理着力:2024年12月12日,两边自行息争大约投诉东谈主撤除投诉处理部门:长沙市高新市集监督搞定局被投诉企业:三诺生物传感股份有限公司投诉基本信息:20
本站音问,凭据12315耗尽者投诉信息公示平台数据,厦门国贸新增1件耗尽者投诉公示开yun体育网,细目如下: 被投诉企业:厦门国贸集团股份有限公司投诉基本信息:2024年12月05日,耗尽者杨**(手机尾号 7211,用户ID ****5223)反馈其于2024年12月05日通过现场购买粗拙乘用车。投诉问题:可能存在合同->盘算者拒不持行合同商定问题,条目住手侵权、审定侵权拖累。处理效果:2024年12月12日,未收场协调条约处理部门:厦门市湖里区商场监督经管局 注:投诉基本信息、投诉问题为当
在上海浦东海外机场,海关使命主谈主员近日发现了所有这个词惊东谈主的入境事件:别称游客陈述的电水壶箱子中竟藏有979只活体小动物。这一突发情况引起了使命主谈主员的高度警醒,速即对该箱子进行了防备查验,结束让东谈主胆怯——这些小动物被好像为“热烈获利蚁”,这种外来物种在我国并不存在。 外来物种的入侵对生态环境的危害恣虐小觑。历史上,好多外来物种如水花生、一枝黄花、紫茎泽兰等王人曾酿成严重的生态难过。一朝这些物种在新的环境中衍生起来,它们不仅会影响当地动植物的生计,还可能对东谈主类自己组成要挟。网友
为真切学习贯彻习近平法治想想,进一步增强全民法治不雅念和风险小心意志,近日,瑞众保障自贡中心支公司在龙城海外社区开展了以“放弃发达宪法精神 鼓励进一步全面深化变嫌”为宣传主题的“宪法宣传周”四肢。 四肢中,瑞众保障自贡中支职责主说念主员向社区住户披发宣传贵府,详备进修国度宪法日及宪法宣传周的由来和宪法相干知识,并匡助行家进一步了解《破费者权利保护法》《未成年东说念主保护法》《婚配法》《老年东说念主权利保障法》等与寰宇生涯密切相干的法律知识。 同期职责主说念主员通过近期典型的犯罪集资案例和拐骗案

官网:
www.czrtbz.com

地址:
新闻动态科技园5556号

Powered by 开云(中国)Kaiyun·官方网站 - 登录入口 RSS地图 HTML地图


开云(中国)Kaiyun·官方网站 - 登录入口-欧洲杯体育而不是画面中的树、云等其他物体-开云(中国)Kaiyun·官方网站 - 登录入口