前身为Facebook的Meta公司今天展示了一个人工智能系统的Demo,该系统使人们能够通过语音命令生成或导入虚拟世界中的事物。该公司认为这个被称为 "Builder Bot "的工具是一个 "探索性的概念",显示了人工智能在元宇宙中创造新世界的潜力。Meta公司首席执行官马克-扎克伯格在周三举行的Meta AI: Inside the Lab活动上,通过一个预先录制的演示视频展示了该原型。
该视频没有具体说明 Builder Bot 是否利用有限的人工模型库,或者人工智能是否真的在生成设计中发挥了作用。
在视频中,扎克伯格通过描述虚拟世界的各个部分来解释构建过程。他以提示开始,"让我们去一个公园"。然后机器人创建了一个有绿草和树木的公园的3D景观。扎克伯格接着说:"我们去海滩吧。"之后,机器人用一个新的沙子和水的景观取代了当前的背景地点。然后他说他想添加云彩,并指出一切都由人工智能生成。扎克伯格随后改变了云的景观,说他更希望有高积云,这是为了证明语音命令可以多么具体。
然后他指着水面上的一个特定区域说:"让我们在那里添加一个岛屿。"然后机器人就创建了一个。扎克伯格随后发出其他几个语音命令,如添加树木和野餐毯。他还添加了海鸥和鲸鱼的声音。他甚至添加了一个水翼船(扎克伯格对水翼船的热爱甚至成为互联网上的一个meme梗)。
在整个视频中,Builder Bot似乎在使用语音命令来创建3D物体,并将它们放到景观上。在宣布该原型的博文中,Meta公司称该工具将 "拓展元宇宙的创造力",但没有提供技术细节。
扎克伯格还表示:为这款语音机器人提供动力的是Meta公司的CAIRaoke(这是一种自我监督式学习型AI神经网络模型),专门服务于公司的AR/VR产品,它能理解和学习用户的声音,监控用户的眼球运动和理解用户的肢体语言。
这项技术如果成功,可能会对其他VR世界和平台产生影响。例如,游戏平台Roblox在最近几个月已经开始测试语音功能,它甚至提供了自己的开发者平台。想象一下,像这样的公司有一天可以采用Meta原型中展示的技术类型,以获得类似的世界建设体验,这就很有意思了。
然而,就其目前的形式而言,Builder Bot创造的世界在外观和功能方面相当简单。虽然一开始通过语音命令让物体出现可能很有趣,但它不是一个可扩展的方式来构建更复杂的3D环境功能。如果有的话,它可以成为一个有趣的儿童游乐场,作为创建虚拟世界的入门级体验。(但不幸的是,Meta已经证明它的虚拟环境对儿童来说可能不是一个安全的地方)。
Meta公司公布其原型的时候,该公司正在花费数十亿美元的资金用于元宇宙的建设。本月早些时候,Meta公司首次发布了其现实实验室部门的财务数据,并透露其去年的损失超过100亿美元。该公司表示,它预计今年的亏损只会越来越大,这表明Meta公司似乎有无穷无尽的资金用于建设元宇宙,并可能有相当多的时间在其他小公司之前完成。该公司对元宇宙的大力投资也表明,我们将看到更多旨在推进元宇宙的新技术Demo。
其实,业界也有不少AI项目已经展示了基于文本描述的图像生成技术,比如OpenAI 的 DALL-E、Nvidia 的 GauGAN2和VQGAN+CLIP,以及更易于访问的应用程序的Wombo Dream。但是这些著名的项目都是涉及创建没有交互组件的 2D 图像(有时生成出来的图像还非常超现实),尽管有一些研究人员还正在研究3D对象生成技术,但目前大家都做不到。
尽管真正的 "元宇宙 "可能还不存在,但在过去的一年里,扎克伯格和Meta经常使用这个流行词,甚至为其最近的公司品牌变化提供了动力。扎克伯格之前向投资者描述了元宇宙,“在这个虚拟环境中,你可以在数字空间中与人们一起存在。你可以把它看作是一个有形的互联网,你身处其中,而不仅仅是在看。”“你将能够创造微妙的世界,用你的声音与他人探索和分享经验”,扎克伯格在演讲中承诺。
Meta公司在今天的活动中还发布了其他一些消息,包括其人工智能驱动的聊天机器人、人工智能系统卡工具和通用语音翻译器的计划。该公司称,后者可以提供所有语言的即时语音翻译,包括那些主要是口语的语言,这将是对现有翻译系统的一个飞跃式提升。Meta公司指出,世界上20%的人口不讲目前翻译工具所涵盖的语言,它计划通过部署新的机器学习技术来克服这一问题。
最终这项技术能吸引多少人进入 Meta 的 Horizo“元宇宙”去体验不得而知。但一切未来可期吧!
本文链接://www.dmpip.com//www.dmpip.com/showinfo-40-196-0.html扎克伯格演示了一种“造物主”式的元宇宙语音机器人工具
声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com