当前位置:首页 > 元宇宙 > 元宇宙

AI绘画的下一站:“AI拍电影” 问世

来源: 责编: 时间:2023-08-11 16:53:39 271观看
导读 当大家还在惊叹和沉浸于AI文本转图像产出的精妙画作的时候,一些闷声做大事的团队已经在人工智能研究上迈向了一个新的领域—文本转视频 9月29日,扎克伯格在facebook上发布了一条关于Make-A-Video人工

当大家还在惊叹和沉浸于AI文本转图像产出的精妙画作的时候,一些闷声做大事的团队已经在人工智能研究上迈向了一个新的领域—文本转视频AZ828资讯网——每日最新资讯28at.com

 AZ828资讯网——每日最新资讯28at.com

9月29日,扎克伯格在facebook上发布了一条关于Make-A-Video人工智能系统的帖子,并附上了一段20s的视频,视频中汇总了Make-A-Video系统通过文本生成视频的一些片段。给Make-A-Video一个文本描述,它就可以为您创建一段视频。AZ828资讯网——每日最新资讯28at.com

 AZ828资讯网——每日最新资讯28at.com

AZ828资讯网——每日最新资讯28at.com

自文本转图像AI技术发布以来,也才过了几个月,人工智能技术就发展成将静态图直接飞升成动态视频了,一句话就能生成视频,不得不说近两年AI发展的速度有点近乎疯狂。AZ828资讯网——每日最新资讯28at.com

不过在Meta发布之后仅一周,谷歌就紧随其后发布了他们在人工智能领域的最新成果Imagen Video和Phenaki两种模型,前者可以生成1280*768分辨率,24帧/秒的高清视频,后者可以将一系列的文本提示生成连贯的长视频。这么看Meta的Make-A-Video还是逊色一点。AZ828资讯网——每日最新资讯28at.com

AZ828资讯网——每日最新资讯28at.com

其实文本生成视频技术并不是什么新鲜事儿,早在今年的6月份,清华&智源研究院就自研了“一句话生成视频”的模型CogVideo,并且将这一模型在gitub上开源了(刚发布不久立马就出圈了)AZ828资讯网——每日最新资讯28at.com

下面我们就一起来了解下这三个团队各自的模型到底如何吧。AZ828资讯网——每日最新资讯28at.com

01

CogVideoAZ828资讯网——每日最新资讯28at.com

CogVideo可以生成分辨率为480*480(画质有点渣),4秒(帧数32张)左右的视频,而且在生成真实的对象,以及内容一致性和运动真实性方面的表现相较于当时的其他视频生成AI模型来说都要更好,从下图的我们不难看出这一点,生成的实际人物相关的视频看上去都比较自然和流畅。AZ828资讯网——每日最新资讯28at.com

AZ828资讯网——每日最新资讯28at.com

(团队用CogVideo生成的视频片段)AZ828资讯网——每日最新资讯28at.com

AZ828资讯网——每日最新资讯28at.com

但是有些地方还是值得再探究下,比如这个狮子正在喝水的视频,CogVideo是直接给狮子加上了一双手,这和我们的常规认知是背道而驰的,仿佛只是把人的手拿水喝这个动作和狮子做了一个拼接。不过在Meta的Make-A-Video生成的视频中也存在类似的情况。AZ828资讯网——每日最新资讯28at.com

那接下来我们就看看Make-A-Video的表现吧!AZ828资讯网——每日最新资讯28at.com

02

Make-A-VideoAZ828资讯网——每日最新资讯28at.com

Make-A-Video目前已经实现了下面三个功能AZ828资讯网——每日最新资讯28at.com

  • 文字转视频AZ828资讯网——每日最新资讯28at.com

  • 图片转视频(将一张图片变为动态视频或者将两张图片合成为一个视频)AZ828资讯网——每日最新资讯28at.com

  • 通过原始视频生成视频的变体AZ828资讯网——每日最新资讯28at.com

Meta的官网上也给出了一些的案例。AZ828资讯网——每日最新资讯28at.com

AZ828资讯网——每日最新资讯28at.com

(由于案例较多,其余案例信息请前往:https://makeavideo.studio/)AZ828资讯网——每日最新资讯28at.com

目前Make-A-Video生成的视频画质看起来有点粗糙,且视频呈现的动作样貌也还不够自然协调,不过相比CogVideo,Make-A-Video提供了更多样的生成视频的玩法,而且生成出的视频想象力也更丰富。AZ828资讯网——每日最新资讯28at.com

03

Imagen Video & PhenakiAZ828资讯网——每日最新资讯28at.com

首先值得一提的是Imagen Video的清晰度,相比前两个系统生成的视频有了非常大的提升,目前支持生成1280*768分辨率,24帧/秒的视频,下面是官网放出的视频案例效果片段。AZ828资讯网——每日最新资讯28at.com

AZ828资讯网——每日最新资讯28at.com

(更多案例请前往 https://imagen.research.google/video/ )AZ828资讯网——每日最新资讯28at.com

Imagen Video不仅能生成高清视频,而且具有高度的可控性,能理解并生成不同艺术风格的作品。AZ828资讯网——每日最新资讯28at.com

AZ828资讯网——每日最新资讯28at.com

甚至还能理解3D结构AZ828资讯网——每日最新资讯28at.com

AZ828资讯网——每日最新资讯28at.com

最重要的是 Imagen Video 能够生成各种不同风格的文本动画AZ828资讯网——每日最新资讯28at.com

AZ828资讯网——每日最新资讯28at.com

不过目前谷歌方面表示不会发布 Imagen Video 模型或其源代码,以避免存在模型可能被滥用于制造虚假、仇恨、露骨或有害的内容。AZ828资讯网——每日最新资讯28at.com

通过官网和论文公布的信息可以了解到Phenaki目前可以做到AZ828资讯网——每日最新资讯28at.com

1. 通过不同的描述切换生成的视频风格或切换场景,生成连贯多样化的视频AZ828资讯网——每日最新资讯28at.com

AZ828资讯网——每日最新资讯28at.com

2. 给一个静态的图像作为第一帧+一段文本描述就可以生成一个视频AZ828资讯网——每日最新资讯28at.com

AZ828资讯网——每日最新资讯28at.com

3. 通过一连串的文字描述描述生成2分钟以上的长视频(视频案例请移步Phenaki官网查看:https://phenaki.github.io/#interactive)AZ828资讯网——每日最新资讯28at.com

AZ828资讯网——每日最新资讯28at.com

而且生成的视频还具备故事情节。这样的话,那未来是不是人人都可以通过文本创建视频,就不需要拍摄和剪辑了(惊讶!!!)如果真的能实现,那可能会给视频行业带来翻天覆地的变化。目前Meta和Google团队都暂未提供线上试用入口,有感兴趣的朋友可以去尝试用下CogVideo在线网页看看文字转视频的效果(可点击原文链接跳转):AZ828资讯网——每日最新资讯28at.com

网址:https://huggingface.co/spaces/THUDM/CogVideoAZ828资讯网——每日最新资讯28at.com

文字转视频的AI技术在短短的几个月内就已经取得了巨大的进展,似乎每天都有新的突破,难以想象再过几个月这个技术是不是又会迈向了一个新的阶层,一起拭目以待吧!AZ828资讯网——每日最新资讯28at.com

更多最新资讯和业内领先方案分析关注九日论道哟。也欢迎大家加入我们的知识星球,星球也正在做第二年的续费哈。AZ828资讯网——每日最新资讯28at.com

本文链接://www.dmpip.com//www.dmpip.com/showinfo-40-498-0.htmlAI绘画的下一站:“AI拍电影” 问世

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 中美科技巨头死磕元宇宙

下一篇: 中青宝推出元宇宙婚礼,这么好的题材又玩砸了

标签:
  • 热门焦点
  • 新周期,谁在坚守窄门?

    新周期,谁在坚守窄门?

    来源:锦缎今日的投资者恐怕已经忘记了,在OpenAI创造出ChatGPT这一杀器的前夜,生成式AI也曾经是一道窄门,窄到连马斯克都差点失去了信心。在当时的舆论眼中,AGI的道路不够性感,不够
  • 游戏玩家才是最“元宇宙”的

    游戏玩家才是最“元宇宙”的

    01元宇宙的概念,最早由科幻作家尼尔·斯蒂芬森于1992年在其著作《雪崩》中提出。它指的是一个脱胎于现实世界,又与现实世界平行、相互影响,并且始终在线的虚拟世
  • 从NFT顶级公链到Web3.0基础设施:带你了解不一样的Flow

    从NFT顶级公链到Web3.0基础设施:带你了解不一样的Flow

    对于大部分年轻人来说,刚刚过去的春节有一个词语突然成为了品牌宣传的流行语,作为从NFT中衍生出来的“数字藏品”一时间获得了不少品牌青睐,他们纷纷推出自己的数
  • 影响元宇宙土地价格的五个因素

    影响元宇宙土地价格的五个因素

    参考来源 | cryptonews编译 | Ciel@iNFTnews.com元宇宙中的房地产价格主要取决于使用它的人数,以及为所有者创造收益的能力。专注于数字资产的投资公司LedgerPr
  • Shiba Inu布局元宇宙 走出Meme局限

    Shiba Inu布局元宇宙 走出Meme局限

    以「狗狗币杀手」成名的Shiba Inu(SHIB)在人们的印象中始终有着浓厚的Meme(模因恶搞)烙印,但它似乎一直在尝试突破这种局限。建立起一个庞大的粉丝社区后,Shiba Inu
  • DAO登上了历史舞台,但是主流准备好采用DAO了吗?

    DAO登上了历史舞台,但是主流准备好采用DAO了吗?

    Block-807DAO要么是定义虚拟未来、无领导组织的革命性概念,要么是充满存在主义和自我毁灭挑战的反乌托邦结构,取决于你在与谁交谈。近几个月来, DAO已经从Crypto
  • 与元宇宙美少女艺术家的对话

    与元宇宙美少女艺术家的对话

    我最近宣布了我自己的NFT项目,这是我已经工作了几个月的事情。由于我之前只是一个收藏家,拥有自己的项目真的给了我一个新的视角来看待这个领域。我一直欢迎人们
  • NFT行业的三大区块链之一引起了Snoop Dogg的强烈兴趣,究竟有何潜力?

    NFT行业的三大区块链之一引起了Snoop Dogg的强烈兴趣,究竟有何潜力?

    Block-810多个区块链吸引了希望创建单个NFT或整个集合的用户的注意。Tezos是其中因其低费用和低碳排放方式而备受赞誉的区块链,就连Snoop Dogg也希望通过公开他
  • 元宇宙平台会是上世纪末的互联网吗?

    元宇宙平台会是上世纪末的互联网吗?

    “元宇宙”火了好几个月,互联网大厂忙于布局,资本市场热烈追捧。然而很多人还是看不明白,更多的人觉得这是一场泡沫,一场骗局。一开始接触这个怪里怪气的名词,感觉
Top
Baidu
map