首页 » 软件开发 » 免费开源的超长AI视频模型:一句话轻松制作120秒精彩视频(模型推理开源时间视频)

免费开源的超长AI视频模型:一句话轻松制作120秒精彩视频(模型推理开源时间视频)

萌界大人物 2024-07-24 02:18:20 0

扫一扫用手机浏览

文章目录 [+]

近日,由Picsart AI Research团队联合发布的StreamingT2V模型可生成长达2分钟(1200帧)的高质量视频,超越了之前的Sora模型。
这一开源模型不仅可以生成更长时长的视频,还能与SVD、animatediff等其他模型无缝兼容,为开源视频生成领域带来新的突破。

亮点总结:

生成时长达2分钟(1200帧),超越以往模型视频质量优秀与业内其他主流模型实现无缝衔接开源免费,便于开发者使用和二次开发

自己本地搭建教程:

免费开源的超长AI视频模型:一句话轻松制作120秒精彩视频(模型推理开源时间视频) 软件开发
(图片来自网络侵删)

1.安装并安装 Python 3.10 and CUDA >= 11.6 环境 【Python 3.10 】、【Cuda 下载】

2.克隆开源项目至本地:

git clone https://github.com/Picsart-AI-Research/StreamingT2V.git

cd StreamingT2V/

3.安装必备的环境:

conda create -n st2v python=3.10

conda activate st2v

pip install -r requirements.txt

4.(可选)如果您的系统上缺少 FFmpeg,请安装 FFmpeg

conda install conda-forge::ffmpeg

5. 从HF 下载模型权重并将它放在 t2v_enhanced/checkpoints目录下

6.文本转视频

cd t2v_enhanced

python inference.py --prompt="A cat running on the street"

如要使用其他基本模型,请添加--base_model=AnimateDiff参数。
用于python inference.py --help更多选项

7.图片转视频

cd t2v_enhanced

python inference.py --image=../__assets__/demo/fish.jpg --base_model=SV

推理时间ModelscopeT2V作为基础模型

帧数

更快预览的推理时间 (256×256)

最终结果的推理时间 (720×720)

24帧

40秒

165秒

56帧

75秒

360秒

80帧

110秒

525秒

240帧

340秒

1610 秒(约 27 分钟)

600帧

860秒

5128 秒(约 85 分钟)

1200帧

1710 秒(约 28 分钟)

10225 秒(约 170 分钟)

AnimateDiff作为基础模型

帧数

更快预览的推理时间 (256×256)

最终结果的推理时间 (720×720)

24帧

50秒

180秒

56帧

85秒

370秒

80帧

120秒

535秒

240帧

350秒

1620 秒(约 27 分钟)

600帧

870秒

5138 秒(~85 分钟)

1200帧

1720 秒(约 28 分钟)

10235 秒(约 170 分钟)

SVD作为基本模型

帧数

更快预览的推理时间 (256×256)

最终结果的推理时间 (720×720)

24帧

80秒

210秒

56帧

115秒

400秒

80帧

150秒

565秒

240帧

380秒

1650 秒(约 27 分钟)

600帧

900秒

5168 秒(~86 分钟)

1200帧

1750 秒(约 29 分钟)

10265 秒(~171 分钟)

所有测量均使用 NVIDIA A100 (80 GB) GPU 进行。
当帧数超过 80 时,采用随机混合。
对于随机混合,chunk_size和 的值overlap_size分别设置为 112 和 32。

标签:

相关文章

语言中的借用,文化交融的桥梁

自古以来,人类社会的交流与发展离不开语言的传播。在漫长的历史长河中,各民族、各地区之间的文化相互碰撞、交融,产生了许多独特的语言现...

软件开发 2025-01-01 阅读1 评论0

机顶盒协议,守护数字生活的新卫士

随着科技的飞速发展,数字家庭逐渐走进千家万户。在这个时代,机顶盒成为了连接我们与丰富多彩的数字世界的重要桥梁。而机顶盒协议,作为保...

软件开发 2025-01-01 阅读1 评论0

语言基础在现代社会的重要性及方法步骤

语言是人类沟通的桥梁,是社会发展的基础。语言基础作为语言学习的基石,对于个人、社会乃至国家的发展具有重要意义。本文将从语言基础在现...

软件开发 2025-01-01 阅读2 评论0

粤语电影,传承文化,点亮时代之光

粤语电影,作为中国电影产业的一朵奇葩,以其独特的地域特色、丰富的文化内涵和鲜明的艺术风格,赢得了广大观众的喜爱。本文将从粤语电影的...

软件开发 2025-01-01 阅读1 评论0

苹果游戏语言,塑造未来娱乐体验的基石

随着科技的飞速发展,游戏产业逐渐成为全球娱乐市场的重要支柱。在我国,游戏产业更是蓬勃发展,吸引了无数玩家和投资者的目光。而在这其中...

软件开发 2025-01-01 阅读1 评论0