Text2Video-Zero:安装

Text2Video-Zero

Text2Video-Zero:文本到图像扩散模型是零镜头视频生成器

这个模型刚出不久,还在完善,现在已经实现低内存 12G显存运行(官方说是7G 但是我试了最低参数下本地12G可以跑满)。

参考资料

环境要求

  • Python 3.9 及以上
  • CUDA >= 11.6

笔者本地采用的是Python 3.10.6

安装

  1. 下载
git clone https://github.com/Picsart-AI-Research/Text2Video-Zero.git
cd Text2Video-Zero/
  1. venv虚拟环境
python -m venv venv

.\venv\Scripts\activate
  1. CUDA 安装
pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 --extra-index-url https://download.pytorch.org/whl/cu116

  1. 其他依赖安装
pip install -r requirements.txt
  1. 运行
python .\app.py