Text2Video-Zero
Text2Video-Zero:文本到图像扩散模型是零镜头视频生成器
这个模型刚出不久,还在完善,现在已经实现低内存 12G显存运行(官方说是7G 但是我试了最低参数下本地12G可以跑满)。
参考资料
环境要求
- Python 3.9 及以上
- CUDA >= 11.6
笔者本地采用的是Python 3.10.6
安装
- 下载
git clone https://github.com/Picsart-AI-Research/Text2Video-Zero.git
cd Text2Video-Zero/
- venv虚拟环境
python -m venv venv
.\venv\Scripts\activate
- CUDA 安装
pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 --extra-index-url https://download.pytorch.org/whl/cu116
- 其他依赖安装
pip install -r requirements.txt
- 运行
python .\app.py