首页 最新 热门 推荐

  • 首页
  • 最新
  • 热门
  • 推荐

AI工具SD【stable diffusion】,制作AI美女跳舞视频的完整步骤,保姆式流程!

  • 25-02-15 14:41
  • 3324
  • 13043
blog.csdn.net

AIGC领域,有这么几个方向:写作、绘画、影视、音乐。

写作领域用的比较多的AI工具是chatgpt、KIMI等,那么绘画领域有哪些AI工具,你知道吗?

**最知名的有两款,一个是midjourney、另外一个是SD(stable diffusion)。**前者是收费的,但是可以在线使用,你不用准备硬件设备。后者是免费的,要布署到本地,它对显卡有一定的要求。

今天跟大家分享一下如何利用SD(stable diffusion)软件,来制作AI美女跳舞视频。

你没看错,是用绘画软件,来制作视频。

你一定在短视频平台刷到过AI美女跳舞的视频。这些美女形象都比较完美,或甜美、可爱,或性感火辣,又或清纯靓丽。做这些视频的人已经收获了大量的粉丝。

看完我的拆解,你也可以迅速去尝试一把。闲话不多说,上干货!

这份完整版的AI绘画(SD、comfyui、AI视频)整合包已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

第一步:剪辑视频

从短视频平台找到你喜欢的美女跳舞视频,去水印下载(不会的加老秦微信咨询),进行二创混剪,想省事儿,也可以整段拿来用。

挑选的素材尽量是正脸,别找那种特效多的,会有影响。

第二步:将视频拆帧

一般短视频的分辨率是1080 * 1920,帧率是30帧。也就是说,一秒钟共有30帧。

用SD(stable diffusion)中的插件Ebsynth utility,把视频拆成图片帧。比如一段8秒钟的视频,拆完后就得到240张视频帧图片。

我们要把这240张图的人物脸部,全部用AI工具进行替换,之后再重组合并成视频,就得到一个AI美女脸的视频。这就是视频制作原理,很容易理解 。接着看。

第三步:抽取视频关键帧

在对每帧图片进行换脸之前,思考个问题,这么多图片,每一张都换脸,是不是要耗费许多的时间?

**是的,很费时间,**还得要求你的电脑显卡必须是N卡,显存至少得是6G起步,最好是12G以上,同时电脑内存也要大,不然完不了。(显卡是A卡的,或者是苹果电脑的,只能靠CPU来运算,那就更慢了)。

你想想,这才8秒种的视频,就得处理240张图,如果视频时间再长一些呢!

为了缩短时间,我们从240张图中抽取一部分关键的帧图片出来进行换脸,比如每隔5秒钟抽一帧图,就样就得到50张左右的帧图。

我们只对这50张图进行换脸操作,这样时间就节省好多。

第四步:重绘关键帧

1、在SD(stable diffusion)软件中先选择要用的大模型,比较知名的写实风格的就用那个麦橘写实就行了。

2、准备好图生图的提示词,即prompt。有三种方法,一是自己纯手动写,得是高手才行,二是利用WD标签器反推人一张图上反推出提示词,然后你在基础上完善一下,三是从专业模型网站下载的样图会自带提示词及配置参数,可以一键导入。这里我们使用第二种方法。

前面不是已经得到了一些关键帧,挑选一张,用WD标签器反推得到一个提示词就好了。

上面说的是正向提示词,那么反向提示词(不希望SD生成的东西,比如6个手指、丑女之类)从网上找一些通用的就可以。

**3、选择脸型参考LORA。**你可以把lora理解成大模型的微调,以实现某些局部的调整。我们就用这种换脸专用的lora,俗称捏脸。以实现创造一个完美的AI美女出来。

**小提示:几个不同的美女lora,可以混合使用,**创造一个混血美女出来。注意的是几个lora要分配好权重,相加不能高于1,可能让图片崩掉。

**4、启用ADetailer。**可以实现脸部、手部控制。

**5、启用control net。**就控制以原视频帧图片为蓝本,来画新生成的AI美女图。

**6、在批量重绘50个关键帧之前,可以先单独重绘一个图,**看看AI美女效果,这个脸是不是你喜欢的,不喜欢就调整参数,直到满意为止。

效果确定满意后,用WD标签器,把50个帧图片都反推一下,得到50个图的提示词。

**7、然后回到图****生图,把重绘尺寸设置为720*1280,**也是为了减少重绘时间。

8、接着选择调用一个批量重绘脚本ISNET,设定好目录等参数,点击开始重绘。

最后,你就得到50张重绘后的新关键帧图片,脸部已经全部是你相要的AI美女了。

第五步:放大

这50张图,其分辨率是720*1280的,所以我们要再做一个放大图片的动作。

进入SD的【后期处理】功能模块,再进到【批量处理文件夹】,改一下放大后的分辨率为1080*1920,以及放大用的算法模型。在SD软件的后期处理中,常用的放大算法包括ESRGAN系列算法和4X-UltraSharp算法。

点击生成,就得到50张重绘并放大的清晰的AI美女图片。

第六步:补帧

这时候,就需要把50张图片,变成240张了。这个操作叫作补帧。

从第1张帧到第5帧之间补上3帧图、第5帧至第10帧之间补上4帧图,以此类推,补齐到240张。

先用Ebsynth Utility插件,把这50个新图进行重命名并处理后得到几个工程文件,后辍为ebs的工程文件。

然后再用桌面端的Ebsynth软件,运行这几个ebs工程文件,这样你就得到了240张新图片。

第七步:生成视频

继续回到SD中,使用Ebsynth Utility插件,将这240张新的AI美女脸的图片,合并生成视频。

你会得到两个视频文件,区别是一个有原始声音,一个没有声音。

至此,AI美女跳舞视频就完成了。

如果想拿去发布,还得进行二次创作,整一些滤镜、画中画、镜像等去重的标准操作。毕竟,你只是换了脸。但已经是原创度很高的作品了。

这份完整版的AI绘画(SD、comfyui、AI视频)整合包已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

注:本文转载自blog.csdn.net的AIGC设计所的文章"https://blog.csdn.net/ice829/article/details/143909274"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。
复制链接
复制链接
相关推荐
发表评论
登录后才能发表评论和回复 注册

/ 登录

评论记录:

未查询到任何数据!
回复评论:

分类栏目

后端 (14832) 前端 (14280) 移动开发 (3760) 编程语言 (3851) Java (3904) Python (3298) 人工智能 (10119) AIGC (2810) 大数据 (3499) 数据库 (3945) 数据结构与算法 (3757) 音视频 (2669) 云原生 (3145) 云平台 (2965) 前沿技术 (2993) 开源 (2160) 小程序 (2860) 运维 (2533) 服务器 (2698) 操作系统 (2325) 硬件开发 (2492) 嵌入式 (2955) 微软技术 (2769) 软件工程 (2056) 测试 (2865) 网络空间安全 (2948) 网络与通信 (2797) 用户体验设计 (2592) 学习和成长 (2593) 搜索 (2744) 开发工具 (7108) 游戏 (2829) HarmonyOS (2935) 区块链 (2782) 数学 (3112) 3C硬件 (2759) 资讯 (2909) Android (4709) iOS (1850) 代码人生 (3043) 阅读 (2841)

热门文章

114
音视频
关于我们 隐私政策 免责声明 联系我们
Copyright © 2020-2024 蚁人论坛 (iYenn.com) All Rights Reserved.
Scroll to Top