用 AI 托管量产原创电影解说视频?没错可以的。
当下自媒体账号中有大部分都是影视剧解说的内容,如果看得多了你会发现很多内容情节讲解的都大同小异,本身影视剧翻来覆去就那么点东西,我就琢磨了下这些能不能用Python直接一键生成这种解说视频。
答案是可以的,我尝试地做了几个发在我的抖音账号上。
目前版本是1.0版本功能有限,未来会继续在更新算法的基础上更新脚本。这里介绍大体的制作思路和方法和原创你们想要问的问题。
既然正儿八经地讲技术没人看那么就做这么一个好试试吧。
软硬件、技能需求
数据获取
这里的数据获取分两部分
- 能自己找到完整的电影素材,mkv格式最佳,mp4也能凑合用。比如去某些程序员论坛,这里影片都是质量非常高的原片而且无水印。不要问打马赛克的地方,老司机都懂的。
- 能自己写爬虫脚本抓取别人的电影解说视频,并去水印等等。这个对于一些程序员新手来说略有难度。比如说抖音吧抓取的视频,文章的水印你无视哈。
基础素材准备
这个对于之前《月产10000个中药科普短视频方法,Python编程AI教程》制作的需求素材相对于简单一些。
做一个片头,一个水印就行了。
流程与代码
了解业务处理制作流程有助于理解代码,或者流程了解了代码就很容易。
先看一下整体的工程目录,然后一步一步说。
基础数据应用部分
就是把你抓取的原影视剧文件或者解说视频下载到 source_video 下名称随意,只放1个,系统会自动识别名称。
配置时间和毫秒的转换方法,挺简单的玩python的都会,不会的自己对照着敲一遍。
必须手动的部分
就是剪辑到原来的片头,比如说电影这种无用无法配解说的镜头,其实就掐头去尾就行。
用moviepy剪切测试一下。
设置画面截取的范围,有的电影或者视频是带黑边的要剪掉。
然后按照像素框裁剪掉你需要的整个影片,并重置画面像素大小。
字幕处理方法
为了省钱用免费的剪映自动识别字幕,视频扔进去自动识别。如果有钱用科大讯飞或者百度的也行。最终效果是一样的,而且可以使用一些算法自动提取正文内容的摘要,方法百度上都有自己问。
字幕导出是剪映对应目录下的这个文件 draft_content.json 。
用代码解析一下就好生成时间轴数据列表用于后续的编辑。
黄色部分用于洗稿用的,就是按照你的理解编辑对应片段就行了,将做好的excel表格放到 temp_mp3 下。
文稿匹配拆分方案2,拆分时间进行进行文稿重塑
这里要注意的是影片你要自己先看过一遍,否则你都不知道里面演的是什么,可能后期做字幕会很尴尬。就是有选择地选择稿件中的文字信息,也可以根据自己的理解改写。
写好的稿子之后再执行生成合成语音方案
如果视频太长了稿子太长可以进行切分分成几个部分,每个部分限制字数使用each_str 实现。
匹配文稿语音合成
用API吧,如果自己有把握稿子不会念错自己念录制也行。
根据之前做好的excel表格把影片中无用的部分剪切掉
剪切的标准是时间点,就是excel表格中设置的时间点,有字幕解说的部分要,无字幕解说的部分直接砍掉,例如下面红色框的部分。根据这个时间节点会自动进行拼接。
生成的音频文件合并
这里要注意的是你制作的片段部分如果想和字幕对上需要进行一个加速。要么视频加速要么音频加速,如果是用moviepy的话用视频加速,因为音频加速会有些走掉。如果是用mmpeg合成就无所谓了。
加速的公式合成代码。
最后直接等待结果的视频出来之后稍微手动加工一下就可以发自媒体啦。
伪原创的谣言
这个怎么说呢只有你试过了才知道不行。网上有很多方法还有卖各种软件的,我只能告诉你这个是教智商税,你买了以后完全没效果。
网上卖的软件能买么?
比如某地方卖的这个工具,这里面除了神经网络所有的功能都用moviepy能实现,不可信。
至于你会问神经网络去重?这玩意是用GPU跑的,你的机器没有配置对应的开发环境是执行不起来的。用过的人都知道CPU和GPU处理的视频时间比大概是20比1的样子。
这种能公开出来的人家平台就会不知道么?很容易被破解的。只能自己去慢慢尝试方法,然后自己用就是了。
毕竟好用能用的东西没人会拿出来卖的。
修改MD5?
代码其实很简单直接可以一步出结果,但是你能想到字节的工程师就想不到么?
来源:Mr数据杨
声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!