short-video-maker:一个开源的自动化短视频创作工具
short-video-maker是什么?
short-video-maker是一个开源的自动化短视频创作工具,它通过文本输入,结合文字转语音、自动字幕生成、背景视频和音乐,生成TikTok、Instagram Reels和YouTube 短视频。支持通过NPX或Docker运行,有多种运行方式和环境变量配置。提供REST API和Model Context Protocol (MCP)服务,依赖 Remotion、Whisper CPP 等技术。
short-video-maker功能
从文本提示生成完整的短视频。
文字转语音。
自动字幕生成和样式设计。
通过Pexels搜索和选择背景视频。
背景音乐支持,可选择流派/情绪。
提供REST API和模型上下文协议(MCP)服务器。
short-video-maker工作原理
使用Kokoro TTS将文本转换为语音。
使用Whisper生成准确的字幕。
从Pexels查找相关的背景视频。
使用Remotion组合所有元素。
渲染出专业外观的短视频,字幕时间精准。
运行
使用NPX(推荐)
支持GPU的运行方式:
LOG_LEVEL=debug PEXELS_API_KEY= npx short-video-maker 需要安装Node.js环境,并通过npx命令快速启动。
使用Docker
CPU版本:
docker run -it --rm --name short-video-maker -p 3123:3123 \ -e PEXELS_API_KEY= \ gyoridavid/short-video-maker:latest
NVIDIA GPU版本:
docker run -it --rm --name shorts-video-maker -p 3123:3123 \ -e PEXELS_API_KEY= --gpus=all \ gyoridavid/short-video-maker:latest-cuda
环境变量
PEXELS_API_KEY:用于从Pexels获取背景视频的API密钥。
PORT:API/MCP服务器的端口,默认为3123。
LOG_LEVEL:服务器日志级别,默认为info,可选值包括trace、debug、info、warn、error。
WHISPER_VERBOSE:Whisper的详细模式,默认为false。
示例
示例JSON输入:
{ "scenes": [ { "text": "Hello world! Enjoy using this tool to create awesome ai workflows", "searchTerms": ["rainbow"] } ], "config": { "paddingBack": 1500, "music": "happy" } }
输出为hello_world.mp4文件。
short-video-maker应用
社交媒体内容创作:快速生成适合TikTok、Instagram Reels、YouTube Shorts等平台的短视频。
教育领域:制作课程预告、学习资源或语言学习视频。
新闻与媒体:生成新闻摘要、专题报道或突发新闻视频。
商业营销:企业用于产品推广和品牌宣传。例如美妆品牌,以产品介绍文案为基础,生成短视频。
教育与培训:教师或教育机构可制作教学短视频。
Github:https://github.com/gyoridavid/short-video-make