short-video-maker:一个开源的自动化短视频创作工具

short-video-maker是什么?

short-video-maker是一个开源的自动化短视频创作工具,它通过文本输入,结合文字转语音、自动字幕生成、背景视频和音乐,生成TikTok、Instagram Reels和YouTube 短视频。支持通过NPX或Docker运行,有多种运行方式和环境变量配置。提供REST API和Model Context Protocol (MCP)服务,依赖 Remotion、Whisper CPP 等技术。

short-video-maker:一个开源的自动化短视频创作工具.webp

short-video-maker功能

  • 从文本提示生成完整的短视频。

  • 文字转语音。

  • 自动字幕生成和样式设计。

  • 通过Pexels搜索和选择背景视频。

  • 背景音乐支持,可选择流派/情绪。

  • 提供REST API和模型上下文协议(MCP)服务器。

short-video-maker工作原理

  • 使用Kokoro TTS将文本转换为语音。

  • 使用Whisper生成准确的字幕。

  • 从Pexels查找相关的背景视频。

  • 使用Remotion组合所有元素。

  • 渲染出专业外观的短视频,字幕时间精准。

运行

使用NPX(推荐)

支持GPU的运行方式:

LOG_LEVEL=debug PEXELS_API_KEY= npx short-video-maker
需要安装Node.js环境,并通过npx命令快速启动。

使用Docker

CPU版本:

docker run -it --rm --name short-video-maker -p 3123:3123 \
  -e PEXELS_API_KEY= \
  gyoridavid/short-video-maker:latest

NVIDIA GPU版本:

docker run -it --rm --name shorts-video-maker -p 3123:3123 \
  -e PEXELS_API_KEY= --gpus=all \
  gyoridavid/short-video-maker:latest-cuda

环境变量

  • PEXELS_API_KEY:用于从Pexels获取背景视频的API密钥。

  • PORT:API/MCP服务器的端口,默认为3123。

  • LOG_LEVEL:服务器日志级别,默认为info,可选值包括trace、debug、info、warn、error。

  • WHISPER_VERBOSE:Whisper的详细模式,默认为false。

示例

示例JSON输入:

{
  "scenes": [
    {
      "text": "Hello world! Enjoy using this tool to create awesome ai workflows",
      "searchTerms": ["rainbow"]
    }
  ],
  "config": {
    "paddingBack": 1500,
    "music": "happy"
  }
}

输出为hello_world.mp4文件。

short-video-maker应用

  • 社交媒体内容创作:快速生成适合TikTok、Instagram Reels、YouTube Shorts等平台的短视频。

  • 教育领域:制作课程预告、学习资源或语言学习视频。

  • 新闻与媒体:生成新闻摘要、专题报道或突发新闻视频。

  • 商业营销:企业用于产品推广和品牌宣传。例如美妆品牌,以产品介绍文案为基础,生成短视频。

  • 教育与培训:教师或教育机构可制作教学短视频。

Github:https://github.com/gyoridavid/short-video-make


收藏
最新工具
选品酷BigTracker
选品酷BigTracker

一款由BQool比酷尔科技公司开发的专为寻找亚马逊爆款的卖家量身...

云知改写
云知改写

一个基于先进深度语义分析、智能 AI 及文本处理技术开发的论文查...

Remove.photos
Remove.photos

一款免费的图片背景去除工具,能 00% 自动在3秒内去除图片背景...

VideoIdeas Ai
VideoIdeas Ai

一个为 YouTube博主量身定制的视频内容生成工具。它能在短时...

OnePPT
OnePPT

一款创新型AIPPT智能生成工具,提供智能写作、PPT生成、模板...

Hugo
Hugo

一个使用 Go 语言开发的开源静态网站生成器,速度快,灵活性高。...

企鹅读伴
企鹅读伴

腾讯SSV数字支教实验室推出的AI阅读教育产品,由腾讯混元大模型...

Krillin AI
Krillin AI

一款本地的视频翻译、配音和语音克隆的工具,适用于哔哩哔哩、小红书...

Lovart AI
Lovart AI

一个全球首个适用于设计目的的自适应设计AI智能体平台,能将创意转...

ByeCode
ByeCode

一个新一代AI无代码开发平台,通过可视化拖拽组件,用户无需编码即...