AudioNotes:基于FunASR 和Qwen2的音视频转结构化笔记系统
AudioNotes是一个基于 FunASR 和 Qwen2 构建的音视频转结构化笔记开源系统,能够快速提取音视频的内容,并且调用大模型进行整理,成为一份结构化的markdown笔记,方便快速阅读。
下面是使用方法:
1. 环境准备
在开始之前,确保你的计算机上安装了Docker和Ollama。Ollama是一个用于管理和运行机器学习模型的工具。
2. 克隆项目
使用Git命令将AudioNotes项目克隆到本地:
git clone https://github.com/harry0703/AudioNotes.git
3. 安装依赖
进入项目目录并安装所需的依赖项。通常,项目会在README文件中提供安装说明。
4. 部署服务
使用Docker部署AudioNotes服务。可以通过以下命令启动服务:
docker-compose up
这将启动所有必要的服务,确保它们能够正常运行。
5. 使用模型提取内容
在服务运行后,你可以通过API或命令行工具将音视频文件上传到AudioNotes。项目支持多种音视频格式,确保你的文件符合要求。
6. 生成Markdown笔记
一旦音视频内容被提取,AudioNotes会调用大模型进行整理,生成结构化的Markdown笔记。这些笔记将包含关键信息和要点,便于快速阅读和理解。
7. 查看和编辑笔记
生成的Markdown笔记可以在任何支持Markdown格式的文本编辑器中打开和编辑。你可以根据需要进一步修改和完善笔记内容。
安装完后,效果如下:
通过以上步骤,你可以高效地使用AudioNotes项目提取音视频内容并整理成结构化的Markdown笔记,提升学习和工作效率。
GitHub:https://github.com/harry0703/AudioNotes