Local-NotebookLM:开源的本地版NotebookLM,能够将PDF转换为播客
Local-NotebookLM 是什么?
Local-NotebookLM 是一个本地化的ai工具,能够将PDF文档转换为播客。它支持本地语言模型(LLM)和文本到语音(TTS)模型,用户可以根据需求生成不同风格和长度的播客。
Local-NotebookLM功能特点
智能文档处理
自动文本提取:从PDF中提取文本,自动清理格式错误和冗余内容。
学术论文支持:支持处理包含数学公式的学术论文。
智能分块处理:支持大文件处理,最大支持10万字,自动分块以优化处理效率。
多模式内容生成
丰富输出格式:支持15种输出格式,包括播客、访谈、辩论、讲座等。
多样化内容风格:提供8种内容风格,涵盖专业、学术、轻松、搞笑等。
灵活内容长度:支持4种内容长度,从短篇(10分钟)到长篇(100+分钟)。
灵活模型支持
多LLM服务兼容:支持6种LLM服务,包括OpenAI、Groq和本地模型。
可配置TTS语音角色:支持主持人与嘉宾双角色对话,可自定义语音角色。
本地优先设计:优先使用本地资源,保护隐私,同时降低使用成本。
全渠道使用方式
命令行一键生成:通过简单命令快速生成内容。
Python API集成:支持Python API集成,方便开发者使用。
网页版服务:基于FastAPI的网页版服务,便于在线操作。
安装与配置
安装需求:需要安装Docker Desktop,并安装Kokoro-FastAPI。
安装步骤:通过Git克隆项目,创建并激活虚拟环境,然后安装所需的Python包。
配置文件:需要创建一个config.yaml文件,用于配置输出目录、LLM提供商、模型名称、语音克隆参数等。
Local-NotebookLM使用方法
环境准备:根据所使用的LLM提供商,启动相应的服务或确保API密钥可用。
运行脚本:通过运行python main.py input.pdf [options]命令,将PDF文件转换为播客。
可选参数:用户可以指定播客的风格、长度、文本处理的分块大小等。
Local-NotebookLM处理流程
PDF处理:提取PDF文本,清理并分割为可处理的块。
生成脚本:根据指定的风格和长度生成播客脚本。
优化TTS:对脚本进行优化,以提高语音合成的自然度。
生成音频:将文本转换为语音,并生成最终的音频文件。
FAQ
1. Local-NotebookLM如何生成播客?
将PDF文件上传到工具中。
使用命令行运行脚本,指定播客的风格和长度。
工具会自动处理文本并生成音频文件
2. Local-NotebookLM 与 NotebookLM 有什么区别?
Local-NotebookLM 是一个本地化的工具,运行在本地机器上,支持本地LLM和TTS模型。
NotebookLM 是一个基于云的工具,主要用于笔记管理和文档分析,支持AI驱动的总结、协作和音频生成。
GitHub仓库:https://github.com/Goekdeniz-Guelmez/Local-NotebookLM