网站首页
Ai工具箱
Ai写作对话
Ai绘画生成
Ai视频生成
Ai语音工具
Ai图片处理
AI搜索问答
Ai办公效率
Ai编程建站
Ai平台模型
Ai开源项目
Ai学习资源
GPTs应用
Ai提示指令
Ai科技公司
资源素材
PPT资源
免商图片
视频素材
音乐素材
字体字库
剧本文案
影视资源
摄影壁纸
logo图标
插画网站
网盘传输
创作工具
图片处理
视频剪辑
思维导图
排版编辑
格式转换
字幕配音
直播录屏
调色配色
媒体运营
知识付费
实时热榜
媒体平台
红人营销
数据分析
流量变现
流量采买
裂变增长
媒体资讯
行业圈子
独立开发
电商运营
财经投资
教育学习
招聘求职
生活创意
创业营销
3D&游戏
AI服务商
提交您的产品
Ai应用
Ai资讯
AI生图
AI生视频
AI生PPT
AI数字人系统
首页
>
Ai导航
>
Ai工具箱
>
Ai开源项目
Ai开源项目
为你收集国内开发的各种ai写作源码,AI智能客服系统源码,Ai智能写作源码,AI绘画系统源码,Al智能聊天系統源码。
Ai图生视频工具
文字转视频工具
Trae:新一代AI编程工具
码多多Al智能聊天系統
码多多Al智能聊天系統是一款基于人工智能技术的聊天系统AI源码。它可以与用户进行自然语言对话,提供各种服务和答案...
豆包MarsCode
字节跳动旗下推出的一个免费AI编程助手,一个基于 AI 的云 IDE(集成开发环境)。内置的AI助手和开箱即用的...
Agent TARS
一个字节跳动开源的多模态 AI 代理工具,Agent TARS能够通过视觉方式解释网页内容,从而实现流畅的浏览器...
Motionshop
AI角色动画工具,通过先进的视频处理和3D渲染技术,MotionShop能够高效地将视频中的某个角色替换为3D人...
AnimateDiff
AnimateDiff 是一个能够将个性化的文本转换为图像的扩展模型,一款可以在stable diffusion...
ProPainter
ProPainter,一键移除视频内的移动物体,一键移除视频水印。
TryOnDiffusion
TryOnDiffusion就谷歌推出的一项新虚拟试穿功能,能够实现高度逼真的虚拟试穿,用户能够直观地看到不同体...
BotSharp
一个基于.NET开发的开源AI多智能体应用开发框架,它可以快速将大型语言模型(LLMs)快速集成到现有业务系统中...
Colors
一个开源的学术期刊配色推荐器,收集整理了众多高质量论文插图的配色,可帮助我们轻松快速找到专业水准的配色组合。
RuoYi AI
一个全栈式AI开发平台,包含前端应用、后台管理以及小程序等全套系统,可以帮助开发者快速搭建和部署个性化的AI应用...
Motia
一个专为开发者设计的AI代理框架,帮助开发者快速搭建、测试和部署生产级的 AI 代理。它强调代码优先和事件驱动,...
Casibase
一个开源的AI知识库和对话系统,支持多种主流 AI 模型,具备企业级功能和多语言界面,适合企业知识管理和智能对话...
AgentUniverse
一个面向复杂业务场景设计的多智能体协作框架,它提供了快速易用的大模型智能体应用搭建能力,以及丰富的多智能体协同模...
eeChat
简洁易用的大模型本地部署工具,支持开源模型 DeepSeek-R1, DLlama 3, Phi-4, Mist...
Praison AI
一个开源的低代码多智能体框架,可以通过简化大语言模型(LLM)的应用开发,帮助用户快速创建、管理和部署AI智能体...
Atomic Agents
一个适用于构建模块化、可扩展的AI代理开源框架,它将复杂的AI系统分解为最小的、不可分割的组件,并通过这些组件的...
Cradle
一个通用计算机控制的多模态AI框架,它可以使AI Agent能够像人类一样,能够直接控制键盘和鼠标,实现与任意开...
Rasa
一个开源的AI机器学习框架,专注于构建自然语言对话系统,如聊天机器人和语音助手,Rasa广泛应用于客户服务、智能...
LangFlow
一款低代码、可视化的AI应用构建工具,主要用于快速搭建和实验LangChain流水线。支持多代理对话管理和RAG...
AutoGen
微软开发的一个开源框架,用于构建和管理基于LLM的多代理系统。它允许用户创建多个Agent,这些代理可以通过对话...
Coze on WeChat
一个基于微信平台开发的智能助手,主要对接 Coze 平台,支持大部分 Coze Bot 功能。它允许用户通过微信...
Maple Mono
一款专注于优化编码体验的开源等宽字体,它提供无限的字体粗细和手工微调的斜体字形,圆角设计使其看起来丝滑舒适,特别...
SwiftChat
一款基于React Native开发的快速、安全、跨平台聊天应用,支持实时流式聊天功能和Markdown语法,还...
Browser-use
一个开源的Python库,它把AI技术和浏览器自动化功能结合起来,能让AI代理像真人用户一样在网页上浏览、操作、...
NotaGen
由中央音乐学院、北京航空航天大学和清华大学等机构联合开发的一款 AI 音乐生成模型,专注于生成高质量的古典乐谱。
MetaGPT
一个开源的多智能体框架,由DeepWisdom团队开发,在2023年6月正式开源。它能借助大语言模型(LLM)让...
Spark-TTS
SparkAudio团队开发的文本转语音(TTS)系统,基于 Qwen2.5 构建, 能够生成自然、高质量的语音...
PPTist
一款可以完全在浏览器中运行的在线PPT工具,支持在浏览器中编辑和展示 PPT和通过AI生成PPT。它还原了大部分...
Magic Resume
一个现代化的在线简历编辑器,它基于 Next.js 和 Framer Motion 构建,可以让用户能够轻松创建...
Awesome-Ollama-Server
一个用于实时监控和检测 Ollama 服务可用性和性能的系统。支持多语言,能够方便用户进行服务检测和性能监控。
MiniMates
一款高性能的轻量级数字人驱动算法,具备语音和表情两种驱动模式,MiniMates能够在普通电脑上实现实时运行,用...
SurveyX
一个利用大型语言模型(LLMs)生成高质量、特定领域学术论文和调查的先进学术调查自动化系统。
AigcPanel
一个免费开源的AI虚拟数字人系统, 支持视频合成、声音合成、声音克隆,简化本地模型管理、一键导入和使用AI模型。
Arxiv-Markdown-Parser-Plugin
一款能够一键将arXiv上的论文转换为Markdown格式的浏览器插件,无论该论文呈现的是摘要、PDF版本还是H...
Memento
一款基于mpv构建的开源视频播放器,专为学习日语设计。它巧妙地将视频播放与语言学习功能结合,支持通过影视内容进行...
Anda
一个以Rust为基础构建的AI智能体框架,整合了ICP区块链并且支持TEE环境,Anda的目标在于构建一个能够高...
Doocs
一款高度简洁的微信 Markdown 编辑器,支持 Markdown 语法、色盘取色、多图上传、一键下载文档、自...
HiveChat
一个专为中小型团队设计的开源AI聊天机器人项目,支持Deepseek、OpenAI、Claude和Gemini等...
NeuraPress
一款专注于微信公众号排版的Markdown编辑器,支持移动端,搭配DeepSeek和微信公众号助手,利用碎片化时...
MultiPost
可辅助你通过自动化的方式规划自媒体的内容发布,一键将内容发布到多个平台,开源免费。
WeChat Bot
基于WeChaty结合OpenAI ChatGPT、Kimi、讯飞等多种AI服务实现的开源微信机器人项目,用于自...
Phantom
字节跳动基于跨模态对齐的主体一致性视频生成系统,Phantomsk可以严格保持参考脸部的身份特征,同时生成生动的...
Step-Video-T2V
一个由阶跃星辰与吉利汽车合作开源的先进文本到视频生成模型。支持中文与英文提示输入,应用于在如广告、影视制作、自动...
Step-Audio
由阶跃星辰与吉利汽车集团联合研发的一个开源的集成语音识别、语义理解、对话生成、语音克隆、音频编辑和语音合成等功能...
SkyReels-V1
中国首个面向AI短剧创作的视频生成模型,能够实现影视级人物微表情表演生成,支持33种细腻人物表情与400+种自然...
MakeAnything
一个基于扩散变换器的序列生成模型,通过其强大的生成能力,生成一致性的序列图像。
UIGEN-T1
一个基于 Qwen2.5-Coder-7B 模型微调的开源 UI 设计生成工具,能够根据用户输入的提示生成结构清...
RAGFlow
一种用于检索增强生成(RAG)架构的框架,适用于需要动态生成内容且依赖外部知识库的场景,如智能客服、文档生成和数...
Light-A-Video
一个应用于逐帧图像重光照模型的简单应用,无需重新训练DiT视频模型,即可实现调整视频的光照效果,并且生成的视频帧...
Simba
一个能够帮助用户轻松收纳各种文档的强大工具,Simba可以作为一个后端知识库与任何检索增强生成(RAG)系统进行...
Xyne
一款日常办公工的智能搜索问答工具,Xyne整合了工作中的各种数据,可以高效查找各种文件、邮件、聊天记录、应用工具...
LiberSonora
一个基于AI的、开源有声书工具集,LiberSonora提供智能字幕提取、AI标题生成、多语言翻译等功能,并且支...
Proxy
Convergence Ai开发的基于LMLM的个人AI智能体,Proxy具备自动化浏览Web的能力,能够通过自...
Video-Subtitle-Master
一个用于批量为视频生成字幕的客户端开源工具,并支持将字幕翻译成其他语言。
LangBot
一个开源大模型原生即时通信机器人平台,支持多平台(如 微信、飞书 等)和多种大语言模型(如 ChatGPT、De...
Enhance-A-Video
新加坡国立大学、上海人工智能实验室和德克萨斯大学奥斯汀分校联合开发的视频生成增强算法。
DeepClaude
一个将DeepSeek R1模型推理能力和Claude的代码生成能力的开源工具,提供统一的API和聊天界面,还可...
FlashVideo
字节跳动和香港大学联合推出的一种高效的高分辨率视频生成框架,适用于文本到视频的生成。
PandaAI
一个基于Python的库,PandaAI将将该库依赖到自己项目中,只需几行代码,轻松实现数据读取,并能通过对话方...
FireRedASR
小红书FireRed 团队发布并开源的基于大模型的语音识别模型,它在中文普通话语音识别领域取得了新的SOTA,F...
InspireMusic
阿里通义实验室开源的音乐生成技术,一款集音乐生成、歌曲生成、音频生成能力为一体的开源AIGC工具包。
Goku
由香港大学与字节跳动联合研发的基于校正流Transformer架构的多模态AI视频生成模型,专为图像与视频的联合...
Cursor-Tools
一个专门为Cursor和其他代理工具设计的npm包,通过集成 Perplexity AI 和 Google Ge...
AstrBot
一个开源的多平台 LLM 聊天机器人及开发框架,支持多个消息平台的集成,如QQ、微信,AstrBot支持多种大型...
Hibiki
Kyutai Labs开发的高保真实时语音翻译模型,可以保留原声特点并进行实时翻译,边听边翻译,像同声传译一样实...
JoyGen
京东科技与香港大学合作开发的音频驱动3D说话人脸视频生成框架,提供精确的唇部与音频同步,以精确模拟说话者的唇部动...
Midscene.js
一款基于AI的自动化浏览器助手,能够通过自然语言操作网页。你只需描述要执行的任务,Midscene.js会自动处...
MediaGo
一款开源免费的跨平台视频提取工具。支持流媒体下载、视频下载、m3u8 文件下载以及 B 站视频下载。
Go-with-the-Flow
通过结构化潜噪声采样来控制运动,Go-with-the-Flow能实现多种视频生成和编辑效果,包括:局部物体运动...
FUZZ
由Riffusion推出的一款基于扩散模型(Diffusion Model)的全新音乐生成模型,该工具能够通过“...
Tarsier
字节跳动推出的一系列大规模视觉语言模型(LVLM),专注于视频理解任务,包括视频描述、问答、视频定位、幻觉测试等...
Cherry Studio
一款开源的支持多种大型语言模型(LLM)桌面AI客户端,集成了多个LLM,支持Ollama本地模型部署。
CodeName Goose
一款开源代码智能体Agent,Codename Goose不仅能自动生成代码,还能安装、执行、测试。
kokoroTTS
一款开源、高性能的文本转语音(TTS)模型,Kokoro TTS拥有8200万参数,基于StyleTTS 2架构...
JanusFlow
DeepSeek团队推出的一款先进的多模态人工智能模型,目的在于统一视觉理解与生成任务。它通过结合自回归语言模型...
Janus-Pro
DeepSeek开发的多模态理解与生成模型,专注于图像生成和多模态理解任务,并在性能上超越了当前主流的图像生成模...
DataRoom
一个高度集成的、开源的大屏设计与数据可视化工具,基于SpringBoot、MyBatisPlus、Vue、Ele...
Gzm Design
一个免费开源的海报设计器,Gzm Design使用最新的Vue3,vite4,TypeScript等主流技术开发...
TianliGPT
一个专业的文字摘要生成工具,你可以将需要提取摘要的文本内容发送给TianliGPT,稍等一会他就可以给你发送一个...
StereoCrafter
一个由腾讯AI实验室开发的能将普通的2D视频转换为沉浸式的立体3D视频的开源框架。
LogoCreator
一款由开源达人Hassan打造的AI Logo设计工具,LogoCreator依托Together AI平台的F...
VISION XL
一款专注于视频质量修复与增强的全新工具,VISION XL利用潜在扩散模型来解决高清视频的逆问题,能够在资源要求...
SkyCode
奇点智源发布的多语言开源编程大模型,采用GPT3模型结构,支持Java, JavaScript, C, C++,...
HandyArrows手绘箭头
一个提供手绘风格 SVG 箭头素材的网站,HandyArrows上所有素材均为免费开源,并可商用,适用于各种设计...
AnchorCrafter
一个由计算所、美团、腾讯等机构合作研发,专为电商场景设计,能够自动生成具有主播风格的AI虚拟主播带货视频神器。
LTX Video
LTX Video的简称,是由Lightricks推出的开源AI生成视频模型,LTX-Video 是第一个基于 ...
MinerU
一站式开源高质量数据提取工具,支持PDF、网页、多格式电子书提取,自动识别并转换LaTeX格式、HTML格式,自...
卡卡字幕助手 | VideoCaptioner
一款基于 LLM 的智能字幕助手,无需GPU一键高质量字幕视频合成!支持生成、断句、优化、翻译全流程。卡卡字幕助...
RMBG-2.0
BRIA AI开发的开源图像背景移除模型,RMBG-2.0基于创新的BiRefNet架构,能够在复杂环境和高细节...
PDFMathTranslate
一款开源的PDF文档翻译工具,专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原...
腾讯混元3D
全称为Hunyuan3D-1.0,是腾讯推出的一款同时支持文生和图生的3D开源模型,解决现有3D生成模型在生成速...
ChatNio
一个集合了各种流行的模型和服务的一站式平台,提供包括 OpenAI、Midjourney、Claude、讯飞星火...
FacePoke
一个实时编辑脸部表情和头部位置的AI工具。用户可以通过简单的拖放界面,轻松调整面部特征和表情,使静态的肖像变得生...
libcom
上海交通大学牛力教授团队推出的一款图像合成工具箱,经过六年的研发,集成了多种强大的图像处理功能。
ChatTTS-Forge
一个围绕 TTS生成模型开发的项目,ChatTTS-Forge为用户提供灵活的TTS生成能力,支持多种音色、风格...
Linly-Dubbing
一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视...
EZ-Work
一款开源AI文档翻译助手,帮助用户使用 OpenAI 等大型语言模型API快速且经济高效地翻译文档。支持txt、...
TokenFlow
一个利用预训练的文本到图像扩散模型进行视频编辑的框架。它无需进一步训练或微调,即可实现一致的视频编辑效果。
LinkedIn_AIHawk
您的人工智能求职助手。自动化申请、LinkedIn_AIHawk让你获得个性化建议并更快地找到您梦想的工作。
Kolors Virtual Try-On
由快手可图团队开发的AI试衣技术,通过可图AI试衣,用户上传自已的照片,就可以在几秒钟内看到自己穿上不同衣服的效...
YouDub-Webui
一款开源的多语言AI配音和视频翻译工具,优质视频中文化工具,YouDub-webui提供了一套完整的视频中文化工...
VideoDoodles
一款能在视频中轻松任意插入手绘动画并与视频内容无缝融合的AI工具,通过VideoDoodles你可以在视频中添加...
LabelU
一个开源的数据标注工具,可以帮助用户快速、准确、高效地对数据进行标注,从而提高机器学习模型的性能和质量。
Deep Live Cam
一款开源的实时人脸交换和AI视频换脸工具。它能够利用单张图像对视频或其他图像进行人脸替换,适用于视频制作、动画创...
MedisGo
一款免费好用的视频解析下载工具,简单易学,无需抓包,不需要安装插件,支持流媒体下载 、视频下载 、 m3u8下载...
AI Anime Generator
AI二次元动漫图片生成器,利用AI Anime Generator,你可以通过简单的界面和高效工具轻松进行动漫创...
Emote Portrait Alive
阿里巴巴发布的EMO,一种音频驱动的AI肖像视频生成框架。通过输入单一的参考图像和语音音频,Emote Port...
Teable
一个基于 Postgres 构建的超快速、实时、专业、开发人员友好的无代码数据库。Teable使用简单的、类似电...
MemFree
一个开源混合AI搜索引擎,借助 MemFree,您可以立即从互联网、书签、笔记和文档中获得准确的答案。
Tora
阿里巴巴推出的AI视频生成框架,基于轨迹导向的扩散变换器(DiT)技术,能够将文本、视觉和轨迹条件融合,生成高质...
Flux AI
一款由Flex.1驱动的图像生成器,Flux AI可以快速生成高质量、逼真的Flux AI图像,包括完美的Flu...
Diffree
一款通过AI技术可根据文本描述智能地向图像中添加新对象,Diffree让你只需一句话就可以为您的图片添加新元素,...
LabelLLM
一个开源的数据标注平台,致力于优化对于大型语言模型(LLM)开发不可或缺的数据标注过程。
CosyVoice
一种深度融合文本理解和语音生成的一项新型语音合成技术,CosyVoice能够精准解析并诠释各类文本内容,将其转化...
MindSearch
一个开源的 AI 搜索引擎框架,MindSearch具有与 Perplexity.ai Pro 相同的性能。您可...
UniVG
百度公司推出的视频生成模型,能够以文本和图像的任意组合作为输入条件进行视频生成。
Cody Former
一个开源的人工智能图像处理工具,Cody Former专注于面部修复、图片清晰化以及视频去除马赛克和修复。
Unique3D
一种图像到3D框架,可以从单视图图像高效生成高质量的3D网格。具有最先进的生成保真度和强大的通用性。
EchoMimic
一个基于音频驱动的肖像动画生成工具,通过可编辑的特征点条件生成逼真、自然的动画,用户可以根据自己的需求调整动画细...
LivePortrait
利用AI技术将静态照片转换为视频,展现逼真的面部表情和动作。
PDF-Guru
一个通用型PDF文件处理工具,PDF-Guru包含PDF合并、拆分、旋转、水印、加密、转换等20多项常用功能,完...
ChatHub
一个创新的浏览器扩展插件和应用,ChatHub设计的目的是为了让用户能够在一个统一的界面中与多个聊天机器人进行交...
QuickRecorder
一款基于ScreenCapture Kit for macOS的轻量级录屏工具/基于 ScreenCapture...
FreeAskInternet
FreeAskInternet 是一个完全免费、私有且本地运行的搜索聚合器,并使用 LLM 生成答案,无需 GP...
MimicMotion
腾讯和上交大出的,具有置信度感知姿势指导的高质量人体运动视频生成,MimicMotion可以生成任意长度、具有任...
ClotheDreamer
一个虚拟试穿项目,可以从文本生成可穿戴3D服装,ClotheDreamer是上海大学、上海交通大学、复旦大学和腾...
Farfalle
一个开源的AI 驱动的答案搜索引擎,定位为 Perplexity 的自托管替代品。
AutoStudio
在多轮交互式图像生成中制作一致的主题
Meilisearch
闪电般快速的搜索 API,可轻松融入您的应用程序、网站和工作流程
Wiseflow
一款敏捷的信息挖掘开源免费工具,Wiseflow可以从网站、微信公众号、社交平台等各种信息源中按设定的关注点提炼...
DUIX
硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源,开发者可自行接入多方大模型、语音识别(ASR)、...
Streamer-Sales销冠
销冠,卖货主播 LLM 大模型,Streamer-Sales就一款能够根据给定的商品特点从激发用户购买意愿角度出...
Omnivore
一款免费、开源、适合认真阅读的稍后阅读应用程序。不受干扰。注重隐私。开源。专为知识工作者和终身学习者而设计。
懒人客服
一个基于 LLM 大语言模型的知识库的集成客服系统,提供开箱即用的智能客服解决方案。
Diffutoon
一项突破性的卡通着色进步,植根于扩散模型,通过解决四个子问题:风格化、一致性增强、结构指导和着色,将逼真的视频转...
RTranslator
一款开源、免费、离线的 Android 实时翻译应用程序。连接到拥有该应用程序的人,连接蓝牙耳机,将手机放入口袋...
ChatTTS
专门用于对话场景的免费在线文本转语音TTS模型,支持英文和中文两种语言。这个语音专文本TTS模型 应该是目前对中...
Stirling-PDF
一个基于Web强大的开源PDF操作工具。它使您能够对 PDF 文件执行各种操作,包括拆分、合并、转换、重组、添加...
StoryDiffusion
一款由南开大学HVision团队开发的人工智能工具,主要功能包括生成连贯的图像和视频故事,以及漫画生成创作。
XHS-Downloader
小红书链接提取/作品采集工具:提取账号发布、收藏、点赞作品链接;提取搜索结果作品链接、用户链接;采集小红书作品信...
Perplexica
一个提供高质量搜索体验的开源AI驱动搜索引擎,Perplexica通过理解用户问题并利用机器学习算法来提供精准的...
HiDiffusion
大幅提升扩散模型的图像生成质速度提升6倍,由字节跳动的研究团队开发,只需添加一行代码即可
IDM-VTON
一种先进的虚拟试穿技术,它通过结合视觉编码器和UNet模型来生成高质量的虚拟试穿图像,并且可以通过定制来进一步提...
微软VASA-1
微软亚洲研究院开发的一种前沿人工智能技术,VASA-1能够将单一静态图像和一段语音音频转换成逼真的对话面部动画。
InstantMesh
一个基于单张图片,利用先进的稀疏视图大型重建模型(LRM)架构,快速生成3D网格(Mesh)的工具
AniPortrait
一款由腾讯研究人员开发的音频驱动的肖像动画合成框架,AniPortrait能够根据音频和静态人脸图片生成逼真的动...
APISR
一个专注于动漫图像超分辨率的项目,旨在恢复和增强来自现实世界场景的低质量、低分辨率动漫图像和视频源。
StreamMultiDiffusion
一种基于区域语义控制的实时交互生成图像方法,主要用于图像生成和编辑应用。它基于扩散模型在文本到图像合成中的成功,...
迅排设计
一款漂亮且功能强大的在线海报设计器,图片编辑器,仿稿定设计,迅排设计Poster-Design适用于海报生成、电...
Animagine XL 3.1
一个开源的文本生成图像动漫模型,通过整合新的数据集,Animagine XL 3.1扩展了对广泛动漫作品和风格的...
LangChain
一个用于构建基于大型语言模型(LLMs)的应用程序的开源框架。 LLMs 是根据大量数据预先训练的大型深度学习模...
ComflowySpace
Comflowy社区开箱即用的 Comfy UI 整合包 一键安装,小白也能轻松上手。
Magi
为您喜欢的漫画生成文字记录,将文本与说话者相匹配,从而使读者能够通过阅读文本来完整地体验漫画故事。
CogVideo
目前最大的通用领域文本生成视频预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogVie...
Beeble AI
毫不费力地改变图像和视频中的照明,实现超逼真的效果。使用Beeble AI 的创新技术,通过逼真的灯光效果增强您...
Open WebUI
一个可扩展、功能丰富且用户友好的自托管 WebUI,适用于各种 LLM 运行器,支持的 LLM 运行器包括 Ol...
Sora.FM
一个使用nextjs创建的用于生成 Sora AI视频的开源Web模板。
SoraWebui
一个开源项目,允许用户使用 OpenAI Sora 模型使用文本在线生成视频,从而简化视频创建,并具有轻松的一键...
OOTDiffusion
一个高度可控的虚拟模特服装试穿开源工具,OOTDiffusion可以根据不同性别和体型自动调整服装,可控试穿参数...
notesGPT
一个能够录下你的语音内容,然后自动帮助你把这些语音转成文字,对内容进行总结,并且生成相关的任务列表的AI笔记工具...
MoneyPrinter
自动创建YouTube短视频的自动化赚钱项目,只要输入视频文本MoneyPrinter即可自动产生与之相关的短视...
YOLO-World
腾讯AI实验室开发的一个实时目标检测工具,它能够自动识别和定位图像中的各种对象
Boximator
字节跳动发布的一种视频编辑工具,Boximator能让用户通过简单的操作控制生成视频中主体的运动轨迹。
Media2Face
一款革命性的语音面部动画生成工具,借助 Media2Face,现在可以从任何音频、图像或文本输入无缝生成逼真且富...
Audio2Face
一款由AI驱动的应用程序,通过语音生成富有表现力的3D面部动画。
WhisperFusion
一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器...
AI Cover 红包封面生成器
由idoubi艾逗笔开发的一款AI红包封面生成器,利用AI技术生成高清精美的微信红包封面图片。
StreamRAG
一个视频搜索和流媒体代理工具,能让您在 ChatGPT 中与您的视频库聊天并观看视频流。
DuckDB-NSQL
一个专门为DuckDB数据库设计的文本到SQL的模型,你可以使用自然语言说描述你的需求,它会自动转换成SQL代码...
Diffuse to Choose
一种基于扩散的图像修复模型,主要用于虚拟试穿场景。它能够在修复图像时保留参考物品的细节,适用于在线购物等虚拟试穿...
SupIR
基于大规模扩散的高保真通用图像恢复模型,SupIR能够根据文本提示进行智能修复,提高图像修复的质量和智能程度。
Lumiere
谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构,能够一次性生成整个视频的时...
DiffusionGPT
字节跳动开发的由LLM驱动文本生成图像多合一系统,专门设计用于为不同的输入提示生成高质量的图像。
GPT-SoVITS
一个声音克隆和文本到语音转换的开源 Python RAG框架,只需1分钟语音即可训练一个自己的TTS模型。
LibreChat
一个增强版免费开源的ChatGPT程序,LibreChat 是一个免费开源的聊天机器人平台,集成了多种 AI ...
PhotoMaker
PhotoMaker:利用多张照片作为身份ID,获取人物特征,然后根据描述生成一个新的、个性化的人物图像。
DDColor图像上色
一个为黑白图像上色的魔搭模型,通过双解码器实现逼真的图像着色,输入一张黑白图像,实现端到端的全图上色,返回上色处...
Chatbot UI
一个开源的聊天机器人Web UI框架,Chatbot UI提供 OpenAI 的 ChatGPT UI 的改进版...
Personalized Restoration
一个面部图像精准恢复和个性编辑技术工具,不仅能复原受损图像细节,同时能精准捕捉和重现个人独特的面部特征。同时它还...
QAnything AI
网易有道一个开源的本地知识库问答系统,旨在支持多种文件格式和数据库,允许离线安装和使用。
Jan.ai
ChatGPT 的开源、托管替代品,jan.ai可在您的计算机上100%离线运行。
ChatGPT-Plus
基于AI大语言模型 API 实现的 AI 助手全套开源解决方案,自带运营管理后台,开箱即用。集成了 OpenAI...
Make-A-Character
文生3D数字人工具,借助 Make-A-Character,您可以毫不费力地从文本描述中生成可控、逼真、可动画的...
Zero123
一种从单个图像到一致的多视图扩散基础模型,旨在使用单视图输入生成 3D 一致的多视图图像。
Audio2Photoreal
从音频生成全身逼真的虚拟人物形象。它可以从多人对话中语音中生成与对话相对应的逼真面部表情、完整身体和手势动作。
IP-Adapter-FaceID
该模型利用面部识别模型的面部ID嵌入,可以更准确地捕捉和再现特定人物的面部特征。IP-Adapter-FaceI...
VideoDrafter
一个高质量视频生成的开放式扩散模型,相比之前的生成视频模型,VideoDrafter最大的特点是能在主体不变的基...
赛博投简历
一个AI自动投递简历的工具,结合chatgpt与rpa技术,实现一键自动寻找工作、根据自己的简历和工作描述生成求...
DreamTalk
一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈...
M2UGen
一款融合了音乐理解和多模态音乐生成任务,旨在助力用户进行音乐艺术创作的引领潮流的框架。
HandRefiner
解决AI图像生成中手部畸形的问题 目前的图像生成模型,再生成图像方面已经非常出色,但在生成人类手部的图像时却常常...
DemoFusion
一个开源的 AI 图像重绘增强工具,通过使用最新的 BSR Gan技术,可以将低分辨率图像提升至高分辨率并修复和...
AnyDoor
AnyDoor,由香港大学、阿里巴巴和蚂蚁集团联合研发AnyDoor,可以将一张照片上的任何物品传送到另一张图片...
PIA
PIA是一款个性化图像动画生成器,可以生成具有高运动可控性和强文本和图像对齐性的视频,与条件图像对齐,通过文本实...
ComfyUI Portrait Master简体中文版
ComfyUI Portrait Master 肖像大师简体中文版。超详细参数设置!再也不用为不会写人像提示词发...
DreaMoving
DreaMoving,一种基于扩散的可控视频生成框架,用于生成高质量的定制人类舞蹈视频。
LucidDreamer
LucidDreamer,可以从单个图像的单个文本提示中生成可导航的3D场景。 单击并拖动(导航)/移动和滚动(...
LiveSketch
LiveSketch是一款AI生成视频工具,用户通过文本提示将静态素描转化为动画,它提供了一种简单直观的方法,使...
miniPaint
miniPaint,在线PS,一个开源的Photoshop替代品,miniPaint可直接在浏览器中运行,不需要...
MagicAvatar
MagicAvatar由字节跳动开发,是一款主打多模态输入生成的多模态框架,可以将文本、视频和音频等不同输入方式...
1
2
用户登录
阅读并同意《使用条款》
注册
|
忘记密码