10款开源AI搜索引擎项目合集
ai搜索是 LLM RAG 非常典型的应用场景,也是覆盖用户群体极大的场景,以 Perplexity 为代表的 AI 搜索产品们,也在加速向全世界展示着 AI 搜索的无限可能性和对传统搜索的迅速颠覆。
今天咱们一起来看看,AI 搜索领域,都有哪些开源项目。
1、Morphic
Morphic 是一款 AI 驱动的搜索引擎,具备生成式用户界面,能够理解并回答用户问题。它支持搜索历史查看、结果分享、视频搜索,并能从指定 URL 获取信息。Morphic 还能作为搜索引擎使用,支持包括 OpenAI 在内多个 AI 服务提供商,并允许用户指定生成答案的模型,包括对 Groq API 的支持,以及对 Llama-3.1 最新模型支持。
Github开源项目地址:https://github.com/miurla/morphic
2、Search with Lepton
Search with Lepton 来自 Lepton AI 团队,该项目向开发者传达:“使用不到 500 行代码构建自己的会话式搜索引擎”的理念,Lepton 由 Yangqing Jia等创办。
Github开源项目地址:https://github.com/leptonai/search_with_lepton
3、Perplexica
Perplexica 是一个开源的 AI 驱动搜索引擎,通过 Ollama 提供本地 LLMs 支持。它具备两种模式:Copilot 模式,通过生成不同的查询来增强搜索并寻找更相关的网络资源;普通模式,直接处理用户查询并执行网络搜索。
此外,Perplexica 拥有六种专注模式,专门用于回答特定类型的问题,包括全网搜索、写作辅助、学术研究、YouTube 视频搜索、Wolfram Alpha 数据分析以及 Reddit 社区讨论搜索。使用 SearxNG作为搜索引擎。
Github开源项目地址:https://github.com/ItzCrazyKns/Perplexica
4、Zure-search-openai-demo
azure-search-openai-demo 是一个使用 Azure OpenAI 和 Azure AI Search 的示例应用程序,它展示了如何创建类似 ChatGPT 的体验,使用检索增强生成模式来处理用户数据。该应用使用 Python 编写后端,并提供了 JavaScript、.NET 和 Java 的示例。它集成了 Azure AI Search 进行数据索引和检索,并支持多种文档格式和集成的向量化处理。
Github开源项目地址:https://github.com/Azure-Samples/azure-search-openai-demo
5、TurboSeek
Turboseek 是一个受 Perplexity 启发的人工智能搜索引擎,旨在提供深入网络的答案搜索功能。它利用先进的机器学习算法,如相似性搜索和嵌入技术,来优化搜索结果,确保用户能够获得最新和最相关的信息。Turboseek 强调隐私保护,使用 SearxNG 作为其搜索引擎后端,确保信息的时效性,同时避免依赖每日数据更新的开销。此外,作为一个开源项目,Turboseek 允许用户自定义和扩展其搜索功能。
Github开源项目地址:https://github.com/Nutlope/turboseek
6、FarFalle
Farfalle 是一个开源的 AI 驱动搜索引擎,被设计为 Perplexity 的克隆版本。它支持通过 ollama运行本地 LLMs 和通过 LiteLLM使用自定义的 LLMs,同时也支持使用云模型(如 Llama3、OpenAI/gpt4-o)。Farfalle 提供了多种搜索提供商的搜索能力,并允许用户通过 Agent 进行搜索,能够规划和执行搜索以提供更好的结果。
Github开源项目地址:https://github.com/rashadphz/farfalle
7、Gerev
Gerev 是一个由 AI 驱动的企业搜索引擎,专门设计用于快速检索组织内的对话、文档或内部页面。它支持自然语言搜索,使用户能够以类似于日常对话的方式进行搜索。Gerev 可以通过云服务或自托管的方式部署,并且具有多种集成选项,包括 Slack、Confluence、Jira 等流行工具。此外,它还允许用户添加自己的数据源,以进一步扩展搜索能力。Gerev 的目标是帮助技术支持人员快速解决问题,并使组织内的信息检索变得简单快捷。
Github开源项目地址:https://github.com/GerevAI/gerev
8、MemFree
MemFree 是一个混合人工智能搜索引擎,可以同时在您的个人知识库(例如书签、笔记、文档等)和互联网上执行搜索。混合人工智能搜索引擎,一键式Chrome 书签同步和索引,支持多种传统搜索引擎作为来源。
Github开源项目地址:https://github.com/memfreeme/memfree
MindSearch 是一款具有 Perplexity.ai Pro 性能的开源 AI 搜索引擎框架。您可以简单地使用您自己的 perplexity.ai 风格的搜索引擎以及闭源代码来部署它LLMs(GPT,Claude)或开源LLMs(实习生LM2.5-7b-聊天)。
Github开源项目地址:https://github.com/InternLM/mindsearch
10、OpenPerPlex
使用Cohere 和semantic-chunkers 库进行语义分块,使用JINA API对结果进行重新排序,通过http://serper.dev 集成Google 搜索,使用Groq作为推理引擎。
Github开源项目地址:https://github.com/YassKhazzan/openperplex_backend_os