
LLM Engineer Toolkit
LLM Engineer Toolkit简介
LLM Engineer Toolkit是什么?
LLM Engineer Toolkit是一个精心整理的LLM工具库,它将120多个与LLM相关的库按照功能和用途进行了细致分类,涵盖了从训练微调、应用开发、推理服务到安全评估等 LLM 开发全流程所需的工具。
LLM Engineer Toolkit工具分类
1. LLM训练和微调
unsloth:快速微调LLM,减少内存占用。
PEFT:参数高效微调库。
TRL:通过强化学习训练Transformer语言模型。
DeepSpeed:分布式训练和推理优化库。
2. LLM应用开发
LangChain:开发基于LLM的应用。
Llama Index:为LLM应用提供数据框架。
Haystack:端到端LLM框架,支持与Transformer模型和向量搜索集成。
3. LLM推理
vLLM:高吞吐量、内存高效的推理引擎。
LightLLM:轻量级、可扩展的推理框架。
TensorRT-LLM:Nvidia框架,用于优化LLM推理。
4. LLM服务
Langcorn:自动将LangChain应用部署为FastAPI服务。
LitServe:支持批量、流式传输和GPU自动扩展的快速服务引擎。
5. LLM数据提取
Crawl4AI:开源的LLM友好型网络爬虫。
Docling:文档解析工具。
PyMuPDF4LLM:用于提取PDF内容的工具。
6. LLM数据生成
DataDreamer:合成数据生成库。
fabricator:灵活的合成数据生成框架。
7. LLM安全与监控
LLM Guard:LLM交互的安全工具。
Weights & Biases:跟踪LLM性能。
Helicone:开源的LLM可观测性平台。
8. LLM评估
Ragas:LLM应用评估工具。
LangTest:提供多种测试类型,评估LLM的准确性、偏见和鲁棒性。
9. LLM嵌入模型
Sentence-Transformers:最先进的文本嵌入模型。
Text Embedding Inference:高性能嵌入模型推理工具。
10. 其他
LLM Transparency Tool:分析Transformer模型内部机制的工具。
mergekit:合并预训练LLM的工具。
llm-engineer-toolkit工具库GitHub仓库:https://github.com/KalyanKS-NLP/llm-engineer-toolkit