
Awesome Chinese LLM
Awesome Chinese LLM简介
Awesome Chinese LLM是什么?
Awesome Chinese LLM整理了开源的中文大语言模型(LLM),主要关注规模较小、可私有化部署且训练成本较低的模型。它涵盖了底座模型、垂直领域微调及应用、数据集与教程等内容,目前已收录了100多个相关资源。
Awesome Chinese LLM主要内容
常见底座模型细节概览:
列出了如ChatGLM、LLaMA、Baichuan、Qwen等模型的参数大小、训练token数、训练最大长度及是否可商用等信息。
模型分类:
文本LLM模型:如ChatGLM、LLaMA等。
多模态LLM模型:如VisualGLM-6B、CogVLM等,支持图像、中文和英文的多模态对话。
应用分类:
垂直领域微调:涵盖医疗、法律、金融、教育等多个领域,如DoctorGLM(医疗)、LawGPT_zh(法律)、Cornucopia(金融)等。
LangChain应用:如langchain-ChatGLM,基于本地知识库的问答应用。
其他应用:如wenda(LLM调用平台)、JittorLLMs(大模型推理库)等。
数据集:
预训练数据集:如MNBVC(超大规模中文语料集)、WuDaoCorporaText等。
SFT数据集:如RefGPT(生成大量真实和定制的对话数据集)、COIG等。
偏好数据集:如CValues(价值对齐数据集)、GPT-4-LLM等。
LLM训练微调框架:
如DeepSpeed Chat(一键式RLHF训练框架)、LLaMA Efficient Tuning(基于PEFT的LLaMA微调框架)等。
LLM推理部署框架:
如vLLM(适用于大批量Prompt输入)、DeepSpeed-MII(支持多个机器之间的负载均衡)等。
LLM评测:
如FlagEval(大模型评测体系及开放平台)、C-eval(中文大模型的知识评估基准)等。
LLM教程:
LLM基础知识:如HuggingLLM(介绍ChatGPT原理、使用和应用)。
提示工程教程:如面向开发者的LLM入门课程、提示工程指南等。
LLM应用教程:如LangChain中文网、OpenAI Cookbook等。
LLM实战教程:如LLMs九层妖塔、llm-action等。
Awesome Chinese LLM的特点
资源丰富:涵盖了从模型、应用到数据集和教程的全方位资源。
分类清晰:按模型类型、应用领域、数据集用途等进行分类,方便用户查找。
实用性强:提供了大量可直接使用的开源模型和应用,适合不同需求的用户。
社区贡献:鼓励用户贡献未收录的开源资源,共同完善项目。
Awesome Chinese LLM适用人群:
研究人员:可以利用该仓库的模型和数据集进行研究和实验。
开发者:可以参考应用案例和框架进行开发和部署。
学习者:可以通过教程和文档学习LLM的相关知识和技能。