大模型的基础工具

随着大模型成本的降低和可靠性的提升，越来越多的业务应用将与大语言模型（LLM）结合。为了支持这种结合，需要与现有基础设施兼容的工具和框架来快速开发LLM应用。

一、应用开发平台

1.1 阿里：百炼大模型平台

应用构建工具: 插件中心、流程编排、Prompt工程、RAG、Agent
模型开发工具: 训练数据管理、模型调优、模型评测、模型部署

1.2 百度：千帆大模型平台

数据管理: 数据集、数据标注、数据处理、数据回流
应用工具: 插件编排（对话类、生成类、编排类）、RAG、Prompt模板、Prompt优化、Prompt评估
模型调优: 模型精调（精调样板、Post-PreTrain、SFT、DPO、RLHF）、模型评估、模型压缩
AppBuilder: 组件编排

1.3 字节跳动：Coze

功能: Bots、插件、工作流、知识库
文档: Coze文档
对比说明: 参考链接

二、开源应用开发平台(推荐dify)

2.1 Dify

核心功能: AI工作流、Prompt IDE、RAG、Agent、后端即服务
模型工具: LLMOps、全面的模型支持
GitHub: Dify

2.2 FastGPT

功能: RAG、应用编排
模型工具: 多模型支持（one API）
GitHub: FastGPT

2.3 bisheng（毕昇）

功能: RAG
模型工具: 模型微调（待验证）
GitHub: bisheng

2.4 其它

QAnything: 支持任意格式文件或数据库的本地知识库问答系统
AnythingLLM: 开源的企业级文档聊天机器人解决方案
LangChain-Chatchat: 基于 ChatGLM 等大语言模型与 Langchain 等应用框架实现的开源项目
quivr: 完全可控的知识库问答平台，支持docker部署
FLowise: 拖放式界面构建定制化LLM流程
GPTCache: 通过实现缓存来提高基于LLM的应用程序的效率和速度
OneAPI: API 管理和分发系统

三、智能文档解析

3.1 RAGFlow

特色: 多样化的文档智能处理，重新研发的智能文档理解系统
GitHub: RAGFlow

3.2 Unstructured

功能: 处理非结构化数据的灵活Python库
GitHub: Unstructured

3.3 PaddleOCR

功能: 提供全面且高效的文字识别和信息提取功能
GitHub: PaddleOCR

3.4 其它

EasyOCR: 友好的OCR服务
Surya: 支持超过 90 种语言的OCR识别 Surya
PDF-Extract-Kit: 内容与布局提取识别 PDF-Extract-Kit
OmniParse: 将非结构化数据解析为结构化数据 OmniParse

四、BI与DB

4.1 DB-GPT

功能: 构建大模型领域的基础设施，支持多模型管理、Text2SQL效果优化等
GitHub: DB-GPT

4.2 Chat2DB

功能: 阿里开源智能的通用数据库SQL客户端和报表工具
GitHub: Chat2DB

4.3 其它

DefogAI SQLCoder: 将自然语言问题转化为 SQL 查询
BIRD-SQL: 多位作者联合创作的SQL工具
TableAgent: 数据分析，机器学习智能体
Kyligence Copilot: 一站式指标平台的 AI 数智助理
chat2query: 支持更自然的文本指令和复杂的数据分析类的sql生成
ChatBI: 对话数据分析平台
DataHerald: 自然语言到SQL代理
superduperdb: 通用的AI开发和部署框架
Vanna: 使用AI的工具，简化数据库交互

五、本地部署工具

5.1 Ollama

功能: 在本地机器上便捷部署和运行大型语言模型
GitHub: Ollama

5.2 OpenLLM

功能: 部署大语言模型的框架，支持LangChain、BentoML和Hugging Face
GitHub: OpenLLM

5.3 其它

LM Studio: 简单的可视化LLM安装程序
Xinference: 性能强大且功能全面的分布式推理框架

六、推理服务框架

alt text

6.1 vLLM

适用场景: 适用于大批量Prompt输入，并对推理速度要求高的场景

6.2 其它

Text generation inference: 依赖HuggingFace模型
CTranslate2: 可在CPU上进行推理
Ray Serve: 稳定的Pipeline和灵活的部署
MLC LLM: 可在客户端本地部署LLM
DeepSpeed-MII: 使用DeepSpeed库来部署LLM
llama.cpp: 纯 C/C++ 实现的模型量化推理工具

七、大模型微调

7.1 LlamaFactory

功能: 零代码大模型微调平台
GitHub: LlamaFactory

八、大模型聚合平台

8.1 Hugging Face

功能: 开源的机器学习平台，托管超过320,000个模型和50,000个数据集
地址: Hugging Face

九、开发库与工具

LangChain: LLM应用开发入门工具
LlamaIndex: 数据框架，连接大型语言模型到自定义数据源
Promptflow: 微软开源的开发工具，简化基于LLM的应用开发周期

十、向量数据库

参考: Vector DB Comparison

十一、流程管理工具

n8n: 自动化流程管理工具（强烈推荐）

十一、参考学习文章

大模型：2024开源项目汇总: 链接
全栈学习资料: GitHub
AI+BI: 结合大语言模型实现对话式的智能报表系统链接