记录-lmdeploy模型部署调用 | 不爱吃香菜的萌新

大模型

记录-lmdeploy模型部署调用

字数 297阅读时长≈ 1 分钟

2025-9-6

AI智能摘要

GPT

获取文章摘要失败，请稍后再试。

URL

type

status

date

slug

summary

tags

category

icon

password

😀

该篇博客主要记录部署lmdeploy推理框架、模型部署以及本地模型交互。

📝 LMDeploy

LMDeploy 安装

pip install lmdeploy

启动LMDeploy服务

lmdeploy serve api_serve 服务器上模型路径

lmdeploy server

查看lmdeploy上已部署的模型

curl -X 'GET' 'http://localhost:23333/v1/models'。从图片中反馈的结果："id":"/hy-tmp/model/Qwen/Qwen2.5-0.5B-Instruct"，id的值便是model_name。

notion image

🤗 本地调用已部署模型

Tips

请注意，由于这几天在学习langchain相关知识，所以这里调用API采用的是langchain框架的代码。与open_ai库实现流程相似，简单易懂。代码部分也会有相关注释，辅助大家理解。

安装 langchain

可以参考该链接https://www.langchain.com.cn/docs/how_to/installation/进行安装。总体来说只用到langchain、langchain-core、langchain-community三个包。直接使用pip install langchain langchain-core langchain-community 即可。

使用 langchain 来调用模型

LMDeployUseLog/UseDefaultAPI.py · LEVSONGSW/DeepLearnLog - Gitee

深度学习日志记录

LMDeployUseLog/UseDefaultAPI.py · LEVSONGSW/DeepLearnLog - Gitee

https://gitee.com/levsongsw/deep-learn-log/blob/master/LMDeployUseLog/UseDefaultAPI.py

LMDeployUseLog/UseDefaultAPI.py · LEVSONGSW/DeepLearnLog - Gitee

📎 参考文章

快速开始 — lmdeploy

在构造 pipeline 时，如果没有指定使用 TurboMind 引擎或 PyTorch 引擎进行推理，LMDeploy 将根据它们各自的能力自动分配一个，默认优先使用 TurboMind 引擎。

快速开始 — lmdeploy

https://lmdeploy.readthedocs.io/zh-cn/latest/get_started/get_started.html

构建一个聊天机器人 | LangChain中文网

本指南假设您对以下概念有所了解：

构建一个聊天机器人 | LangChain中文网

https://www.langchain.com.cn/docs/tutorials/chatbot/

构建一个聊天机器人 | LangChain中文网

💡

以上便是部署LMDeploy、模型部署以及本地模型交互学习记录，欢迎您在底部评论区留言，一起交流~

记录-vLLM模型部署调用

记录-LLaMA-Factory基础

记录-LLaMA-Factory基础

作者:不爱吃香菜的萌新
链接:https://hexo.levsongsw.com//largemoder/LMDeploy1
声明:本文采用 CC BY-NC-SA 4.0 许可协议，转载请注明出处。

相关文章

记录-Docker打包Python-Web服务

Lazy loaded image

VScode插件(一)

Lazy loaded image

Lazy loaded image

记录-NotionNext博客添加Twikoo评论插件

Lazy loaded image

记录-为什么模型推理时，显存占用分析只需要KV-Catch而没有Q-Catch

Lazy loaded image

Paper-Attention Is All You Need

Lazy loaded image

评论

Loading...

目录

你好！我是

不爱吃香菜的萌新

🎉内容输出中🎉

-- 感谢您的支持 ---

👏内容输出中👏