记录-Ollama模型部署调用 | 不爱吃香菜的萌新

大模型

记录-Ollama模型部署调用

字数 813阅读时长≈ 3 分钟

2025-9-6

AI智能摘要

GPT

获取文章摘要失败，请稍后再试。

URL

type

status

date

slug

summary

tags

category

icon

password

😀

本篇博客主要用于记录如何使用Ollama部署模型以及如何使用或者调用已经部署好的模型。

📝 Ollama

理论

Ollama是一种LLM模型部署服务框架。该框架简化了用户使用大模型的门槛。Ollama模型使用GG UF格式模型文件，所以伙伴们在魔塔社区和Huggingface下载的大部分模型无法直接使用，需要转换格式，或者直接下载GGUF格式的模型文件。

Linux安装

curl -fsSL https://ollama.com/install.sh | sh。有时候通过该命令无法下载成功。所以，伙伴们需要通过另外一种方式下载：

通过https://github.com/ollama/ollama/tags下载目标版本的压缩包。

notion image

解压缩包：如果下载下来的是.tgz文件，那么直接运行sudo tar -C /usr -xzf ollama-linux-amd64.tgz。如果下载下载的是.tar文件，那么需要修改原命令为sudo tar -C /usr -xvf ollama-linux-amd64.tar。
检验安装是否成功：ollama -v。这里的警告是指Ollama服务没有启动

notion image

Ollama启动服务

启动Ollama服务命令: ollama serve。这一条命了仅仅启动了Ollama框架的服务，但是没有部署对应的模型，需要我们指定对应的模型。

加载部署模型ollama run qwen2.5:0.5b。在查看模型大小时，大家可以发现ollama上的模型与modedescope以及huggingface上的模型大小不一致。这是因为ollama进行了量化处理然后采用GGUF格式存储。以下是该命令加载部署后的states：（通过/exit退出）

notion image

上面模型与用户交互的图片并不适合我们实际生产需求。我们一般是通过ollama暴露的API来调用我们已经部署好的模型。通过ollama list命令查看ollama部署了哪些模型。

notion image

🤗 本地调用已部署模型

Tips

请注意，由于这几天在学习langchain相关知识，所以这里调用API采用的是langchain框架的代码。与open_ai库实现流程相似，简单易懂。代码部分也会有相关注释，辅助大家理解。

安装 langchain

可以参考该链接https://www.langchain.com.cn/docs/how_to/installation/进行安装。总体来说只用到langchain、langchain-core、langchain-community三个包。直接使用pip install langchain langchain-core langchain-community 即可。

使用 langchain 来调用模型

Tips

请注意，作者这里只进行了本地调用，没有跨平台或服务器调用API。如果想要跨服务器调用ollama上的模型，则需要将127.0.0.1更改为你部署ollama服务器的IP地址。通过ip a即可查看到。

OllamaUseLog/UseDefaultAPI.py · LEVSONGSW/DeepLearnLog - Gitee

深度学习日志记录

OllamaUseLog/UseDefaultAPI.py · LEVSONGSW/DeepLearnLog - Gitee

https://gitee.com/levsongsw/deep-learn-log/blob/master/OllamaUseLog/UseDefaultAPI.py

OllamaUseLog/UseDefaultAPI.py · LEVSONGSW/DeepLearnLog - Gitee

代码中包含有无消息历史两种使用方法。

关闭 Ollama 服务

Ctrl + C 直接退出

通过ps aux | grep ollama 确定是否退出ollama服务

📎 参考文章

Get up and running with large language models.

https://ollama.com/

Ollama

构建一个聊天机器人 | LangChain中文网

本指南假设您对以下概念有所了解：

构建一个聊天机器人 | LangChain中文网

https://www.langchain.com.cn/docs/tutorials/chatbot/

💡

以上便是Ollama框架部署以及调用模型记录，欢迎您在底部评论区留言，一起交流~

记录-DeepSpeed框架分布式训练(一)

记录-vLLM模型部署调用

记录-vLLM模型部署调用

作者:不爱吃香菜的萌新
链接:https://hexo.levsongsw.com//largemoder/Ollama1
声明:本文采用 CC BY-NC-SA 4.0 许可协议，转载请注明出处。

相关文章

记录-Docker打包Python-Web服务

Lazy loaded image

VScode插件(一)

Lazy loaded image

Lazy loaded image

记录-NotionNext博客添加Twikoo评论插件

Lazy loaded image

记录-为什么模型推理时，显存占用分析只需要KV-Catch而没有Q-Catch

Lazy loaded image

Paper-Attention Is All You Need

Lazy loaded image

评论

Loading...

目录

你好！我是

不爱吃香菜的萌新

🎉内容输出中🎉

-- 感谢您的支持 ---

👏内容输出中👏

目录

交流频道

加入我们的社群讨论分享

点击加入社群

最新发布

Lazy loaded image

Lazy loaded image

Lazy loaded image

Lazy loaded image

Lazy loaded image

Lazy loaded image

²⁰⁹

²³

²²

²⁰

¹⁹

¹⁹

⁷

⁶

²

¹

¹

¹

文章数:

244

建站天数:

228 天