news 2026/4/3 4:49:09

ollama本地安装与大模型与DeepSeek模型调用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ollama本地安装与大模型与DeepSeek模型调用

Ollama 本地部署 Deepseek R1 模型

概念

  • Ollama是在Github上的一个开源项目,其项目定位是:一个本地运行大模型的集成框架;
  • 目前主要针对主流的LLaMA架构的开源大模型设计,通过将模型权重、配置文件和必要数据封装进由Modelfile定义的包中,从而实现大模型的下载、启动和本地运行的自动化部署及推理流程;
  • 此外,Ollama内置了一系列针对大模型运行和推理的优化策略,目前作为一个非常热门的大模型托管平台,基本主流的大模型应用开发框架如LangChainAutoGenMicrosoft GraphRAG及热门项目AnythingLLMOpenWebUI等高度集成。

Ollama官方地址:https://ollama.com/

Ollama Github开源地址:https://github.com/ollama/ollama

Ollama项目本地安装

windows电脑直接点击ollama下载按钮就可以安装好一个命令行界面。

在这里我们不细讲,我们主要是看任何在linux系统中安装ollama。

我们可以执行以下命令来对ollama进行安装

curl -fsSL https://ollama.com/install.sh | sh

这个过程会比较慢,拉取的文件约2G左右,如果安装过程中未出现任何错误信息,通常情况下能够表明安装已成功。可以通过执行以下命令来检查Ollama服务的运行状态:

systemctl status ollama

我们可以使用以下命令来查看ollama的版本

sudo ollama -v

Ollama部署DeepSeek


我们可以使用以下命令下载DeepSeek

ollama run deepseek-r1:1.5b

此外我们可以使用ollama list ,查看ollama的模型列表

使用DeepSeek

Ollama的机制中,使用run命令时,系统会首先检查本地是否已经存在指定的模型,如果本地没有找到该模型,Ollama会自动执行ollama pull <model_name>命令,从远程仓库下载该模型,下载完成后将模型存储为GGUF格式,供后续使用。最后,当成功下载后,Ollama会继续执行run命令,启动模型并进行推理或生成任务。

这里要重点说明两点:其一是DeepSeek R1作为推理模型,其返回结果是包含的,里面包含的是思考推理的内容;其二也会存在中为空,这其实是因为DeepSeek-R1系列模型倾向于绕过思维模式(即输出” \ n \ n ”),因此一个使用的技巧是:每个输出的开头强制模型以 “\n” 开头。(此问题我们在代码环节在给大家讲解实现的方式)

多GPU部署级Server启动

如果想加载多张显卡且做到负载均衡,可以去修改ollamaSystemD配置服务,首先找到当前服务器上GPUID,执行命令如下:

nvidia-smi

如果想加载多张显卡且做到负载均衡,可以去修改ollamaSystemD配置服务,执行如下代码:

systemctl edit ollama.service

编辑并填写如下内容:

Environment="CUDA_VISIBLE_DEVICES=0,1,2,3" # 这里根据你自己实际的 GPU标号来进行修改 Environment="OLLAMA_SCHED_SPREAD=1" # 这个参数是做负载均衡

保存退出后,重新加载systemd并重新启动Ollama服务使其配置生效,执行如下命令:

systemctl daemon-reload systemctl restart ollama

Ollama Rest Api 服务启动及其调用

fromopenaiimportOpenAI client=OpenAI(base_url='http://localhost:11434/v1/',api_key='ollama',# 这里随便写,但是api_key字段一定要有)chat_completion=client.chat.completions.create(model='deepseek-r1:1.5b',# 这里要修改成 你 ollama 启动模型的名称messages=[{'role':'user','content':'你好,请你介绍一下你自己',}],)print(chat_completion)

这里需要注意的一点是:如果Ollama启动和执行调用的代码是同一台机器,上述代码是可以的跑通的。比如Ollama服务在云服务器、局域网的服务器上等情况,则无法通过http://localhost:11434/v1/来进行访问,因为网络不通。 正如上述的报错,我的Ollama模型服务是在局域网的服务器上,因此我需要修改Ollama REST API的请求地址,操作方法如下:

修改ollamaSystemD配置服务,执行如下代码:

systemctl edit ollama.service

编辑并填写如下内容:

Environment="OLLAMA_HOST=0.0.0.0:11434"

保存退出后,重新加载systemd并重新启动Ollama服务使其配置生效,执行如下命令:

systemctl daemon-reload systemctl restart ollama

ollama基本命令

命令描述
serve启动 Ollama 服务
create从 Modelfile 创建一个模型
show显示模型的信息
run运行一个模型
stop停止正在运行的模型
pull从注册表中拉取一个模型
push将一个模型推送到注册表
list列出所有模型
ps列出正在运行的模型
cp复制一个模型
rm删除一个模型
help显示关于任何命令的帮助信息

通过上述关于Ollama的安装、模型下载及启动推理的介绍和实践,我们可以感受到Ollama极大地简化了大模型部署的过程,也降低了大模型在使用上的技术门槛。然而,对大部分用户而言,命令行界面并不够友好。正如我们之前提到的,在大模型的应用开发框架下,使用到的往往是其API调用形式,为此,Ollama也是可以集成多个开源项目,包括Web界面、桌面应用和终端工具等方式提升使用体验,并满足满足不同用户的偏好和需求。

我们可以感受到Ollama极大地简化了大模型部署的过程,也降低了大模型在使用上的技术门槛。然而,对大部分用户而言,命令行界面并不够友好。正如我们之前提到的,在大模型的应用开发框架下,使用到的往往是其API调用形式,为此,Ollama也是可以集成多个开源项目,包括Web界面、桌面应用和终端工具等方式提升使用体验,并满足满足不同用户的偏好和需求。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/23 19:30:35

图神经网络分享系列-GGNN(GATED GRAPH SEQUENCE NEURAL NETWORKS)(三)

目录 七、相关研究 八、讨论 GG-NN模型学到了什么&#xff1f; 逻辑推理与模型学习的对比 任务编码与背景知识 实验结果与局限性 动态推理优化 未来应用展望 A 收缩映射示例 限制更新以定义欧几里得度量下的收缩映射 GNN模型中的节点标签与信息传播 信息衰减与长程依…

作者头像 李华
网站建设 2026/3/28 22:05:49

机房U位管理别瞎忙!这套系统让运维效率翻倍

作为常年深耕机房运维领域的博主&#xff0c;后台最多的吐槽莫过于U位管理的糟心事&#xff1a;“机柜里U位乱得像麻花&#xff0c;找个位置要扒半天线缆”“人工登记的U位信息过时&#xff0c;新增设备误占用引发故障”“跨机柜调配资源&#xff0c;来回核对耗时耗力”……机房…

作者头像 李华
网站建设 2026/4/2 20:00:17

Python大数据项目推荐:基于Hadoop+Spark电商用户行为分析毕设 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘

✍✍计算机编程指导师 ⭐⭐个人介绍&#xff1a;自己非常喜欢研究技术问题&#xff01;专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目&#xff1a;有源码或者技术上的问题欢迎在评论区一起讨论交流&#xff01; ⚡⚡如果你遇到具体的…

作者头像 李华
网站建设 2026/3/25 10:30:10

2023年NOC大赛创客智慧编程赛项Python复赛模拟题(一)

更多内容和历年真题请查看网站&#xff1a;【试卷中心 -----> NOC ----> Python ----> 复赛】 网站链接 青少年软件编程历年真题模拟题实时更新 2023年NOC大赛创客智慧编程赛项Python复赛模拟题&#xff08;一&#xff09; 一、编程题 第 1 题 NOC大赛创客智慧…

作者头像 李华
网站建设 2026/3/28 18:40:12

从FT到DFT

1. 核心世界观&#xff1a;两个平行宇宙傅里叶变换&#xff08;DFT&#xff09;是连接这两个宇宙的传送门&#xff1a;左边&#xff1a;时域 (Time Domain)这是我们生活的世界。信号随时间变化&#xff08;比如麦克风录到的电压波动&#xff09;。主角&#xff1a; &#xff08…

作者头像 李华