pytorch模型载入之gpu和cpu互转

2022-10-27 14:26:33

Pytorch训练模型fine-tunning、模型推理等环节常常涉及到模型加载，其中会涉及到将不同平台、版本的模型相互转化：

Case-1.载入多GPU模型

pretained_model = torch.load(’muti_gpus_model.pth‘)    # 网络+权重
# 载入为单gpu模型
gpu_model       = pretrained_model.module  # GPU-version
# 载入为cpu模型
model           = ModelArch()
pretained_dict  = pretained_model.module.state_dict()
model.load_state_dict(pretained_dict)  # CPU-version

Case-2.载入多GPU权重

model = ModelArch(para).cuda(0)   # 网络结构
model = torch.nn.DataParallel(model, device_ids=[0])  # 将model转为muit-gpus模式
checkpoint = torch.load(model_path, map_location=lambda storage, loc: storage) # 载入weights
model.load_state_dict(checkpoint)  # 用weights初始化网络
# 载入为单gpu模型
gpu_model = model.module           # GPU-version
# 载入为cpu模型
model = ModelArch(para)
model.load_state_dict(gpu_model.state_dict())
torch.save(cpu_model.state_dict(), 'cpu_mode.pth') # cpu模型存储， 注意这里的state_dict后的()必须加上，否则报'function' object has no attribute 'copy'错误

Case-3.载入CPU权重 | [inference]

# 载入为cpu版本
model = ModelArch(para)
checkpoint = torch.load(model_path, map_location=lambda storage, loc: storage) # 载入weights

# 载入为gpu版本
model = ModelArch(para).cuda()   # 网络结构
checkpoint = torch.load(model_path, map_location=lambda storage, loc: storage.cuda(0)) # 载入weights
model.load_state_dict(checkpoint)  # 用weights初始化网络

# 载入为muti-gpus版本
model = ModelArch(para).cuda()   # 网络结构
model = torch.nn.DataParallel(model, device_ids=[0, 1]) # device_ids根据自己需求改！
checkpoint = torch.load(model_path, map_location=lambda storage, loc: storage.cuda(0)) # 载入weights
model.module.load_state_dict(checkpoint)  # 用weights初始化网络

作者：_ReLU_
原文链接：https://blog.csdn.net/On_theway10/article/details/97789861
更新时间：2022-10-27 14:26:33

相关文章

用cmd运行ipython
pip install ipython后发现之前已经装好了但是用cmd无法运行。尝试了下把上图中路径里的文件打
2022-08-17

Docker maven插件方式构建微服务镜像
Docker maven插件方式构建微服务镜像有两种方式：a.maven集成构建docker镜像 b.外部构
2022-08-17

js往对象中添加属性
首先，定义一个要添加进去的属性及属性值；let obj = {'a':123};将要被添加的对象：let ob
2022-08-17

Cookie的工作原理和应用详解
Cookie的工作原理和应用详解1. Cookie 原理1.1 Cookie 背景信息1.2 Cookie 工
2022-08-17

随机文章

Elastic-Job:动态添加任务,支持动态分片
概述因项目中使用到定时任务，且服务部署多实例，因此需要解决定时任务重复执行的问题。即在同一时间点，每一个定时任
2022-06-19

springboot集成cxf启动报错DispatcherServletRegist
问题详情：Description:Parameter 1 of constructor in org.spri
2022-06-19

如何Vue.js中使用第三方库
在诸多 Vue.js 应用中, Lodash, Moment, Axios, Async等都是一些非常有用的
2022-06-19

vue引用方法ref和一个计算器效果
文章目录前言一、ref和table的特性is的用法二、使用步骤1.引入库总结前言提示：以下是本篇文章正文内容，
2022-06-19

文章导航

热门标签

VPN BGP 华为 DHCP 组播 ISIS NAT 交换机 H3C 交换 TCP RADIUS LDP 链路聚合网络工程师小助手路由 QOS IPV6 IGMP CCNA视频教程 MPLS Vlan STP Wireshark PIM BGP选路 LACP IP GPON OSPF

最新文章

PHP范围解析运算符（：:)
介绍在PHP中，双冒号::定义为Scope Resolution Operator。
2023-11-18

完全删除数组中的多余元素-JavaScript
我们需要编写一个函数，该函数接受一个数组并返回一个新数组，该数组已删除了所有重复值。
2023-11-18

在不使用库函数的情况下使用真实/伪造的值展平数组-JavaScript
我们需要编写一个JavaScript数组函数，该函数接受具有伪造值的嵌套数组，并返回
2023-11-18

JavaScript在数组的伪索引处插入元素方法详解
我们需要编写一个Array函数，比如pushAtFalsy()，该函数应该包含一个数
2023-11-18

PHP整数数据类型
定义和用法在PHP中，Integer是标量数据类型，代表数字常量，代表整数，不带任何
2023-11-18

PHP错误控制运算符
介绍在PHP中，将@符号定义为错误控制运算符。当它以任何表达式为前缀时，PHP解析器
2023-11-18

PHP类型杂耍详解
定义和用法PHP被称为动态类型语言。在PHP中既不需要也不支持变量的显式类型声明。与
2023-11-18

PowerShell版本7中引入了哪些新的Null运算符？
PowerShell版本7引入了一些新的空运算符。它们如下。空合并运算符-??空条件
2023-11-18

PowerShell中$ ErrorView的用途是什么？
$Errorview变量确定PowerShell中错误消息的显示格式。在PowerS
2023-11-18

PHP执行运算符
介绍PHP中定义了一个执行运算符。一个字符串内部背蜱S（``）被视为一个DOS命令（
2023-11-18

Copyright © 2022 忙忙碌碌网
把实用的技术和经验，分享给最需要的读者，希望每一位来访的朋友都能有所收获！

文章目录