pytorch 模型训练的多GPU训练

2022-10-17 14:38:44

pytorch针对多GPU训练提供了两个类来实现多GPU训练，分别是torch.nn.DataParallel和torch.nn.parallel.DistributedDataParallel，因为torch.nn.DataParallel相对比较简单，因此先介绍torch.nn.DataParallel。

当使用torch.nn.DataParallel的时候，数据会分配到各个GPU中，完成前向计算，然后再汇总到主卡计算loss，进行反向传播。显然，这种方式会使得多个GPU之间负载不均衡。

torch.nn.DataParallel具体的使用方法

model = BERTModel(pretrain_name,vocab_size)
device_ids = [0,1] #指定使用的显卡id
model = nn.DataParallel(model,device_ids=device_ids).to(device_ids[0]) # 多卡训练，用device_ids[0]只是定义一个样式，不需要逐卡指定设备。但没这一步会报错。数据的batch_size为单卡的batch_size*len(devices)

trainer = torch.optim.Adam(model.parameters(),lr=1e-3)
trainer = nn.DataParallel(trainer,device_ids=device_ids)

注意device_ids 为指定需要训练的GPU，以上的几行代码可以实现模型和优化器都放到GPU中，记得在进行训练的时候，数据也要放到GPU中，只需要将数据的tensor.cuda(device_ids[0]) 即可。torch.nn.DataParallel模块会自动将数据都分发到各个GPU中进行计算。

作者：qq_28935065
原文链接：https://blog.csdn.net/qq_28935065/article/details/125483086
更新时间：2022-10-17 14:38:44

相关文章

C/C++函数调用约定
关于 C/C++ 函数调用约定，大多数时候并不会影响程序逻辑，但遇到跨语言编程时，了解一下还是有好处的。VC
2022-07-17

java中方法
Java中的方法 == C语言中的函数如果一个代码需要重复使用（每一次调用的数据不同）方法：调用/invoke
2022-07-17

FAQ：redis key/value 前面出现\xAC\xED\x00\x05t\
1.问题现象：最近使用spring-data-redis 和jedis 操作redis时发现存储在redis中
2022-07-17

android开发问题
1、Warning: there were 3 instances of library classes de
2022-07-17

随机文章

java数据迁移程序
环境:mysql 目标:亿级数据迁移最终耗时:1-2小时(服务器更佳)，建议在晚上或者没人访问的情况下操作思
2022-09-18

java代码写插入语句,Java数据库之插入记录
插入数据表记录有3种方案一.使用Statement对象实现插入数据表记录的SQL语句的语法是：insert i
2022-09-18

python数值分析-NumPy的学习笔记
Table of Contentsnumypy向量加法NumPy 基础数组对象指定类型自定义数据类型数组的切片
2022-09-18

PyCharm 使用服务器环境运行Flask项目
文章别名：CentOS使用virtualenv搭建独立的Python环境-python虚拟环境virtuale
2022-09-18

文章导航

热门标签

VPN BGP 华为 DHCP 组播 ISIS NAT 交换机 H3C 交换 TCP RADIUS LDP 链路聚合网络工程师小助手路由 QOS IPV6 IGMP CCNA视频教程 MPLS Vlan STP Wireshark PIM BGP选路 LACP IP GPON OSPF

最新文章

PHP范围解析运算符（：:)
介绍在PHP中，双冒号::定义为Scope Resolution Operator。
2023-11-18

完全删除数组中的多余元素-JavaScript
我们需要编写一个函数，该函数接受一个数组并返回一个新数组，该数组已删除了所有重复值。
2023-11-18

在不使用库函数的情况下使用真实/伪造的值展平数组-JavaScript
我们需要编写一个JavaScript数组函数，该函数接受具有伪造值的嵌套数组，并返回
2023-11-18

JavaScript在数组的伪索引处插入元素方法详解
我们需要编写一个Array函数，比如pushAtFalsy()，该函数应该包含一个数
2023-11-18

PHP整数数据类型
定义和用法在PHP中，Integer是标量数据类型，代表数字常量，代表整数，不带任何
2023-11-18

PHP错误控制运算符
介绍在PHP中，将@符号定义为错误控制运算符。当它以任何表达式为前缀时，PHP解析器
2023-11-18

PHP类型杂耍详解
定义和用法PHP被称为动态类型语言。在PHP中既不需要也不支持变量的显式类型声明。与
2023-11-18

PowerShell版本7中引入了哪些新的Null运算符？
PowerShell版本7引入了一些新的空运算符。它们如下。空合并运算符-??空条件
2023-11-18

PowerShell中$ ErrorView的用途是什么？
$Errorview变量确定PowerShell中错误消息的显示格式。在PowerS
2023-11-18

PHP执行运算符
介绍PHP中定义了一个执行运算符。一个字符串内部背蜱S（``）被视为一个DOS命令（
2023-11-18

Copyright © 2022 忙忙碌碌网
把实用的技术和经验，分享给最需要的读者，希望每一位来访的朋友都能有所收获！

文章目录