Pytorch buffer(register_buffer)

2022-10-10 08:09:55

回顾模型保存：torch.save(model.state_dict())，其中model.state_dict()是一个字典，里边存着我们模型各个部分的参数。在model中，我们需要更新其中的参数，训练结束将参数保存下来。但在某些时候，我们可能希望模型中的某些参数参数不更新（从开始到结束均保持不变），但又希望参数保存下来（model.state_dict() ），这是我们就会用到 register_buffer()
即
模型中需要保存下来的参数包括两种:
一种是反向传播需要被optimizer更新的，称之为 parameter
一种是反向传播不需要被optimizer更新，称之为 buffer
第一种参数我们可以通过model.parameters() 返回；第二种参数我们可以通过model.buffers() 返回。因为我们的模型保存的是state_dict 返回的OrderDict，所以这两种参数不仅要满足是否需要被更新的要求，还需要被保存到OrderDict。
import torch
from torch import nn

class MyModule(nn.Module):
    def __init__(self, input_size, output_size):
        super(MyModule, self).__init__()
        self.register_buffer('test',torch.rand(input_size, output_size))
        self.linear = nn.Linear(input_size, output_size)
    def forward(self, x):
        return self.linear(x)

model = MyModule(4, 2)
print(list(model.buffers()))
print(list(model.named_buffers()))
输出model.state_dict()会包含buffer的
import torch
from torch import nn
 
class MyModule(nn.Module):
    def __init__(self, input_size, output_size):
        super(MyModule, self).__init__()
        self.register_buffer('test',torch.rand(input_size, output_size))
        self.linear = nn.Linear(input_size, output_size)
    def forward(self, x):
        return self.linear(x)
 
model = MyModule(4, 2)
print(model.state_dict())

作者：hxxjxw
原文链接：https://blog.csdn.net/hxxjxw/article/details/123945850
更新时间：2022-10-10 08:09:55

相关文章

Python 错误和异常概念
1
2022-08-21

js获取各种浏览器窗口滚动坐标
获取各种浏览器窗口滚动坐标返回结果如：{x:0 ,y:100 }function getScrollOff
2022-08-21

(36行代码)javascript实现简单的计算器
话不多说我们上代码<!DOCTYPE html><html> <head>
2022-08-21

全局异常处理Seata事务失效解决方案
全局异常处理Seata事务失效解决方案最近的项目用到了seata来管理全局事务，在进行测试的时候，发现当s
2022-08-21

随机文章

Java对象序列化详解
所有分布式应用常常需要跨平台，跨网络，因此要求所有传的参数、返回值都必须实现序列化。一、定义　　序列化：把Ja
2022-07-26

如何正确停止线程，守护线程，volatile关键字与synchronized关键字详
一，从jdk1.2开始,以下几个关于线程的方法就不提倡使用了：1，停止线程:public void stop(
2022-07-26

Dialog 不能全屏，左右有间距解决方案
extends Dialog全屏、或者自定义间距.win.getDecorView().setPadding(
2022-07-26

Java基础-4-IO流与文件处理，序列化与反射
1 IO流1.1 各种流抽象基类：InputStream / OutputStream / Reader /
2022-07-26

文章导航

热门标签

VPN BGP 华为 DHCP 组播 ISIS NAT 交换机 H3C 交换 TCP RADIUS LDP 链路聚合网络工程师小助手路由 QOS IPV6 IGMP CCNA视频教程 MPLS Vlan STP Wireshark PIM BGP选路 LACP IP GPON OSPF

最新文章

PHP范围解析运算符（：:)
介绍在PHP中，双冒号::定义为Scope Resolution Operator。
2023-11-18

完全删除数组中的多余元素-JavaScript
我们需要编写一个函数，该函数接受一个数组并返回一个新数组，该数组已删除了所有重复值。
2023-11-18

在不使用库函数的情况下使用真实/伪造的值展平数组-JavaScript
我们需要编写一个JavaScript数组函数，该函数接受具有伪造值的嵌套数组，并返回
2023-11-18

JavaScript在数组的伪索引处插入元素方法详解
我们需要编写一个Array函数，比如pushAtFalsy()，该函数应该包含一个数
2023-11-18

PHP整数数据类型
定义和用法在PHP中，Integer是标量数据类型，代表数字常量，代表整数，不带任何
2023-11-18

PHP错误控制运算符
介绍在PHP中，将@符号定义为错误控制运算符。当它以任何表达式为前缀时，PHP解析器
2023-11-18

PHP类型杂耍详解
定义和用法PHP被称为动态类型语言。在PHP中既不需要也不支持变量的显式类型声明。与
2023-11-18

PowerShell版本7中引入了哪些新的Null运算符？
PowerShell版本7引入了一些新的空运算符。它们如下。空合并运算符-??空条件
2023-11-18

PowerShell中$ ErrorView的用途是什么？
$Errorview变量确定PowerShell中错误消息的显示格式。在PowerS
2023-11-18

PHP执行运算符
介绍PHP中定义了一个执行运算符。一个字符串内部背蜱S（``）被视为一个DOS命令（
2023-11-18

Copyright © 2022 忙忙碌碌网
把实用的技术和经验，分享给最需要的读者，希望每一位来访的朋友都能有所收获！

文章目录