Pytorch 模型中定义常量参数

2022-10-26 10:19:48

有时候我们在模型中需要定义一些常量参数，比如自定义高斯模糊核的weight。我们希望在主函数中使用 .cuda() 将模型转到 gpu 上时，能够自动将常量参数也转到 gpu 上，但又不希望模型更新这些常量参数。为了达到这个目的，有两种实现方法：

使用nn.Parameter(xxx, requires_grad=False)

classMyModel(nn.Module):def__init__():super(MyModel, self).__init__()
		kernel= torch.rand(5,5)# 假设 kernel 为定义的常量参数
		self.weight= nn.Parameter(kernel, requires_grad=False)

使用self.register_buffer('name', xxx), 后续可用self.name 来访问定义的常量参数

classMyModel(nn.Module):def__init__():super(MyModel, self).__init__()
		kernel= torch.rand(5,5)# 假设 kernel 为定义的常量参数
		self.register_buffer('weight', kernel)

作者：_Suraimu_
原文链接：https://blog.csdn.net/qq_39546227/article/details/124909707
更新时间：2022-10-26 10:19:48

相关文章

MySQL中 in 和 exists 的区别
为什么说MySQL中，外表大用in，内表大用exists？EXISTSexists表示存在，它常常和子查询配合
2022-10-10

Node.js 获取GET、POST提交的数据
表单提交过来的数据有两种方法，一种是GET方式提交，这种提交方法会把表单需要传输的数据写在url上，一起带过去
2022-10-10

C# 拼接Json串的几种方法与解析
C#定义多行字符串的方式在定义的前面加上@符号：1 string aa = @"asd
2022-10-10

使用pydub读取音频的正确打开方式，纯小白也能看明白！
一、背景很多运营小giegie都需要根据录音的停顿进行音频剪辑，我们完全可以借助一些现成的软件解决。但是，这个
2022-10-10

随机文章

使用query禁用、启用按钮（button）
我们有时候有这样的需求，当我们点击按钮以后，需要把它设为不可点击的状态，然后用的时候也需要把它设置为可点击的状
2022-06-21

Spring Boot 实现国际化消息提示
InternationalizationSpring Boot国际化信息(i18n)示例。官方文档：boot-
2022-06-21

dubbo全链路日志追踪实践
dubbo全链路日志追踪实践想做到日志完整的链路追踪,实现原理很简单,为每一个请求创造一个唯一标识(trace
2022-06-21

idea启动Java web项目
idea启动Java web项目导入Java web项目进入project structure中1、按F4可进
2022-06-21

文章导航