有时候我们在模型中需要定义一些常量参数,比如自定义高斯模糊核的weight。我们希望在主函数中使用 .cuda() 将模型转到 gpu 上时,能够自动将常量参数也转到 gpu 上,但又不希望模型更新这些常量参数。为了达到这个目的,有两种实现方法:
- 使用
nn.Parameter(xxx, requires_grad=False)
classMyModel(nn.Module):def__init__():super(MyModel, self).__init__()
kernel= torch.rand(5,5)# 假设 kernel 为定义的常量参数
self.weight= nn.Parameter(kernel, requires_grad=False)
- 使用
self.register_buffer('name', xxx)
, 后续可用self.name
来访问定义的常量参数
classMyModel(nn.Module):def__init__():super(MyModel, self).__init__()
kernel= torch.rand(5,5)# 假设 kernel 为定义的常量参数
self.register_buffer('weight', kernel)