pytorch：fine-tune 预训练模型

2022-10-25 13:57:37

如何 fine-tune

以 resnet18 为例：

from torchvision import models
from torch import nn
from torch import optim

resnet_model = models.resnet18(pretrained=True) 
# pretrained 设置为 True，会自动下载模型 所对应权重，并加载到模型中
# 也可以自己下载 权重，然后 load 到 模型中，源码中有 权重的地址。

# 假设 我们的 分类任务只需要 分 100 类，那么我们应该做的是
# 1. 查看 resnet 的源码
# 2. 看最后一层的 名字是啥 （在 resnet 里是 self.fc = nn.Linear(512 * block.expansion, num_classes)）
# 3. 在外面替换掉这个层
resnet_model.fc= nn.Linear(in_features=..., out_features=100)

# 这样就可以了，修改后的模型除了输出层的参数是 随机初始化的，其他层都是用预训练的参数初始化的。

# 如果只想训练最后一层，应该做的是：
# 1. 将其它层的参数 requires_grad 设置为 False
# 2. 构建一个 optimizer， optimizer 管理的参数只有最后一层的参数
# 3. 然后 backward， step 就可以了

# 这一步可以节省大量的时间，因为多数的参数不需要计算梯度
for para in list(resnet_model.parameters())[:-1]:
    para.requires_grad=False 

optimizer = optim.SGD(params=[resnet_model.fc.weight,
                              resnet_model.fc.bias], 
                              lr=1e-3)

为什么

这里介绍下运行resnet_model.fc= nn.Linear(in_features=..., out_features=100)时框架内发生了什么

这时应该看nn.Module 源码的__setattr__ 部分，因为setattr 时都会调用这个方法：

def __setattr__(self, name, value):
    def remove_from(*dicts):
        for d in dicts:
            if name in d:
                del d[name]

首先映入眼帘就是 remove_from 这个函数，这个函数的目的就是，如果出现了同名的属性，就将旧的属性移除。用刚才举的例子就是：

预训练的模型中有个名字叫fc 的 Module。
在类定义外，我们将另一个 Module 重新赋值给了 fc。
类定义内的 fc 对应的 Module 就会从模型中删除。

作者：Ginkgo__
原文链接：https://blog.csdn.net/weixin_42135399/article/details/102881112
更新时间：2022-10-25 13:57:37

相关文章

解决springboot2.5.6版本 websocket跨域的问题
1.springboot升级版本以后websocket连接出现以下错误: java.lang.IllegalA
2022-06-24

mysql有data文件夹恢复数据的方法
重要的是红字!!!!!!mysql--1146--报错先找到数据库存放地址,即Data文件夹(复制留下来)再用
2022-06-24

textarea 实现关键字变色
&lt;!DOCTYPE html&gt;&lt;html&gt;&l
2022-06-24

Python请求标准库 urllib 与 urllib3
Python请求标准库 urllib 与 urllib3 学习一时爽，一直学习一直爽！大
2022-06-24

随机文章

df.fillna()函数，参数method中pad’, ‘ffill’,‘back
DataFrame.fillna(value=None,method=None,axis=None,inpla
2022-09-09

Java多线程并发容器
从Vector到Queue的发展代码解释：有一万张车票，分10个窗口卖票（也就是10个线程），看看各种容器在这
2022-09-10

python 的时间格式
今天用到python 的时间格式了，写下来留给自己，也分享给大家取得时间相关的信息的话，要用到python t
2022-09-10

Python列表类型性能测试以及内置字典操作的时间复杂度分析
timeit模块timeit模块可以用来测试一小段Python代码的执行速度。class timeit.Tim
2022-09-10

文章导航

热门标签

VPN BGP 华为 DHCP 组播 ISIS NAT 交换机 H3C 交换 TCP RADIUS LDP 链路聚合网络工程师小助手路由 QOS IPV6 IGMP CCNA视频教程 MPLS Vlan STP Wireshark PIM BGP选路 LACP IP GPON OSPF

最新文章

PHP范围解析运算符（：:)
介绍在PHP中，双冒号::定义为Scope Resolution Operator。
2023-11-18

完全删除数组中的多余元素-JavaScript
我们需要编写一个函数，该函数接受一个数组并返回一个新数组，该数组已删除了所有重复值。
2023-11-18

在不使用库函数的情况下使用真实/伪造的值展平数组-JavaScript
我们需要编写一个JavaScript数组函数，该函数接受具有伪造值的嵌套数组，并返回
2023-11-18

JavaScript在数组的伪索引处插入元素方法详解
我们需要编写一个Array函数，比如pushAtFalsy()，该函数应该包含一个数
2023-11-18

PHP整数数据类型
定义和用法在PHP中，Integer是标量数据类型，代表数字常量，代表整数，不带任何
2023-11-18

PHP错误控制运算符
介绍在PHP中，将@符号定义为错误控制运算符。当它以任何表达式为前缀时，PHP解析器
2023-11-18

PHP类型杂耍详解
定义和用法PHP被称为动态类型语言。在PHP中既不需要也不支持变量的显式类型声明。与
2023-11-18

PowerShell版本7中引入了哪些新的Null运算符？
PowerShell版本7引入了一些新的空运算符。它们如下。空合并运算符-??空条件
2023-11-18

PowerShell中$ ErrorView的用途是什么？
$Errorview变量确定PowerShell中错误消息的显示格式。在PowerS
2023-11-18

PHP执行运算符
介绍PHP中定义了一个执行运算符。一个字符串内部背蜱S（``）被视为一个DOS命令（
2023-11-18

Copyright © 2022 忙忙碌碌网
把实用的技术和经验，分享给最需要的读者，希望每一位来访的朋友都能有所收获！

文章目录