pytorch 如何finetune

2022-10-04 11:09:15

参考文章：
使用pytorch读取、使用预训练模型进行finetune：以Resnet-101为例

用pytorch实现预训练网络的finetune

局部微调

有时候我们加载了训练模型后，只想调节最后的几层，其他层不训练。其实不训练也就意味着不进行梯度计算，PyTorch中提供的requires_grad使得对训练的控制变得非常简单。

model= torchvision.models.resnet18(pretrained=True)for paramin model.parameters():
    param.requires_grad=False# 替换最后的全连接层， 改为训练100类# 新构造的模块的参数默认requires_grad为True
model.fc= nn.Linear(512,100)# 只优化最后的分类层
optimizer= optim.SGD(model.fc.parameters(), lr=1e-2, momentum=0.9)

全局微调，不同学习率

有时候我们需要对全局都进行finetune，只不过我们希望改换过的层和其他层的学习速率不一样，这时候我们可以把其他层和新层在optimizer中单独赋予不同的学习速率。比如：

ignored_params=list(map(id, model.fc.parameters()))
base_params=filter(lambda p:id(p)notin ignored_params,
                     model.parameters())

optimizer= torch.optim.SGD([{'params': base_params},{'params': model.fc.parameters(),'lr':1e-2}], lr=1e-3, momentum=0.9)

其中base_params使用1e-3来训练，model.fc.parameters使用1e-2来训练，momentum是二者共有的。

作者：xys430381_1
原文链接：https://blog.csdn.net/xys430381_1/article/details/106323439
更新时间：2022-10-04 11:09:15

相关文章

电商项目梳理步骤
电商项目业务逻辑梳理 01、首页顶部栏-logo和搜索轮播是使用一个子组
2022-07-16

pandas groupby 用法详解
1.分组groupby在日常数据分析过程中，经常有分组的需求。具体来说，就是根据一个或者多个字段，将数据划分为
2022-07-16

检测浏览器是否支持可选链操作符(?.) 和空值合并操作符(??)
在不支持可选链操作符(?.) 和空值合并操作符(??) 的老版本浏览器内执行代码的时候，会中断并抛出语法错
2022-07-16

基于Spring Boot应用ApplicationEvent
记录：276场景：利用Spring的机制发布ApplicationEvent和监听ApplicationEve
2022-07-16

随机文章

sql中join的各种用法
sql中join的用法sql中join的含义可以理解为单词“join”，用来连接两张表，join所有连接方式可
2022-06-29

Java 读写文件操作（BufferedReader和BufferedWriter）
写就是把FileReader换成FileWriterread换成write使用FileWriter时1.如果指
2022-06-29

使用map函数更换列表及表格中的数据类型
1、改变列表中数据的类型s = ['1','2','3']d = list(map(float,s))2、更改
2022-06-29

前端经典面试题-react/vue为什么不能用index做key
前言这个面试题是我在学习React框架时遇见的一道经典的前端面试题，如果你对我的React系列文章有兴趣的话，
2022-06-29

文章导航

热门标签

VPN BGP 华为 DHCP 组播 ISIS NAT 交换机 H3C 交换 TCP RADIUS LDP 链路聚合网络工程师小助手路由 QOS IPV6 IGMP CCNA视频教程 MPLS Vlan STP Wireshark PIM BGP选路 LACP IP GPON OSPF

最新文章

PHP范围解析运算符（：:)
介绍在PHP中，双冒号::定义为Scope Resolution Operator。
2023-11-18

完全删除数组中的多余元素-JavaScript
我们需要编写一个函数，该函数接受一个数组并返回一个新数组，该数组已删除了所有重复值。
2023-11-18

在不使用库函数的情况下使用真实/伪造的值展平数组-JavaScript
我们需要编写一个JavaScript数组函数，该函数接受具有伪造值的嵌套数组，并返回
2023-11-18

JavaScript在数组的伪索引处插入元素方法详解
我们需要编写一个Array函数，比如pushAtFalsy()，该函数应该包含一个数
2023-11-18

PHP整数数据类型
定义和用法在PHP中，Integer是标量数据类型，代表数字常量，代表整数，不带任何
2023-11-18

PHP错误控制运算符
介绍在PHP中，将@符号定义为错误控制运算符。当它以任何表达式为前缀时，PHP解析器
2023-11-18

PHP类型杂耍详解
定义和用法PHP被称为动态类型语言。在PHP中既不需要也不支持变量的显式类型声明。与
2023-11-18

PowerShell版本7中引入了哪些新的Null运算符？
PowerShell版本7引入了一些新的空运算符。它们如下。空合并运算符-??空条件
2023-11-18

PowerShell中$ ErrorView的用途是什么？
$Errorview变量确定PowerShell中错误消息的显示格式。在PowerS
2023-11-18

PHP执行运算符
介绍PHP中定义了一个执行运算符。一个字符串内部背蜱S（``）被视为一个DOS命令（
2023-11-18

Copyright © 2022 忙忙碌碌网
把实用的技术和经验，分享给最需要的读者，希望每一位来访的朋友都能有所收获！

文章目录