pytorch使用（五）使用pytorch进行微调（fine-tuning）

2022-09-24 14:37:16

pytorch使用：目录

pytorch使用（五）使用pytorch进行微调（fine-tuning）

在使用pytorch的时候，发现使用预训练的模型进行微调的时候有比较难的两步，一是如何加载需要的两部分模型

1. 定义网络并且加载网络参数

首先定义自己模型并且加载预训练网络的模型和参数，定义自己模型的时候把想要用的层名字设置为和预训练模型一样的
加载预训练模型中的参数到自己的模型

#load the pre-trained network
model_zero = C3D()
model_zero.load_state_dict(torch.load(paraPath))

model = ROI_C3D(classes=para['nClass'])#ROI_C3Dis my net
model_dict = model.state_dict()

model_zero = {k: vfor k, vin model_zero.state_dict().items()if kin model_dict}
model_dict.update(model_zero)
model.load_state_dict(model_dict)

2. 设置学习率

通常预训练层的学习率会低一些. 在下面这个例子中，在定义网络的时候，相比原来的模型，将最后一个全连接的名字改为了classifier

#set optimizationmethodignored_params =list(map(id, model.classifier.parameters())) #layerneedtobetrainedbase_params =filter(lambda p: id(p)notinignored_params,model.parameters())optimizer =optim.SGD([
    {'params': base_params},
    {'params': model.classifier.parameters(), 'lr': para['lr']*0.1}],0.001, momentum=0.9, weight_decay=1e-4)

这样预训练的模型学习率是0.0001，而最后一个全连接是0.001

作者：贪泉觉爽
原文链接：https://blog.csdn.net/GYGuo95/article/details/79945631
更新时间：2022-09-24 14:37:16

相关文章

container_of的函数用法总结
首先看看函数的原型：#define container_of(ptr, type, member) ({
2022-07-10

mybatis insert foreach
项目场景：报错，找不到参数org.mybatis.spring.MyBatisSystemException
2022-07-11

MakeFile 学习日记（C++）makeFile简介
一、简略说一下为什么要学习Make File，并且把它单独划分作为一个专栏：大学学习期间，我对于Mak
2022-07-11

Spark在Windows下的环境搭建
由于Spark是用Scala来写的，所以Spark对Scala肯定是原生态支持的，因此这里以Scala为主来介
2022-07-11

随机文章

Mac GoLand安装后打不开（闪退）
问题：Mac GoLand安装后打不开（闪退）解决：删除 /Users/lq/Library/Applicat
2022-10-29

springboot实现定时任务基于@Scheduled注解
在平常的开发工作中，我们经常会用到定时任务，比如定时刷新数据，定时去执行某个业务操作，定时任务，我们经常使用，
2022-10-29

python3 requests基础使用教程
最近换了新工作，从Android测试转到web测试，接口自动化也从java转成了python，最近也在一直学习
2022-10-29

@RequestBody 和 @RequestParam可以同时使用
@RequestParam和@RequestBody这两个注解是可以同时使用的。网上有很多博客说@Reques
2022-10-29

文章导航

热门标签

VPN BGP 华为 DHCP 组播 ISIS NAT 交换机 H3C 交换 TCP RADIUS LDP 链路聚合网络工程师小助手路由 QOS IPV6 IGMP CCNA视频教程 MPLS Vlan STP Wireshark PIM BGP选路 LACP IP GPON OSPF

最新文章

PHP范围解析运算符（：:)
介绍在PHP中，双冒号::定义为Scope Resolution Operator。
2023-11-18

完全删除数组中的多余元素-JavaScript
我们需要编写一个函数，该函数接受一个数组并返回一个新数组，该数组已删除了所有重复值。
2023-11-18

在不使用库函数的情况下使用真实/伪造的值展平数组-JavaScript
我们需要编写一个JavaScript数组函数，该函数接受具有伪造值的嵌套数组，并返回
2023-11-18

JavaScript在数组的伪索引处插入元素方法详解
我们需要编写一个Array函数，比如pushAtFalsy()，该函数应该包含一个数
2023-11-18

PHP整数数据类型
定义和用法在PHP中，Integer是标量数据类型，代表数字常量，代表整数，不带任何
2023-11-18

PHP错误控制运算符
介绍在PHP中，将@符号定义为错误控制运算符。当它以任何表达式为前缀时，PHP解析器
2023-11-18

PHP类型杂耍详解
定义和用法PHP被称为动态类型语言。在PHP中既不需要也不支持变量的显式类型声明。与
2023-11-18

PowerShell版本7中引入了哪些新的Null运算符？
PowerShell版本7引入了一些新的空运算符。它们如下。空合并运算符-??空条件
2023-11-18

PowerShell中$ ErrorView的用途是什么？
$Errorview变量确定PowerShell中错误消息的显示格式。在PowerS
2023-11-18

PHP执行运算符
介绍PHP中定义了一个执行运算符。一个字符串内部背蜱S（``）被视为一个DOS命令（
2023-11-18

Copyright © 2022 忙忙碌碌网
把实用的技术和经验，分享给最需要的读者，希望每一位来访的朋友都能有所收获！

文章目录