为什么要使用预训练模型

2022-09-28 09:19:55

当然是因为自己从头训练（所有权重随机初始化）太费时费力了

当我们用卷积神经网络训练自己的数据得到图片分类器时，会发现网络大多数结构包括convolution layers， pooling layers等是用来提取图片特征的，在这些layers的开始部分，提取的特征是相当泛化的，比如说边缘特征、色块特征。越到后面的layers，提取的特征越具有特殊性，例如ImageNet 数据集包含了许多不同品种的狗，到后面的layers便具备了狗的一些共有特征。

因此我们通常会将别人训练过的模型拿来用（用这些模型的权重来初始化），通常有两种用法。第一，前面的layers全部保留，只训练最后的分类器（SVM，Softmax等），以使用caffe为例，具体做法就是修改train的prototxt文件里面最后一个fc层的名字和输出数。第二，保留一部分layers（当然也可以不保留），然后重新训练（此时有back propagation的过程而第一没有）。

如果你觉得别人的模型不可靠，毕竟这些数据集的类多为生活中自然中的物体，与我们具体要做的分类的物体可能存在较大的差异，那便自己从头训练一下（条件：足够多的数据、性能较好的GPU、充足的时间），网络模型依然可以使用别人的，毕竟是验证过提取特征效果很好的模型。

最后放上caffe的model zoo：https://github.com/BVLC/caffe/wiki/Model-Zoo

作者：Dex_
原文链接：https://blog.csdn.net/sinat_17745963/article/details/72901954
更新时间：2022-09-28 09:19:55

相关文章

SpringBoot+AOP+自定义注解实现防重复提交
首先创建自定义注解：主要用来标注在方法上。import java.lang.annotation.*;@Tar
2022-11-01

@Test 注解
@Test注解的使用使用@Test注解报错Failed to execute goal org.codehau
2022-11-01

如何将webp免费转改成jpg格式？
webp格式一般不是很常见，很多遇到了都会选择转换成JPG格式，这样使用起来更方便，那么如何将webp格式转换
2022-11-01

Python3使用requests模块
Requests模块是第三方模块，需要预先安装，requests模块在python内置模块的基础上进行了高度的
2022-11-01

随机文章

从np random normal 到正态分布的拟合
从np random normal 到正态分布的拟合
2022-10-08

A.equals(B)用法
错误写法：if(User.getUserName.equals(BaseName)) 这样写会报空指针因为：如
2022-10-08

关于微信小程序如何调用wx.login获取openId和用户信息
微信小程序通过code获取openId
2022-10-08

np.argmax&torch.max()对比
argmax函数np.argmax()通俗来说：在axis的增长方向上求最大值np.argmax()impor
2022-10-08

文章导航

热门标签

VPN BGP 华为 DHCP 组播 ISIS NAT 交换机 H3C 交换 TCP RADIUS LDP 链路聚合网络工程师小助手路由 QOS IPV6 IGMP CCNA视频教程 MPLS Vlan STP Wireshark PIM BGP选路 LACP IP GPON OSPF

最新文章

PHP范围解析运算符（：:)
介绍在PHP中，双冒号::定义为Scope Resolution Operator。
2023-11-18

完全删除数组中的多余元素-JavaScript
我们需要编写一个函数，该函数接受一个数组并返回一个新数组，该数组已删除了所有重复值。
2023-11-18

在不使用库函数的情况下使用真实/伪造的值展平数组-JavaScript
我们需要编写一个JavaScript数组函数，该函数接受具有伪造值的嵌套数组，并返回
2023-11-18

JavaScript在数组的伪索引处插入元素方法详解
我们需要编写一个Array函数，比如pushAtFalsy()，该函数应该包含一个数
2023-11-18

PHP整数数据类型
定义和用法在PHP中，Integer是标量数据类型，代表数字常量，代表整数，不带任何
2023-11-18

PHP错误控制运算符
介绍在PHP中，将@符号定义为错误控制运算符。当它以任何表达式为前缀时，PHP解析器
2023-11-18

PHP类型杂耍详解
定义和用法PHP被称为动态类型语言。在PHP中既不需要也不支持变量的显式类型声明。与
2023-11-18

PowerShell版本7中引入了哪些新的Null运算符？
PowerShell版本7引入了一些新的空运算符。它们如下。空合并运算符-??空条件
2023-11-18

PowerShell中$ ErrorView的用途是什么？
$Errorview变量确定PowerShell中错误消息的显示格式。在PowerS
2023-11-18

PHP执行运算符
介绍PHP中定义了一个执行运算符。一个字符串内部背蜱S（``）被视为一个DOS命令（
2023-11-18

Copyright © 2022 忙忙碌碌网
把实用的技术和经验，分享给最需要的读者，希望每一位来访的朋友都能有所收获！

文章目录