探究pytorch model.eval()测试效果远差于model.train()

2022-10-17 10:18:23

前言：
第一篇博客，记录下自己的学习心得。如有谬误，欢迎指正。

为什么用model.eval()

当网络中存在BN层或者Dropout，在测试的时候需要固定住固定BN层和dropout层。关于BN层的详细介绍可以参考这篇博文：Pytorch的BatchNorm层使用中容易出现的问题

训练数据的时候acc可以达到99%，但是测试时acc只有33%，显然这是不行的。查询了一些资料给出的解决方案如下：、

删去相同的BN层
其实我没太理解这个，怎么才算相同的BN层
track_running_stats设为False
含义为测试时用当前batch的方差和均值（为True则使用训练时得到的方差和均值）。我在这样设定后，测试效果确实变好了，但是之前训练得到方差和均值就没啥意义了。
数据进行归一化
有的人可能是没有进行数据归一化从而导致测试效果较差。我的训练集归一化什么的肯定是没问题的，将训练集作为测试集，原则上应该拟合的很好，但在加model.eval()后，效果依然不好，显然不是归一化的问题了。
增大训练样本batch_size
没想到会是这方面原因，因为我以前觉得加不加大batch_size，最后得到的方差和均值都一样，有点搞笑。
网络中加入了BN层，训练时BN层中的方差和均值是根据每个batch的样本进行更新的，测试的时候这俩个参数是固定的。
我把训练的batch_size设为了1，那么训练完成后获得的方差和均值是接近于最后一个样本的方差和均值的。加了model.eval(),在测试的时候相当于是用这最后一个样本的方差和均值来获得测试集的输出，显然这个方差和均值是不具备全局性的，结果肯定是不好的。在增大batch_size后，获得的方差和均值是更接近于全局特性的，所以当我将batch_size设为64后，测试集的acc提到了85%，尽管不是很高，但也足以证明增大batch_size是十分有效的。

作者：Coding-Prince
原文链接：https://blog.csdn.net/qq_42362891/article/details/108119556
更新时间：2022-10-17 10:18:23

相关文章

Spring使用Setter完成依赖注入
对依赖注入的理解依赖：实体间的所有依赖由容器创建注入：容器负责完成实体间依赖互相注入的任务使用Setter完成
2023-04-08

test setup failed、fixture ‘args‘ not found
这个程序用到了pytest可能是它出现的问题。解决方法：将还有test的函数改名。。就行了好像只要还有tes
2023-04-08

Vue this.$refs的使用
案例一、ref 写在标签上时<!-- ref 写在标签上时：this.$refs.名字获取的是标签对
2023-04-08

Spring MVC Controler层获取errors验证信息同时返回
/** * spring 获取错误信息 * @param bindingResult * @param
2023-04-08

随机文章

IOC创建对象方式
通过有参构造方法来创建1、UserT . javapublicclassUserT{ privateStrin
2022-08-27

Voronoi图简介及C语言实现
Voronoi图广泛应用在几何学、地理学、晶体学、信息系统等学科之中。Voronoi图是由图中各个相邻点连线的
2022-08-27

Mybatis学习分页的实现，使用注解开发，使用注解实现CURD
分页的实现此处有两种思路：1.使用SQL的 limit ?,?2.使用limit分页方式一（步骤：）：(1)
2022-08-27

简单的tensorboard学习（pytorch）
tensorboard是一个可视化工具，我在pytorch中使用，首先要先装这个包，利用下面代码：pip in
2022-08-27

文章导航

热门标签

VPN BGP 华为 DHCP 组播 ISIS NAT 交换机 H3C 交换 TCP RADIUS LDP 链路聚合网络工程师小助手路由 QOS IPV6 IGMP CCNA视频教程 MPLS Vlan STP Wireshark PIM BGP选路 LACP IP GPON OSPF

最新文章

PHP范围解析运算符（：:)
介绍在PHP中，双冒号::定义为Scope Resolution Operator。
2023-11-18

完全删除数组中的多余元素-JavaScript
我们需要编写一个函数，该函数接受一个数组并返回一个新数组，该数组已删除了所有重复值。
2023-11-18

在不使用库函数的情况下使用真实/伪造的值展平数组-JavaScript
我们需要编写一个JavaScript数组函数，该函数接受具有伪造值的嵌套数组，并返回
2023-11-18

JavaScript在数组的伪索引处插入元素方法详解
我们需要编写一个Array函数，比如pushAtFalsy()，该函数应该包含一个数
2023-11-18

PHP整数数据类型
定义和用法在PHP中，Integer是标量数据类型，代表数字常量，代表整数，不带任何
2023-11-18

PHP错误控制运算符
介绍在PHP中，将@符号定义为错误控制运算符。当它以任何表达式为前缀时，PHP解析器
2023-11-18

PHP类型杂耍详解
定义和用法PHP被称为动态类型语言。在PHP中既不需要也不支持变量的显式类型声明。与
2023-11-18

PowerShell版本7中引入了哪些新的Null运算符？
PowerShell版本7引入了一些新的空运算符。它们如下。空合并运算符-??空条件
2023-11-18

PowerShell中$ ErrorView的用途是什么？
$Errorview变量确定PowerShell中错误消息的显示格式。在PowerS
2023-11-18

PHP执行运算符
介绍PHP中定义了一个执行运算符。一个字符串内部背蜱S（``）被视为一个DOS命令（
2023-11-18

Copyright © 2022 忙忙碌碌网
把实用的技术和经验，分享给最需要的读者，希望每一位来访的朋友都能有所收获！

文章目录