Ubuntu在pytorch训练过程中总是出现死机,重启

2022-10-27 13:47:19

问题解析:一般是gpu或者cpu在和内存io的时候,内存容量不足被强制kill了,举个例子,我训练的模型大小约占用显存16g,但是在存储模型的过程会被32g的内存撑爆

1 在pycharm的设置文件将内置内存最大值拉满,不会的同学可以直接用命令行运行py文件

2如果还爆炸的话就可以考虑进行代码的优化,如减少存储变量的数量等等

3实在不行就加内存吧

  • 作者:跳着出刀
  • 原文链接:https://blog.csdn.net/absxyz19931021/article/details/124256380
    更新时间:2022-10-27 13:47:19