os模块walk方法使用

2023-01-07 21:25:27

一、用途

os.walk()方法是用来获取指定路径下所有文件

二、原理

os.walk()其实是利用递归将所有文件获取到,具体实现是用循环控制语句获取文件类型的属性,这中间它会用判断语句判断是否是dir目录属性,如果是就执行递归直到将指定路径下所有目录属性遍历一遍,拿到所有的非目录文件

三、使用

os.walk()它返回的是一个对象:

代码:

输出:

 

当然我们可以把它强转为list:

可以发现它里面的每个元素都是一个元组 ,那么我们可以遍历它


这样就拿到它里面的每一个元组,可以发现每个元组里面有三个元素,分别是什么呢?

其实自己拿一个目录结构跑一下就能够知道,每个元组里面的三个元素:第一个元素是当前循环所在的目录的绝对路径,第二个元素是当前目录下包含的所有目录元素,第三个元素是当前目录下包含的所有非目录元素,当然在实际使用中可能并不是每个元素都是我们需要的,可能有时候我们只需要里面的文件也就是第三个元素,那我们其实在循环的时候可以直接定义三个变量接收


 这里三个变量名可以随自己喜欢来定义,当然最好可以规范一点,用root、dirs、files来接收,

四、编码
那在最后还有一点不得不提一下,那也就是大家经常都绕不开的问题,中文路径的编码问题,很多人可能在定义目录结构时会用到中文,那么也就衍生出编码问题,当路径中有中文时,有时可能会出现编码问题,导致打印结果发现什么也没有,其实是编码格式不对而乱码导致walk()不认识没有找到对应的路径。

那解决方法呢:

1、首先可以尝试文件头声明编码格式,以python为例可以选择用下面方法声明

或者其他声明方式

2、如果声明编码不起作用则可以使用encode()方法指定编码,如:

 

 

  • 作者:@疯疯
  • 原文链接:https://blog.csdn.net/qq_42910365/article/details/125038552
    更新时间:2023-01-07 21:25:27