一、glob 模块概述
模块可根据指定的模式来查找文件和目录,它支持使用通配符进行模糊匹配。主要通过和两个函数来实现文件路径的模式匹配,能处理简单的文件名模式,如可匹配所有扩展名为的文件。
二、通配符规则
(一)* 通配符
- 功能:匹配任意数量(包括零个)的任意字符。
- 示例:
- import glob
- # 匹配当前目录下所有扩展名为 .txt 的文件
- txt_files = glob.glob('*.txt')
- for file in txt_files:
- print(file)
复制代码 上述代码中,表示匹配当前目录下文件名任意,但扩展名为的所有文件。
(二)? 通配符
- import glob
- # 匹配当前目录下文件名只有一个字符且扩展名为 .py 的文件
- single_char_py_files = glob.glob('?.py')
- for file in single_char_py_files:
- print(file)
复制代码 这里,表示文件名只有一个字符,扩展名为的文件。
(三)[] 通配符
- import glob
- # 匹配当前目录下文件名以 a 或 b 开头且扩展名为 .txt 的文件
- ab_txt_files = glob.glob('[ab]*.txt')
- for file in ab_txt_files:
- print(file)
复制代码 表示文件名以或开头,扩展名为的文件。
(四)** 通配符(递归匹配)
- 功能:在路径中使用表示递归匹配目录。在 Python 3.5 及以上版本支持。
- 示例:
- import glob
- # 递归匹配当前目录及其子目录下所有扩展名为 .txt 的文件
- all_txt_files = glob.glob('**/*.txt', recursive=True)
- for file in all_txt_files:
- print(file)
复制代码 结合会递归查找当前目录及其所有子目录下的文件。
三、glob 函数
(一)glob.glob(pathname, *, recursive=False)
- 功能:返回一个符合指定模式的文件和目录路径列表。
- 参数:
- :要匹配的路径模式。
- :是否进行递归匹配,默认为。当设置为时,支持使用通配符进行递归查找。
- 示例:
- import glob
- # 匹配当前目录及其子目录下所有以 test 开头的文件
- test_files = glob.glob('**/test*', recursive=True)
- for file in test_files:
- print(file)
复制代码 四、iglob 函数
(一)glob.iglob(pathname, *, recursive=False)
- 功能:返回一个迭代器,该迭代器会逐个产生符合指定模式的文件和目录路径。
- 参数:与相同。
- 示例:
- import glob
- # 使用 iglob 迭代匹配当前目录下所有 .py 文件
- py_files_iter = glob.iglob('*.py')
- for file in py_files_iter:
- print(file)
复制代码 适合处理大量匹配结果的情况,因为它不会一次性生成所有匹配结果,而是逐个产生,节省内存。
五、glob 与其他文件查找方式的对比
查找方式优点缺点适用场景模块使用简单,支持通配符匹配,能快速查找符合模式的文件和目录。模式匹配功能相对简单,不支持复杂的正则表达式匹配。简单的文件和目录查找,如按扩展名、文件名前缀等查找。函数可以递归遍历目录树,能详细控制遍历过程。需要手动编写代码进行文件筛选,使用相对复杂。需要对目录树进行深度遍历和复杂筛选的场景。模块(正则表达式)支持复杂的模式匹配,功能强大。学习成本较高,代码相对复杂。需要进行复杂文件名模式匹配的场景。
六、应用场景
(一)批量文件处理
可以使用模块查找符合特定模式的文件,然后对这些文件进行批量处理,如批量重命名、批量读取文件内容等。- import glob
- # 批量重命名当前目录下所有 .txt 文件
- txt_files = glob.glob('*.txt')
- for file in txt_files:
- new_name = file.replace('.txt', '_new.txt')
- import os
- os.rename(file, new_name)
复制代码 (二)数据收集
在进行数据收集时,可能需要从多个文件中读取数据。可以使用模块查找相关文件,然后读取数据。- import glob
- # 读取当前目录及其子目录下所有 .csv 文件的数据
- csv_files = glob.glob('**/*.csv', recursive=True)
- for file in csv_files:
- with open(file, 'r') as f:
- data = f.read()
- print(f"Data from {file}: {data[:100]}...")
复制代码 文章总结
模块为 Python 开发者提供了一种便捷的文件和目录查找方式,通过使用 Unix 风格的通配符规则,能快速定位符合特定模式的文件和目录。函数返回匹配结果列表,函数返回迭代器,适用于不同的应用场景。在简单的文件查找和批量处理任务中,模块是一个非常实用的工具。
到此这篇关于Python文件路径模式匹配glob模块使用的文章就介绍到这了,更多相关Python文件路径模式匹配glob模块内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
来源:https://www.jb51.net/python/339863twg.htm
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
|