当前位置:首页 > 科技  > 软件

还在使用 os.path?Python 中的 Pathlib 太香了

来源: 责编: 时间:2023-11-14 09:09:50 173观看
导读写在前面相信现在依然有很多人习惯于使用os来处理文件/文件夹/路径等,但其实Python自带的Pathlib库处理这些更优雅、更安全,你会发现很多大型开源项目都在使用它,那么它到底有什么魅力?花点时间让我们一起看看吧!先看这个

Mzz28资讯网——每日最新资讯28at.com

写在前面

相信现在依然有很多人习惯于使用os来处理文件/文件夹/路径等,但其实Python自带的Pathlib库处理这些更优雅、更安全,你会发现很多大型开源项目都在使用它,那么它到底有什么魅力?花点时间让我们一起看看吧!Mzz28资讯网——每日最新资讯28at.com

先看这个引例,假设我们需要获取某个文件夹下所有的txt文件,基于os会写成如下形式:Mzz28资讯网——每日最新资讯28at.com

import osdir_path = "/home/user/documents"# Find all text files inside a directoryfiles = [os.path.join(dir_path, f) for f in os.listdir(dir_path) if os.path.isfile(os.path.join(dir_path, f)) and f.endswith(".txt")]

使用Pathlib则变成如下形式,是不是心动了:Mzz28资讯网——每日最新资讯28at.com

from pathlib import Pathdir_path = Path("/home/user/documents")files = list(dir_path.glob("*.txt"))

os.path 的最大缺点是将系统路径视为字符串,极容易导致混乱,Pathlib 在Python3.4中被支持, 通过将路径表示为独特的对象解决了这个问题,并为路径处理引入更多可扩展用法,许多操作在os需要层层嵌套,而Pathlib将使开发人员更轻松地处理与路径和文件相关的所有事情。Mzz28资讯网——每日最新资讯28at.com

处理路径

1.创建路径

几乎所有pathlib 的功能都可以通过其 Path 子类访问,可以使用该类创建文件和目录,有多种初始化Path的方式,比如,使用当前工作路径:Mzz28资讯网——每日最新资讯28at.com

from pathlib import PathPath.cwd() # PosixPath('/home/user/Downloads')

使用home:Mzz28资讯网——每日最新资讯28at.com

Path.home() # PosixPath('/home/user')

同样的可以指定字符串路径创建路径:Mzz28资讯网——每日最新资讯28at.com

p = Path("documents") # PosixPath('documents')

使用正斜杠运算符进行路径连接:Mzz28资讯网——每日最新资讯28at.com

data_dir = Path(".") / "data"csv_file = data_dir / "file.csv"print(data_dir) # dataprint(csv_file) # data/file.csv

检查路径是否存在,可以使用布尔函数 exists:Mzz28资讯网——每日最新资讯28at.com

data_dir.exists() 

data_dir.exists()检查文件是否存在:Mzz28资讯网——每日最新资讯28at.com

csv_file.exists()

csv_file.exists()使用 is_dir 或 is_file 函数来检查是否为文件夹、文件:Mzz28资讯网——每日最新资讯28at.com

data_dir.is_dir()
csv_file.is_file()

大多数路径都与当前运行目录相关,但某些情况下必须提供文件或目录的绝对路径,可以使用 absoluteMzz28资讯网——每日最新资讯28at.com

csv_file.absolute() # PosixPath('/home/user/Downloads/data/file.csv')

如果仍然需要将路径转为字符串,可以调用 str(path) 强制转换:Mzz28资讯网——每日最新资讯28at.com

str(Path.home()) # '/home/user'

现如今大多数库都支持 Path 对象,包括 sklearn 、 pandas 、 matplotlib 、 seaborn 等。Mzz28资讯网——每日最新资讯28at.com

2.Path属性

Path 对象有许多有用属性,一起来看看这些示例,首先定义一个图片路径:Mzz28资讯网——每日最新资讯28at.com

image_file = Path("images/shadousheng.png").absolute() # PosixPath('/home/user/Downloads/images/midjourney.png')

先从 parent 开始,它将返回当前工作目录的上一级:Mzz28资讯网——每日最新资讯28at.com

image_file.parent # PosixPath('/home/user/Downloads/images')

获取文件名:Mzz28资讯网——每日最新资讯28at.com

image_file.name # 'shadousheng.png'

它将返回带有后缀的文件名,若只想要前缀,则使用stem:Mzz28资讯网——每日最新资讯28at.com

image_file.stem # shadousheng

只想要后缀也很简单:Mzz28资讯网——每日最新资讯28at.com

image_file.suffix # '.png'

image_file.suffix # '.png'如果要将路径分成多个部分,可以使用 parts:Mzz28资讯网——每日最新资讯28at.com

image_file.parts # ('/', 'home', 'user', 'Downloads', 'images', 'shadousheng.png')

如果希望这些组件本身就是 Path 对象,可以使用 parents 属性,它会创建一个生成器Mzz28资讯网——每日最新资讯28at.com

for i in image_file.parents:    print(i)# /home/user/Downloads/images# /home/user/Downloads# /home/user# /home# /

3.处理文件

想要创建文件并写入内容,不必再使用 open 函数,只需创建一个 Path 对象搭配 write_text 或 write_btyes 即可:Mzz28资讯网——每日最新资讯28at.com

markdown = data_dir / "file.md"# Create (override) and write textmarkdown.write_text("# This is a test markdown")

读取文件,可以 read_text 或 read_bytes:Mzz28资讯网——每日最新资讯28at.com

markdown.read_text() # '# This is a test markdown'
len(image_file.read_bytes()) # 1962148

但请注意, write_text 或 write_bytes 会覆盖文件的现有内容:Mzz28资讯网——每日最新资讯28at.com

# Write new text to existing filemarkdown.write_text("## This is a new line")
# The file is overriddenmarkdown.read_text() # '## This is a new line'

要将新信息附加到现有文件,应该在 a (附加)模式下使用 Path 对象的 open 方法:Mzz28资讯网——每日最新资讯28at.com

# Append textwith markdown.open(mode="a") as file:    file.write("/n### This is the second line")markdown.read_text() # '## This is a new line/n### This is the second line'

使用rename 重命名文件,如在当前目录中重命名,file.md 变成了 new_markdown.md:Mzz28资讯网——每日最新资讯28at.com

renamed_md = markdown.with_stem("new_markdown")markdown.rename(renamed_md) # PosixPath('data/new_markdown.md')

通过 stat().st_size 查看文件大小:Mzz28资讯网——每日最新资讯28at.com

# Display file sizerenamed_md.stat().st_size # 49

查看最后一次修改文件的时间:Mzz28资讯网——每日最新资讯28at.com

from datetime import datetimemodified_timestamp = renamed_md.stat().st_mtimedatetime.fromtimestamp(modified_timestamp) # datetime.datetime(2023, 8, 1, 13, 32, 45, 542693)

st_mtime 返回一个自 1970 年 1 月 1 日以来的秒数。为了使其可读,搭配使用 datatime 的 fromtimestamp 函数。Mzz28资讯网——每日最新资讯28at.com

要删除不需要的文件,可以 unlink:Mzz28资讯网——每日最新资讯28at.com

renamed_md.unlink(missing_ok=True)

如果文件不存在,将 missing_ok 设置为 True 则不会引起报错Mzz28资讯网——每日最新资讯28at.com

4.处理目录

首先,看看如何递归创建目录:Mzz28资讯网——每日最新资讯28at.com

new_dir.mkdir(parents=True, exist_ok=True)

默认情况下, mkdir 创建给定路径的最后一个子目录,如果中间父级不存在,则必须将 parents 设置为 True 达到递归创建目的。Mzz28资讯网——每日最新资讯28at.com

要删除目录,可以使用 rmdir ,如果给定的路径对象是嵌套的,则仅删除最后一个子目录:Mzz28资讯网——每日最新资讯28at.com

new_dir.rmdir()

要在终端上列出 ls 等目录的内容,可以使用 iterdir 。结果将是一个生成器对象,一次生成一个子内容作为单独的路径对象,和os.listdir不同的是,它返回每个内容的绝对路径而不是名字:Mzz28资讯网——每日最新资讯28at.com

for p in Path.home().iterdir():    print(p)# /home/user/anaconda3# /home/user/.googleearth# /home/user/.zcompdump# /home/user/.ipython# /home/user/.bashrc

要捕获具有特定扩展名或名称的所有文件,可以将 glob 函数与正则表达式结合使用。Mzz28资讯网——每日最新资讯28at.com

例如,使用 glob("*.txt") 查找主目录中所有文本文件:Mzz28资讯网——每日最新资讯28at.com

home = Path.home()text_files = list(home.glob("*.txt"))len(text_files) # 3

要递归搜索文本文件(即在所有子目录中),可以glob 与 rglob 结合使用:Mzz28资讯网——每日最新资讯28at.com

all_text_files = [p for p in home.rglob("*.txt")]len(all_text_files) # 5116

以上就是Pathlib中常用方法。Mzz28资讯网——每日最新资讯28at.com

本文链接://www.dmpip.com//www.dmpip.com/showinfo-26-24305-0.html还在使用 os.path?Python 中的 Pathlib 太香了

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 深入了解Python数据类型及应用

下一篇: 七个开源免费的低代码/无代码后端项目

标签:
  • 热门焦点
  • Find N3入网:最高支持16+1TB

    Find N3入网:最高支持16+1TB

    OPPO将于近期登场的Find N3折叠屏目前已经正式入网,型号为PHN110。本次Find N3在外观方面相比前两代有很大的变化,不再是小号的横向折叠屏,而是跟别的厂商一样采用了较为常见的
  • 直屏旗舰来了 iQOO 12和K70 Pro同台竞技

    直屏旗舰来了 iQOO 12和K70 Pro同台竞技

    旗舰机基本上使用的都是双曲面屏幕,这就让很多喜欢直屏的爱好者在苦等一款直屏旗舰,这次,你们等到了。据博主数码闲聊站带来的最新爆料称,Redmi下代旗舰K70 Pro和iQOO 12两款手
  • 6月iOS设备好评榜:第一蝉联榜首近一年

    6月iOS设备好评榜:第一蝉联榜首近一年

    作为安兔兔各种榜单里变化最小的那个,2023年6月的iOS好评榜和上个月相比没有任何排名上的变化,仅仅是部分设备好评率的下降,长年累月的用户评价和逐渐退出市场的老款机器让这
  • Automa-通过连接块来自动化你的浏览器

    Automa-通过连接块来自动化你的浏览器

    1、前言通过浏览器插件可实现自动化脚本的录制与编写,具有代表性的工具就是:Selenium IDE、Katalon Recorder,对于简单的业务来说可快速实现自动化的上手工作。Selenium IDEKat
  • 得物效率前端微应用推进过程与思考

    得物效率前端微应用推进过程与思考

    一、背景效率工程随着业务的发展,组织规模的扩大,越来越多的企业开始意识到协作效率对于企业团队的重要性,甚至是决定其在某个行业竞争中突围的关键,是企业长久生存的根本。得物
  • 电视息屏休眠仍有网络上传 爱奇艺被质疑“薅消费者羊毛”

    电视息屏休眠仍有网络上传 爱奇艺被质疑“薅消费者羊毛”

    记者丨宁晓敏 见习生丨汗青出品丨鳌头财经(theSankei) 前不久,爱奇艺发布了一份亮眼的一季报,不仅营收和会员营收创造历史最佳表现,其运营利润也连续6个月实现增长。自去年年初
  • 到手价3099元起!iQOO Neo8 Pro今日首销:安卓性能最强旗舰

    到手价3099元起!iQOO Neo8 Pro今日首销:安卓性能最强旗舰

    5月23日,iQOO如期举行了新品发布会,全新的iQOO Neo8系列也正式与大家见面,包含iQOO Neo8和iQOO Neo8 Pro两个版本,其中标准版搭载高通骁龙8+,而Pro版更
  • 2299元起!iQOO Pad开启预售:性能最强天玑平板

    2299元起!iQOO Pad开启预售:性能最强天玑平板

    5月23日,iQOO如期举行了新品发布会,除了首发安卓最强旗舰处理器的iQOO Neo8系列新机外,还在发布会上推出了旗下首款平板电脑——iQOO Pad,其搭载了天玑
  • iQOO Neo8系列今日官宣:首发天玑9200+ 全球安卓最强芯!

    iQOO Neo8系列今日官宣:首发天玑9200+ 全球安卓最强芯!

    在昨日举行的的联发科新一代旗舰芯片天玑9200+的发布会上,iQOO官方也正式宣布,全新的iQOO Neo8系列新品将全球首发搭载这款当前性能最强大的移动平台
Top
Baidu
map