百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 软件资讯 > 正文

使用Python进行压缩与解压缩 用python解压压缩包

ninehua 2024-12-28 14:36 65 浏览

在日常工作中,除了会涉及到使用Python处理文本文件,有时候还会涉及对压缩文件的处理。

通常会涉及到的压缩文件格式有:

  • rar:Windows 环境下用的比较多的压缩,比较著名的GUI工具是winrar
  • tar: Linux系统下的打包工具,只打包,不压缩
  • gz:即gzip,通常只能压缩一个文件。与tar结合起来就可以实现先打包,再压缩。
  • tgz:即gz。先用tar打包,然后再用gz压缩得到的文件
  • zip:不同于gzip,虽然使用相似的算法,可以打包压缩多个文件,不过分别压缩文件,压缩率低于tar
  • 7z:7zip压缩软件支持的格式,压缩效率较高。

当然除了使用Python外,你还可以选择使用压缩解压缩软件或命令手动进行处理。


zip文件

zipfile是Python里用来做zip格式编码的压缩和解压缩的module,zipfile里有两个非常重要的class:ZipFile和ZipInfo。ZipFile是主要的类,用来创建和读取zip文件,而ZipInfo是存储的zip文件的每个文件的信息。

示例代码:

import os
import zipfile




# 压缩
def make_zip(source_dir, output_filename):
    zipf = zipfile.ZipFile(output_filename, 'w')
    pre_len = len(os.path.dirname(source_dir))
    for parent, dirnames, filenames in os.walk(source_dir):
        for filename in filenames:
            print(filename)
            pathfile = os.path.join(parent, filename)
            arcname = pathfile[pre_len:].strip(os.path.sep)  # 相对路径
            zipf.write(pathfile, arcname)
        print()
    zipf.close()




# 解压缩
def un_zip(file_name):
    """unzip zip file"""
    zip_file = zipfile.ZipFile(file_name)
    if os.path.isdir(file_name + "_files"):
        pass
    else:
        os.mkdir(file_name + "_files")
    for names in zip_file.namelist():
        zip_file.extract(names, file_name + "_files/")
    zip_file.close()




if __name__ == '__main__':
    make_zip(r"E:python_samplelibstest_tar_fileslibs", "test.zip")
    un_zip("test.zip")


tar.gz文件

tarfile 模块可以用来读写 tar 归档,包括使用 gzip, bz2 和 lzma 压缩的归档。在使用tarfile时必须了解模式:

mode 必须是 ‘filemode[:compression]’ 形式的字符串,其默认值为 ‘r’。以下是模式组合的完整列表:

模式

动作

‘r’ or ‘r:*’

打开和读取使用透明压缩(推荐)。

‘r:’

打开和读取不使用压缩。

‘r:gz’

打开和读取使用gzip 压缩。

‘r:bz2’

打开和读取使用bzip2 压缩。

‘r:xz’

打开和读取使用lzma 压缩。

‘x’ 或 ‘x:’

创建tarfile不进行压缩。如果文件已经存在,则抛出 FileExistsError 异常。

‘x:gz’

使用gzip压缩创建tarfile。如果文件已经存在,则抛出 FileExistsError 异常。

‘x:bz2’

使用bzip2 压缩创建tarfile。如果文件已经存在,则抛出 FileExistsError 异常。

‘x:xz’

使用lzma 压缩创建tarfile。如果文件已经存在,则抛出 FileExistsError 异常。

‘a’ or ‘a:’

打开以便在没有压缩的情况下追加。如果文件不存在,则创建该文件。

‘w’ or ‘w:’

打开用于未压缩的写入。

‘w:gz’

打开用于 gzip 压缩的写入。

‘w:bz2’

打开用于 bzip2 压缩的写入。

‘w:xz’

打开用于 lzma 压缩的写入。

针对特殊的目的,还存在第二种 mode 格式: ‘filemode|[compression]’。tarfile.open() 将返回一个将其数据作为数据块流来处理的 TarFile 对象:

模式

动作

‘r|*’

打开 tar 块的 流 以进行透明压缩读取。

‘r|’

打开一个未压缩的 tar 块的 stream 用于读取。

‘r|gz’

打开一个 gzip 压缩的 stream 用于读取。

‘r|bz2’

打开一个 bzip2 压缩的 stream 用于读取。

‘r|xz’

打开一个 lzma 压缩 stream 用于读取。

‘w|’

打开一个未压缩的 stream 用于写入。

‘w|gz’

打开一个 gzip 压缩的 stream 用于写入。

‘w|bz2’

打开一个 bzip2 压缩的 stream 用于写入。

‘w|xz’

打开一个 lzma 压缩的 stream 用于写入。

代码示例:

import os
import tarfile
import gzip




# 一次性打包整个根目录。空子目录会被打包。
# 如果只打包不压缩,将"w:gz"参数改为"w:"或"w"即可。
def make_targz(output_filename, source_dir):
    with tarfile.open(output_filename, "w:gz") as tar:
        tar.add(source_dir, arcname=os.path.basename(source_dir))




# 逐个添加文件打包,未打包空子目录。可过滤文件。
# 如果只打包不压缩,将"w:gz"参数改为"w:"或"w"即可。
def make_targz_one_by_one(output_filename, source_dir):
    tar = tarfile.open(output_filename, "w:gz")
    for root, dir, files in os.walk(source_dir):
        for file in files:
            pathfile = os.path.join(root, file)
            tar.add(pathfile)
    tar.close()




def un_gz(file_name):
    """ungz zip file"""
    f_name = file_name.replace(".gz", "")
    # 获取文件的名称,去掉
    g_file = gzip.GzipFile(file_name)
    # 创建gzip对象
    open(f_name, "wb+").write(g_file.read())
    # gzip对象用read()打开后,写入open()建立的文件里。
    g_file.close()  # 关闭gzip对象




def un_tar(file_name):
    # untar zip file
    tar = tarfile.open(file_name)
    names = tar.getnames()
    if os.path.isdir(file_name + "_files"):
        pass
    else:
        os.mkdir(file_name + "_files")
    # 由于解压后是许多文件,预先建立同名文件夹
    for name in names:
        tar.extract(name, file_name + "_files/")
    tar.close()




if __name__ == '__main__':
    make_targz('test.tar.gz', "E:python_samplelibs")
    make_targz_one_by_one('test01.tgz', "E:python_samplelibs")
    un_gz("test.tar.gz")
    un_tar("test.tar")


rar文件

我们可以使用rarfile来解压.rar的文件,但是不支持用rarfile来压缩rar文件。rarfile以下unrar组件,但是使用pip install unrar安装后发现会报如下错误:

Couldn’t find path to unrar library…

这是因为 Python下的 unrar 还依赖了RAR官方的库。


Windows的安装

到RARLab官方下载库文件,https://www.rarlab.com/rar/UnRARDLL.exe,然后安装。

  • 安装是最好选择默认路径,一般在 C:Program Files (x86)UnrarDLL 目录下。
  • 添加环境变量,在系统变量中新建变量名UNRAR_LIB_PATH,如果是64位系统,就输入 C:Program Files (x86)UnrarDLLx64UnRAR64.dll,如果是32位系统就是 C:Program Files (x86)UnrarDLLUnRAR.dll。
  • 确定保存环境变量后,在进行 pip install unrar 安装,这时代码再运行就不会报错了。

Linux的安装

下载rar源文件:https://www.rarlab.com/rar/rarlinux-6.0.0.tar.gz

  • 解压安装包,进入安装包目录,编译安装,生成so 文件
  • 配置环境变量,完成后,在进行 pip install unrar 安装
# cd /usr/local/src/
# wget https://www.rarlab.com/rar/unrarsrc-6.0.3.tar.gz
# tar zxvf unrarsrc-6.0.3.tar.gz
# cd unrar
# make lib
# make install-lib  //生成libunrar.so 文件
# vim /etc/profile
export UNRAR_LIB_PATH=/usr/lib/libunrar.so
# source /etc/profile

代码示例:

import rarfile




def unrar(rar_file, dir_name):
    # rarfile需要unrar支持, linux下pip install unrar, windows下在winrar文件夹找到unrar,加到path里
    rarobj = rarfile.RarFile(rar_file.decode('utf-8'))
    rarobj.extractall(dir_name.decode('utf-8'))

7z文件

要压缩和解压缩.7z文件需要用到py7zr组件。代码示例:

import py7zr


# 压缩
with py7zr.SevenZipFile("Archive.7z", 'r') as archive:
    archive.extractall(path="/tmp")


# 解压缩
with py7zr.SevenZipFile("Archive.7z", 'w') as archive:
    archive.writeall("target/")

原文链接:

https://mp.weixin.qq.com/s/Q3T3S627lWJa_cOSrBocyw

相关推荐

「免费下载」超棒的英文字母、数字描红,PDF高清打印版

(资料太长,只能展示截图部分)领取完整【高清电子打印版】请将文章拉至末尾查看步骤领取【高清电子打印版】请关注后【点赞+转发】【私信我回复数字000】按照步骤免费领取(高清电子版)...

武侠 金庸全集(共36册) 01 PDF版分享

电子书及相关资料于网络上搜集整理,如有侵权,请联系我删除!

小学生经典国学典藏《古文观止》PDF电子版下载

为了方便教师、学生和家长查阅和使用中小学教辅资料小编花费大量的时间收集、整理、发布这一系列的电子教辅真心希望能给您带来帮助今天给大家带来的是小学生经典国学典藏《古文观止》PDF电子版下载免费分享给大家...

安卓上有哪些不错的PDF阅读器?

要看看具体是什么类型的PDF文件,文献资料类的可能还是更适合在平板或者电脑上阅读,比较方便,如果是普通的不太大的PDF文件可以借助一些APP来看,安利三款自用过的PDF阅读器,在安卓手机的应用商店就可...

2020一建全科官方电子版教材免费下载(高清PDF)

2020年一级建造师考试已过,又开始21年一建备考了,由于20新教材是5月份才出版,备考21年考试先用20年资料,为了帮助各位考生通过考试,倪倪考吧特整理了一级建造师考试全科电子版教材下载,希望可以帮...

pdf在线提取页面免费工具,推荐几款超实用工具

PDF的可以用来保存扫描件,很多纸质版文件都可以转换成PDF以方便流通阅读。PDF页数也是没有限制的,所以如果你拿到一份很大的文档,每次使用的时候就会不太方便。可以选择将大文件的一部分内容提取出来,重...

免费将 PDF 转换为 Word 的 10 个最佳工具

可移植文档格式或PDF是大多数企业使用的流行文件格式,主要用于共享项目材料并确保整个团队协同工作。它还有助于避免处理大量文档和丢失关键数据。使用顶级PDF转换器还可以更轻松地高效地进行日常活动...

2023春 《53天天练》配套 语文一下练习试题卷 电子版 92页PDF文档

这份就是今年春季版的53天天练试题练习卷,适合一年级下册人教部编版语文课堂课后复习使用!需要的家长可找我要资料下载:2023春《53天天练》配套语文一年级下册练习试题卷电子版92页PDF文...

人教版7年级下册数学电子课本PDF版下载

如需领取电子课本(PDF高清版),请关注微信公众号“x9996k”,即可获得电子课本PDF打印版以及各版本各学科的电子课本大全。...

全套《女巫温妮》PDF免费下载:高清电子书+音频+视频+翻译+拓展

今天给大家分享的是风靡全球30年的牛津经典读物《女巫温妮》12册,高清PDF+翻译+MP3+视频+拓展资料!私信回复“绘本”免费领取...

强大的网站(第四十一期):一个免费的图片和PDF处理工具网站

一、网站简介Docsmall网站致力于让文件处理更加简单,它提供了图片处理、PDF处理以及其他文件转换等多种功能。用户只需上传文件,选择所需的处理选项,即可快速完成文件处理任务。网站地址(点击转跳):...

如何在电脑和手机上免费将 PDF 转换为Word

PDF文件是我们每天用来交换重要内容的一些最重要的文档之一。但是编辑PDF文件通常很困难;因此,以下是您可以从任何设备将PDF文件转换为可编辑Word文件的三种方法中的一些。添加图片注释,不...

为什么PDF转word都是付费功能?免费PDF编辑的几种方法

现在不论是WPS还是迅捷PDF、福昕PDF等软件,都将PDF编辑功能,特别是PDF转Word功能设置成了收费模式。但是在日常学习工作中,我们总会有编辑PDF的场景,如何解决呢?一、先看看是什么类型的P...

有哪些实用免费的PDF编辑器?

本文分享8个实用的PDF编辑器,大部分都免费,能够满足基本的编辑需求,而且操作简便,兼容性强,让你的文档处理如鱼得水。一、通过电脑端软件实现PDF编辑1、AdobeAcrobat一款功能强大的PDF...

824页pdf文档免费下载链接 娱乐圈824大瓜事件怎么回事

824文档是一颗比421更大的瓜,824文档里面记载着各种娱乐圈明星八卦的合集,而这个文档不是别的,正是明星的黑料内幕,也可以理解为421页娱乐圈明星八卦合集,涵盖了整个娱乐圈八卦内容汇总,相当于一篇...