翼度科技»论坛 编程开发 python 查看内容

Python实现压缩和解压缩

3

主题

3

帖子

9

积分

新手上路

Rank: 1

积分
9
压缩和解压缩是日常常用的操作,不管是windows上图形界面的操作,还是linux上用命令来进行压缩解压缩,总的而言都还是比较方便的。
但用代码来实现就没做过,近期也得实现代码压缩与解压缩操作,所以就抽时间来研究一下。
一、zip文件压缩和解压缩实现
  1. import os
  2. import zipfile
  3. # 函数功能是zip_file_list所有文件,和zip_dir_list所有目录下的所有文件,被压缩到一个zip_file_name的压缩文件中
  4. def my_zip_function(zip_file_name, zip_file_list=[], zip_dir_list=[]):
  5.     # 压缩文件最后需要close,为了方便我们直接用with
  6.     with zipfile.ZipFile(zip_file_name, "w") as zip_obj:
  7.         # 压缩文件
  8.         for tmp_file in zip_file_list:
  9.             zip_obj.write(tmp_file)
  10.         # 压缩目录
  11.         for tmp_dir in zip_dir_list:
  12.             # zipfile没有直接压缩目录的功能,要压缩目录只能遍历目录一个一个文件压。
  13.             for root, dirs, files in os.walk(tmp_dir):
  14.                 # 如果想要目录为空时仍将该目录压缩进去,该目录也要压缩一遍;反之请将以下行注释掉
  15.                 zip_obj.write(root)
  16.                 for tmp_file in files:
  17.                     # 拼接文件完整目录,不然只用文件名代码找不到文件
  18.                     tmp_file_path = os.path.join(root, tmp_file)
  19.                     zip_obj.write(tmp_file_path)
  20. # 函数功能是遍历压缩文件中的所有文件
  21. def my_traversal_zip_function(zip_file_name):
  22.     with zipfile.ZipFile(zip_file_name, "r") as zip_obj:
  23.         # 返回结果是一个ZipInfo列表
  24.         # 如果在压缩时显示压缩目录,则目录也作为一个单独的ZipInfo呈现在列表中;反之则没有目录的ZipInfo
  25.         all_file_list = zip_obj.infolist()
  26.         for tmp_file in all_file_list:
  27.             print(tmp_file.filename)
  28.             # 还可以在不解压的情况下直接读取文件的内容
  29.             # 可以通过ZipInfo.is_dir()来区分是文件还是目录
  30.             # if not tmp_file.is_dir():
  31.             #     with zip_obj.open(tmp_file) as zip_fd:
  32.             #         print(zip_fd.read())
  33. # 函数的功能是将压缩文件直接解压
  34. def my_unzip_function(zip_file_name, path="."):
  35.     with zipfile.ZipFile(zip_file_name, "r") as zip_obj:
  36.         zip_obj.extractall(path=path)
  37. if __name__ == "__main__":
  38.     zip_file_name = "test_zip.zip"
  39.     # 自己在测试时要先自行创建好要压缩的文件和目录
  40.     zip_file_list = ["test_tar_file1.txt", "test_tar_file2.txt"]
  41.     zip_dir_list = ["test_tar_dir"]
  42.     my_zip_function(zip_file_name, zip_file_list, zip_dir_list)
  43.     my_traversal_zip_function(zip_file_name)
  44.     # my_unzip_function(zip_file_name, path=".")
复制代码
二、tar文件的压缩与解压缩实现

除了直接的.tar文件,还包括.tar.gz/.tar.bz2/.tar.xz等格式文件的压缩与解压缩实现。
  1. import os
  2. import tarfile
  3. # 函数功能是tar_file_list所有文件,和tar_dir_list所有目录下的所有文件,被压缩到一个tar_file_name的压缩文件中
  4. def my_tar_function(tar_file_name, tar_file_list=[], tar_dir_list=[], model="w"):
  5.     # 本来也应该是tarfile.TarFile(tar_file_name, model)来创建的,但TarFile不支持"r:gz"等扩展形式
  6.     # 压缩文件最后需要close,为了方便我们直接用with
  7.     with tarfile.open(tar_file_name, model) as tar_obj:
  8.         # 压缩文件
  9.         for tmp_file in tar_file_list:
  10.             tar_obj.add(tmp_file)
  11.         # 压缩目录。和zipfile相比tarfile允许直接压缩目录,而不需要去遍历目录一个个文件压
  12.         for tmp_dir in tar_dir_list:
  13.             tar_obj.add(tmp_dir)
  14. # 函数功能是遍历压缩文件中的所有文件
  15. def my_traversal_tar_function(tar_file_name, model="r"):
  16.     with tarfile.open(tar_file_name, model) as tar_obj:
  17.         # 返回结果是一个TarInfo列表
  18.         all_file_list = tar_obj.getmembers()
  19.         for tmp_file in all_file_list:
  20.             print(tmp_file.name)
  21.             # 还可以在不解压的情况下直接读取文件的内容
  22.             # 可以通过TarInfo.isdir()来区分是文件还是目录
  23.             # if not tmp_file.isdir():
  24.             #     # 相当于zip的open,并不会把文件给解压出来
  25.             #     tar_fd = tar_obj.extractfile(tmp_file)
  26.             #     print(tar_fd.read())
  27. # 函数的功能是将压缩文件直接解压
  28. def my_untar_function(tar_file_name, path=".", model="r"):
  29.     with tarfile.open(tar_file_name, model) as tar_obj:
  30.         tar_obj.extractall(path=path)
  31. #学习中遇到问题没人解答?小编创建了一个Python学习交流群:153708845
  32. if __name__ == "__main__":
  33.     # 自己在测试时要先自行创建好要压缩的文件和目录
  34.     tar_file_list = ["test_tar_file1.txt", "test_tar_file2.txt"]
  35.     tar_dir_list = ["test_tar_dir"]
  36.     tar_file_name = "test_tar.tar"
  37.     # 在.tar基础上,tarfile还支持gz/bz2/xz的压缩,只要在原来打开模式的基础上使用:或|接上压缩方法即可,如"r:gz"
  38.     # 特别的,如果是读取文件,可以使用"r:*"来指示尝试以任意格式读取
  39.     open_model = "w"
  40.     # open_model = "w:gz"
  41.     my_tar_function(tar_file_name, tar_file_list, tar_dir_list, model=open_model)
  42.     open_model = "r"
  43.     # open_model = "r:*"
  44.     my_traversal_tar_function(tar_file_name, model=open_model)
  45.     # open_model = "r:*"
  46.     # my_untar_function(tar_file_name, path=".", model=open_model)
复制代码
来源:https://www.cnblogs.com/xxpythonxx/p/18096884
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

举报 回复 使用道具