翼度科技»论坛 编程开发 python 查看内容

python标准模块介绍 -Base64: Base64, Base85等数据编码

11

主题

11

帖子

33

积分

新手上路

Rank: 1

积分
33
简介

功能:RFC 3548: Base16, Base32, Base64 数据编码。转换二进制数据为适合明文协议传输的 ASCII 序列。转换
8bits 为每个字节包含 6,5 或 4bits 的有效数据,比如 SMTP, URL 的一部分或者 HTTP POST 的一部分。参考: RFC 3548。编码算法不同于 uuencode。
类型:标准库
相关模块:uu, binhex, uu, quopri
Base64 是一种基于 64 个可打印字符来表示二进制数据的表示方法。由于 2 的 6 次方等于 64,所以每 6 个位元为一个单元,对应某个可打印字符。三个字节有 24 个位元,对应于 4 个 Base64 单元,即 3 个字节 需要用 4 个可打印字符来表示。它可用来作为电子邮件的传输编码。在 Base64 中的可打印字符包括字母 A- Z、a-z、数字 0-9,这样共有 62 个字符,此外两个可打印符号在不同的系统中而不同。之后在 6 位的前面补 两个 0,形成 8 位一个字节的形式。一些如 uuencode 的其他编码方法,和之后 binhex 的版本使用不同的 64 字符集来代表 6 个二进制数字,但是它们不叫 Base64。
Base64 常用于在通常处理文本数据的场合,表示、传输、存储一些二进制数据。包括 MIME 的email,email via MIME,在 XML 中存储复杂数据。
Python Base64 模块提供了 RFC3548 中的数据编码和解码(转换二进制数据为适合明文协议传输的ASCII 序列,如 RFC3548 中指定。该标准定义了 Base16,Base32 和 Base64 算法,编码和解码的任意二进制字符串转换为文本字符串,这样就可以通过电子邮件安全发送,作为网址的一部分,或包含在 HTTP POST 请求中。
Base64 模块提供两个接口。新式接口支持使用三个字母的编码和解码的字符串对象。传统接口提供了编码和解码文件对象和字符串,但只使用了标准的 Base64 字母。传统接口这里不做介绍。
base64、 base32、 base16 可以分别编码转化 8 位字节为 6 位、 5 位、 4 位。 16,32,64 分别表示用多少个字
符来编码。
更多 base64 的资料,参见
http://zh.wikipedia.org/wiki/Base64,http://tools.ietf.org/html/rfc822
http://tools.ietf.org/html/rfc1421
http://tools.ietf.org/html/rfc2045
快速入门

请看 python 模块介绍中的实例:
  1. >>> import base64
  2. >>> encoded = base64.b64encode('data to be encoded')
  3. >>> encoded
  4. 'ZGF0YSB0byBiZSBlbmNvZGVk'
  5. >>> data = base64.b64decode(encoded)
  6. >>> data
  7. 'data to be encoded'
复制代码
base64.b64encode(s[, altchars]):使用 Base64 编码字符串。s 是要编码的字符串。altchars 是用来替换+和/的字符串,它们在 url 和文件系统中它们有特殊含义,通常需要替换。
base64.b64decode(s[, altchars]): 解码 Base64 编码的字符串。s 为要解码的字符串。altchars 和b64encode 相同。
• base64.standard_b64encode ( s ) : 参考 b64encode。
• base64.standard_b64decode ( s ) :参考 b64decode。
Base64 编码解码

Base64 编码解码
  1. #!/usr/bin/env python
  2. # encoding: utf-8
  3. #
  4. # Copyright (c) 2008 Doug Hellmann All rights reserved.
  5. #
  6. """
  7. """
  8. __version__ = "$Id$"
  9. #end_pymotw_header
  10. import base64
  11. import textwrap
  12. # Load this source file and strip the header.
  13. with open(__file__, 'rt') as input:
  14. raw = input.read()
  15. initial_data = raw.split('#end_pymotw_header')[1]
  16. encoded_data = base64.b64encode(initial_data)
  17. num_initial = len(initial_data)
  18. # There will never be more than 2 padding bytes.
  19. padding = 3 - (num_initial % 3)
  20. print '%d bytes before encoding' % num_initial
  21. print 'Expect %d padding bytes' % padding
  22. print '%d bytes after encoding' % len(encoded_data)
  23. print
  24. print encoded_data
复制代码
➢执行结果
  1. $ python base64_b64encode.py
  2. 168 bytes before encoding
  3. Expect 3 padding bytes
  4. 224 bytes after encoding
  5. CgppbXBvcnQgYmFzZTY0CmltcG9ydCB0ZXh0d3JhcAoKIyBMb2FkIHRoaXMgc291cmNlIGZpbGUgYW5kIHN0cmlwIHRoZSBoZWFk
  6. ZXIuCndpdGggb3BlbihfX2ZpbGVfXywgJ3J0JykgYXMgaW5wdXQ6CiAgICByYXcgPSBpbnB1dC5yZWFkKCkKICAgIGluaXRpYWxfZGF0
  7. YSA9IHJhdy5zcGxpdCgn
复制代码
Base64 编码的 4 个字节对应实际的 3 个字节,不足四个字节时,后面部分通常用等号填充。极端的情况下, 一个字节需要用 4 个 Base64 编码来表示。
  1. >>> import base64
  2. >>> encoded = base64.b64encode('a')
  3. >>> encoded
  4. 'YQ=='
复制代码
Base64 解码参见快速入门部分介绍。
URL-Safe

•base64.urlsafe_b64encode(s):
•base64.urlsafe_b64decode(s):
Base64 默认会使用+和/, 但是这 2 个字符在 url 中也有特殊含义。使用 urlsafe 可以解决这个问题。 +替换为-, /替换为_。
  1. import base64
  2. encodes_with_pluses = chr(251) + chr(239)
  3. encodes_with_slashes = chr(255) * 2
  4. for original in [ encodes_with_pluses, encodes_with_slashes ]:
  5. print 'Original
  6. :', repr(original)
  7. print 'Standard encoding:', base64.standard_b64encode(original)
  8. print 'URL-safe encoding:', base64.urlsafe_b64encode(original)
  9. print
复制代码
➢执行结果
  1. $ python base64_urlsafe.py
  2. Original
  3. : '\xfb\xef'
  4. Standard encoding: ++8=
  5. URL-safe encoding: --8=
  6. Original
  7. : '\xff\xff'
  8. Standard encoding: //8=
  9. URL-safe encoding: __8=
复制代码
其他编码

Base32 包含 26 个大写字母和 2-7 的数字。
• base64.b32encode(s):使用 Base32 编码字符串。s 是要编码的字符串。
• base64.b32decode(s[, casefold[, map01]]):解码 Base32 编码的字符串。s 为要解码的字符串 。
casefold 表示是否允许小写字母。 map01 表示允许 0 表示 0,1 表示 L 。
  1. import base64
  2. original_string = 'This is the data, in the clear.'
  3. print 'Original:', original_string
  4. encoded_string = base64.b32encode(original_string)
  5. print 'Encoded :', encoded_string
  6. decoded_string = base64.b32decode(encoded_string)
  7. print 'Decoded :', decoded_string
复制代码
➢执行结果
  1. $ python base64_base32.py
  2. Original: This is the data, in the clear.
  3. Encoded : KRUGS4ZANFZSA5DIMUQGIYLUMEWCA2LOEB2GQZJAMNWGKYLSFY======
  4. Decoded : This is the data, in the clear.
复制代码
Base16 包含 16 个 16 进制大写数字。类似的有 base64.b16encode(s) ,base64.b16decode(s[,
casefold]) 。
  1. import base64
  2. original_string = 'This is the data, in the clear.'
  3. print 'Original:', original_string
  4. encoded_string = base64.b16encode(original_string)
  5. print 'Encoded :', encoded_string
  6. decoded_string = base64.b16decode(encoded_string)
  7. print 'Decoded :', decoded_string
复制代码

执行结果
  1. $ python base64_base16.py
  2. Original: This is the data, in the clear.
  3. Encoded : 546869732069732074686520646174612C20696E2074686520636C6561722E
  4. Decoded : This is the data, in the clear.
  5. Python3.4 中增加了 Ascii85 和 base85 支持 。这里暂不做详细介绍。函数如下:
  6. • base64.a85encode(s, *, foldspaces=False, wrapcol=0, pad=False, adobe=False)
  7. • base64.a85decode(s, *, foldspaces=False, adobe=False, ignorechars=b' tnrv')
  8. • base64.b85encode(s, pad=False)
  9. • base64.b85decode(b)
复制代码
参考资料


来源:https://www.cnblogs.com/testing-/p/17413027.html
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

举报 回复 使用道具