Python标准库—codecs模块

2023-01-13 12:07:40

codecs

常用函数

codecs.encode(obj, encoding='utf-8', errors='strict')

使用为 encoding 注册的编解码器对 obj 进行编码，类似str.encode()方法。

>>> codecs.encode("你好,world",encoding='ascii')
Traceback (most recent call last):
  ...
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)
>>>
>>> codecs.encode("你好,world",encoding='ascii',errors='replace')
b'??,world'

codecs.decode(obj, encoding='utf-8', errors='strict')

使用为 encoding 注册的编解码器对 obj 进行解码，类似str.decode()方法。

codecs.lookup(encoding)

在 Python 编解码器注册表中查找编解码器信息，并返回一个 CodecInfo 对象。

>>> import codecs
>>> 
>>> gbk = codecs.lookup('gbk')
>>> gbk.encode("你好,world")
(b'\xc4\xe3\xba\xc3,world', 8)
>>> codecs.lookup('uuuu')
Traceback (most recent call last):
  ...
LookupError: unknown encoding: uuuu

CodeInfo对象属性/方法	描述
name	编码名称
encode/decode	无状态的编解码函数
streamwriter/streamreader	流式写入器和读取器类或工厂函数。
incrementalencoder/incrementaldecoder	增量式的编码器和解码器类或工厂函数。

>>> utf8 = codecs.lookup('utf-8')
>>> utf8.name
"utf-8"

codecs.getencoder(encoding)

查找给定编码的编解码器并返回其编码器函数。

>>> u8_encode = codecs.getencoder("utf8")
>>> u8_encode("你好,world.")
(b'\xe4\xbd\xa0\xe5\xa5\xbd,world.', 9)

codecs.getdecoder(encoding)

查找给定编码的编解码器并返回其解码器函数。

>>> b_data, _ = u8_encode("你好,world.")
>>> u8_decode = codecs.getdecoder("utf-8")
>>> u8_decode(b_data)
('你好,world.', 13)

codecs.open(filename, mode='r', encoding=None, errors='strict', buffering=1)

使用给定的 mode 打开已编码的文件并返回一个 StreamReaderWriter的实例，提供透明的编码/解码；与内置函数open类似。

常用的errors字符串

errors字符串	描述
strict	默认，出现编解码错误抛出`UnicodeError`
ignore	忽略错误格式（编解码出错）的数据
replace（仅适用文本编码）	编码错误替换为 `'?'`

注意：文本编码—>用于将Unicode字符串编码为字节串的编码器。

作者：Lzzwwen
原文链接：https://blog.csdn.net/L_zzwwen/article/details/100068682
更新时间：2023-01-13 12:07:40

相关文章

container_of()详解
原地址：http://radek.io/2012/11/10/magical-container_of-ma
2022-07-07

如何通过SpringMVC框架响应JSON数据
1. 通过SpringMVC框架响应JSON数据在SpringMVC框架（含SpringBoot框架）中，当处
2022-07-08

Mybatis的查询类别名typeAlias的使用
Mybatis的查询类别名typeAlias的使用
2022-07-08

springmvc使用log4j2的配置，以及解决controller日志只有控制台
文章目录1.引包2. log4j2.xml的配置3.配置文件中的一些说明springmvc使用log4j2的配
2022-07-08

随机文章

graham凸包算法及代码python代码
(3条消息)graham法求凸包详解_网络_路人黑的纸巾-CSDN博客 https://blog.csdn.
2022-09-19

Python+Excel系列：案例四：批量重命名多个工作簿、批量重命名多个工作簿中的
案例四
2022-09-19

java 枚举创建_从字符串创建Java枚举
本问题已经有最佳答案，请猛点这里访问。我有枚举类public enum PaymentType {/*** T
2022-09-19

Jupyter Notebook 修改字体和大小
原理很简单，就是更改CSS文件原本的字体很难看，尤其是引号????我推荐两款字体，Consolas 和Fir
2022-09-19

文章导航

热门标签

VPN BGP 华为 DHCP 组播 ISIS NAT 交换机 H3C 交换 TCP RADIUS LDP 链路聚合网络工程师小助手路由 QOS IPV6 IGMP CCNA视频教程 MPLS Vlan STP Wireshark PIM BGP选路 LACP IP GPON OSPF

最新文章

PHP范围解析运算符（：:)
介绍在PHP中，双冒号::定义为Scope Resolution Operator。
2023-11-18

完全删除数组中的多余元素-JavaScript
我们需要编写一个函数，该函数接受一个数组并返回一个新数组，该数组已删除了所有重复值。
2023-11-18

在不使用库函数的情况下使用真实/伪造的值展平数组-JavaScript
我们需要编写一个JavaScript数组函数，该函数接受具有伪造值的嵌套数组，并返回
2023-11-18

JavaScript在数组的伪索引处插入元素方法详解
我们需要编写一个Array函数，比如pushAtFalsy()，该函数应该包含一个数
2023-11-18

PHP整数数据类型
定义和用法在PHP中，Integer是标量数据类型，代表数字常量，代表整数，不带任何
2023-11-18

PHP错误控制运算符
介绍在PHP中，将@符号定义为错误控制运算符。当它以任何表达式为前缀时，PHP解析器
2023-11-18

PHP类型杂耍详解
定义和用法PHP被称为动态类型语言。在PHP中既不需要也不支持变量的显式类型声明。与
2023-11-18

PowerShell版本7中引入了哪些新的Null运算符？
PowerShell版本7引入了一些新的空运算符。它们如下。空合并运算符-??空条件
2023-11-18

PowerShell中$ ErrorView的用途是什么？
$Errorview变量确定PowerShell中错误消息的显示格式。在PowerS
2023-11-18

PHP执行运算符
介绍PHP中定义了一个执行运算符。一个字符串内部背蜱S（``）被视为一个DOS命令（
2023-11-18

Copyright © 2022 忙忙碌碌网
把实用的技术和经验，分享给最需要的读者，希望每一位来访的朋友都能有所收获！

文章目录