網站首頁 編程語言 正文
前言;
Python bytes
類型用來表示一個字節串。“字節串“不是編程術語,是我自己“捏造”的一個詞,用來和字符串相呼應。
bytes 是 Python 3.x 新增的類型,在 Python 2.x
中是不存在的。
字節串(bytes)和字符串(string)的對比:
- 字符串由若干個字符組成,以字符為單位進行操作;字節串由若干個字節組成,以字節為單位進行操作。
- 字節串和字符串除了操作的數據單元不同之外,它們支持的所有方法都基本相同。
- 字節串和字符串都是不可變序列,不能隨意增加和刪除數據。
bytes
只負責以字節序列的形式(二進制形式)來存儲數據,至于這些數據到底表示什么內容(字符串、數字、圖片、音頻等),完全由程序的解析方式決定。如果采用合適的字符編碼方式(字符集),字節串可以恢復成字符串;反之亦然,字符串也可以轉換成字節串。
說白了,bytes 只是簡單地記錄內存中的原始數據,至于如何使用這些數據,bytes 并不在意,你想怎么使用就怎么使用,bytes 并不約束你的行為。
bytes 類型的數據非常適合在互聯網上傳輸,可以用于網絡通信編程;bytes
也可以用來存儲圖片、音頻、視頻等二進制格式的文件。
字符串和 bytes 存在著千絲萬縷的聯系,我們可以通過字符串來創建 bytes
對象,或者說將字符串轉換成 bytes 對象。
有以下三種方法可以達到這個目的:
- 如果字符串的內容都是 ASCII 字符,那么直接在字符串前面添加b前綴就可以轉換成
bytes
。 - bytes 是一個類,調用它的構造方法,也就是 bytes(),可以將字符串按照指定的字符集轉換成 bytes;如果不指定字符集,那么默認采用 UTF-8。
- 字符串本身有一個
encode()
方法,該方法專門用來將字符串按照指定的字符集轉換成對應的字節串;如果不指定字符集,那么默認采用 UTF-8。
1.bytes定義
例1:通過b'string
'定義bytes類型,但不支持中文(出現中文則報錯)
例2:可以通過string.encoding('utf-8')
將字符串轉換成bytes類型(兼容中文),還原通過bytes.decode('utf-8')
# coding:utf-8 if __name__ == '__main__': ? ? # 例1 ? ? b = b'abc123' ? ? print(b) ?# b'abc123' ? ? print(type(b)) ?#? ? # c = b'我abc123' Error ? ? # 例2 ? ? c = '我abc123' ? ? c = c.encode('utf-8') ? ? print(c) ?# b'\xe6\x88\x91abc123' ? ? print(type(c)) ?# ? ? print(c.decode('utf-8')) ?# 我abc123
2.bytes方法
例1:string有的方法bytes大部分都有(但其字符串參數必須是bytes類型)
# coding:utf-8 if __name__ == '__main__': ? ? b = b'abc123' ? ? print(b.find(b'a')) ?# 0 ? ? c = 'abc123' ? ? print(c.find('a')) ?# 0 ? ? # b.find('a') Error 參數必須是bytes ? ? print(b.replace(b'a', b'f')) ?# b'fbc123' ? ? print(c.replace('a', 'f')) ?# fbc123 ? ? # b.replace('a', 'f') Error 參數必須是bytes
3.使用不同方式創建 bytes 對象
#通過構造函數創建空 bytes b1 = bytes() #通過空字符串創建空 bytes b2 = b'' #通過b前綴將字符串轉換成 bytes b3 = b'http://c.biancheng.net/python/' print("b3: ", b3) print(b3[3]) print(b3[7:22]) #為 bytes() 方法指定字符集 b4 = bytes('C語言中文網8歲了', encoding='UTF-8') print("b4: ", b4) #通過 encode() 方法將字符串轉換成 bytes b5 = "C語言中文網8歲了".encode('UTF-8') print("b5: ", b5)
運行結果:
b3: ?b'http://c.biancheng.net/python/'
112
b'c.biancheng.net'
b4: ?b'C\xe8\xaf\xad\xe8\xa8\x80\xe4\xb8\xad\xe6\x96\x87\xe7\xbd\x918\xe5\xb2\x81\xe4\xba\x86'
b5: ?b'C\xe8\xaf\xad\xe8\xa8\x80\xe4\xb8\xad\xe6\x96\x87\xe7\xbd\x918\xe5\xb2\x81\xe4\xba\x86'
從運行結果可以發現,對于非 ASCII 字符,print 輸出的是它的字符編碼值(十六進制形式),而不是字符本身。非 ASCII 字符一般占用兩個字節以上的內存,而 bytes 是按照單個字節來處理數據的,所以不能一次處理多個字節。
原文鏈接:https://blog.csdn.net/qq_29744347/article/details/122926546
相關推薦
- 2022-06-15 Go語言學習之循環語句使用詳解_Golang
- 2023-12-07 ant 循環多條通知提醒框堆疊問題
- 2022-06-23 C語言一看就懂的選擇與循環語句及函數介紹_C 語言
- 2024-04-05 docker部署mongodb
- 2024-02-01 idea設置格式化豎線
- 2022-12-15 Python?OpenCV中cv2.minAreaRect實例解析_python
- 2022-06-15 C#數據類型實現背包、隊列和棧_C#教程
- 2022-04-11 following signatures couldn‘t be verified because
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支