網(wǎng)站首頁 編程語言 正文
前言;
Python bytes
類型用來表示一個字節(jié)串。“字節(jié)串“不是編程術(shù)語,是我自己“捏造”的一個詞,用來和字符串相呼應。
bytes 是 Python 3.x 新增的類型,在 Python 2.x
中是不存在的。
字節(jié)串(bytes)和字符串(string)的對比:
- 字符串由若干個字符組成,以字符為單位進行操作;字節(jié)串由若干個字節(jié)組成,以字節(jié)為單位進行操作。
- 字節(jié)串和字符串除了操作的數(shù)據(jù)單元不同之外,它們支持的所有方法都基本相同。
- 字節(jié)串和字符串都是不可變序列,不能隨意增加和刪除數(shù)據(jù)。
bytes
只負責以字節(jié)序列的形式(二進制形式)來存儲數(shù)據(jù),至于這些數(shù)據(jù)到底表示什么內(nèi)容(字符串、數(shù)字、圖片、音頻等),完全由程序的解析方式?jīng)Q定。如果采用合適的字符編碼方式(字符集),字節(jié)串可以恢復成字符串;反之亦然,字符串也可以轉(zhuǎn)換成字節(jié)串。
說白了,bytes 只是簡單地記錄內(nèi)存中的原始數(shù)據(jù),至于如何使用這些數(shù)據(jù),bytes 并不在意,你想怎么使用就怎么使用,bytes 并不約束你的行為。
bytes 類型的數(shù)據(jù)非常適合在互聯(lián)網(wǎng)上傳輸,可以用于網(wǎng)絡(luò)通信編程;bytes
也可以用來存儲圖片、音頻、視頻等二進制格式的文件。
字符串和 bytes 存在著千絲萬縷的聯(lián)系,我們可以通過字符串來創(chuàng)建 bytes
對象,或者說將字符串轉(zhuǎn)換成 bytes 對象。
有以下三種方法可以達到這個目的:
- 如果字符串的內(nèi)容都是 ASCII 字符,那么直接在字符串前面添加b前綴就可以轉(zhuǎn)換成
bytes
。 - bytes 是一個類,調(diào)用它的構(gòu)造方法,也就是 bytes(),可以將字符串按照指定的字符集轉(zhuǎn)換成 bytes;如果不指定字符集,那么默認采用 UTF-8。
- 字符串本身有一個
encode()
方法,該方法專門用來將字符串按照指定的字符集轉(zhuǎn)換成對應的字節(jié)串;如果不指定字符集,那么默認采用 UTF-8。
1.bytes定義
例1:通過b'string
'定義bytes類型,但不支持中文(出現(xiàn)中文則報錯)
例2:可以通過string.encoding('utf-8')
將字符串轉(zhuǎn)換成bytes類型(兼容中文),還原通過bytes.decode('utf-8')
# coding:utf-8 if __name__ == '__main__': ? ? # 例1 ? ? b = b'abc123' ? ? print(b) ?# b'abc123' ? ? print(type(b)) ?#? ? # c = b'我abc123' Error ? ? # 例2 ? ? c = '我abc123' ? ? c = c.encode('utf-8') ? ? print(c) ?# b'\xe6\x88\x91abc123' ? ? print(type(c)) ?# ? ? print(c.decode('utf-8')) ?# 我abc123
2.bytes方法
例1:string有的方法bytes大部分都有(但其字符串參數(shù)必須是bytes類型)
# coding:utf-8 if __name__ == '__main__': ? ? b = b'abc123' ? ? print(b.find(b'a')) ?# 0 ? ? c = 'abc123' ? ? print(c.find('a')) ?# 0 ? ? # b.find('a') Error 參數(shù)必須是bytes ? ? print(b.replace(b'a', b'f')) ?# b'fbc123' ? ? print(c.replace('a', 'f')) ?# fbc123 ? ? # b.replace('a', 'f') Error 參數(shù)必須是bytes
3.使用不同方式創(chuàng)建 bytes 對象
#通過構(gòu)造函數(shù)創(chuàng)建空 bytes b1 = bytes() #通過空字符串創(chuàng)建空 bytes b2 = b'' #通過b前綴將字符串轉(zhuǎn)換成 bytes b3 = b'http://c.biancheng.net/python/' print("b3: ", b3) print(b3[3]) print(b3[7:22]) #為 bytes() 方法指定字符集 b4 = bytes('C語言中文網(wǎng)8歲了', encoding='UTF-8') print("b4: ", b4) #通過 encode() 方法將字符串轉(zhuǎn)換成 bytes b5 = "C語言中文網(wǎng)8歲了".encode('UTF-8') print("b5: ", b5)
運行結(jié)果:
b3: ?b'http://c.biancheng.net/python/'
112
b'c.biancheng.net'
b4: ?b'C\xe8\xaf\xad\xe8\xa8\x80\xe4\xb8\xad\xe6\x96\x87\xe7\xbd\x918\xe5\xb2\x81\xe4\xba\x86'
b5: ?b'C\xe8\xaf\xad\xe8\xa8\x80\xe4\xb8\xad\xe6\x96\x87\xe7\xbd\x918\xe5\xb2\x81\xe4\xba\x86'
從運行結(jié)果可以發(fā)現(xiàn),對于非 ASCII 字符,print 輸出的是它的字符編碼值(十六進制形式),而不是字符本身。非 ASCII 字符一般占用兩個字節(jié)以上的內(nèi)存,而 bytes 是按照單個字節(jié)來處理數(shù)據(jù)的,所以不能一次處理多個字節(jié)。
原文鏈接:https://blog.csdn.net/qq_29744347/article/details/122926546
相關(guān)推薦
- 2022-06-01 詳解C語言中二分查找的運用技巧_C 語言
- 2022-11-03 C/C++預處理淺析使用形式_C 語言
- 2022-04-12 Oracle同步數(shù)據(jù)到kafka的方法_oracle
- 2022-12-23 C++?Boost?Exception超詳細講解_C 語言
- 2022-05-13 C++ std::thread 線程的傳參方式
- 2023-02-10 C/C++中智能指針的用法詳解_C 語言
- 2022-07-18 Kotlin 正確退出 foreach、foreachIndexed 循環(huán)函數(shù)
- 2023-07-10 解決flask (flask-restful)中文亂碼問題
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細win安裝深度學習環(huán)境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡單動態(tài)字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支