網站首頁 編程語言 正文
1、如何去掉字符串中不需要的字符?
實際案例:
(1)過濾掉用戶輸入前后多余的空白字符:' nick2008@gmail.com '
(2)過濾某windows下編輯文本中的'\r':'hello world\r\n'
(3)去掉文本中的unicode組合符號(調音):u'ní hǎo, chī fàn'(或 èěéēàǎā)
解決方案;
方法1:字符串strip(),lstrip(),rstrip()方法去掉字符串兩端字符。
方法2:刪除單個固定位置的字符,可以使用切片+拼接的方式。
方法3:字符串的replace()替換方法或正則表達式re.sub()刪除任意位置字符。(通用)
方法4:字符串translate()方法,可以同時刪除多種不同字符。
2、代碼演示
# 方法1:strip類的方法
# 去掉字符串兩端的字符
s = ' abc 123 '
'''
str.strip方法介紹:
strip([chars]) -> string or unicode
chars不指定默認情況下去掉空白字符(空格,\n,\t,\r)
'''
# 去掉兩端空白,但保留了中間的空白
print(s.strip())
# 只去掉左端的空白
print(s.lstrip())
# 只去掉右端的空白
print(s.rstrip())
s2 = '---abc+++'
# 去掉s2中的加減
print(s2.strip('-+'))
# 方法2:刪除固定位置字符,切片+拼接
s3 = 'abc:123'
# 只刪除固定位置的冒號
s4 = s3[0:3] + s3[4:]
print(s4)
# 方法3:
'''
因為第1種方法不能刪除中間的某些字符,只能在兩端進行刪除,
第3種就能完成刪除中間某些字符的事情。
'''
s5 = '\tabc\t123\txyz'
# 清除s5中的所有\t,可以使用字符串替換replace,
# 但是這種方式只能替換一種
print(s5.replace('\t', ''))
s6 = '\tabc\t123\txyz\ropq\r'
import re
# 去除s6中的\t和\r
print(re.sub('[\t\r]', '', s6))
# 方法4:
'''
str.translate方法介紹:
S.translate(table) -> string
table如果是None不做任何映射,如果存在就是一個字符映射到另一個字符上去的表;
'''
s7 = 'abc1230323xyz'
# 現在對s7字符串進行加密,加密規則是將其中a全部替換成x,
# b替換成y,c替換成z,反過來將其中的xyz分別替換成abc
# 構建映射表
make = str.maketrans('abcxyz', 'xyzabc')
print(make)
# 對s7字符串進行加密轉換
print(s7.translate(make))
s8 = 'abc\refg\n2342\t'
# 刪除s8中\r,\n,\t,構建映射表str_trans
str_trans = str.maketrans('', '', '\t\r\n')
print(s8.translate(str_trans))
# 去掉音標符號
u = u'nǐ hǎo, chī fàn'
import unicodedata, sys
# 將原始輸入標準化為分解形式字符
a = unicodedata.normalize('NFD', u)
'''
使用dict.fromkeys() 方法構造一個字典,每個Unicode和音調作為鍵,對應的值全部為None
sys.maxunicode : 給出最大Unicode代碼點的值的整數,即1114111(十六進制的0x10FFFF)。
unicodedata.combining:將分配給字符chr的規范組合類作為整數返回。如果未定義組合類,則返回0
這樣我們就成功將所有組合類的值全部設置為None
'''
cmb_chrs = dict.fromkeys(c for c in range(sys.maxunicode)
if unicodedata.combining(chr(c)))
# 調用translate函數刪除所有音調
print(a.translate(cmb_chrs))
總結
原文鏈接:https://blog.csdn.net/qq_37189082/article/details/124546253
相關推薦
- 2024-01-06 關于class.getClassLoader().getResourceAsStream()和cla
- 2022-11-25 Python?RawString與open文件的newline換行符遇坑解決_python
- 2022-09-08 Go語言中make和new函數的用法與區別_Golang
- 2022-05-13 eigen交叉編譯
- 2024-03-20 spring-boot-maven-plugin報紅的解決辦法
- 2023-05-30 Jquery使用原生AJAX方法請求數據_jquery
- 2022-12-19 Oracle?Instr函數實例講解_oracle
- 2022-06-19 docker容器非root用戶提權的問題解決_docker
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支