網(wǎng)站首頁(yè) 編程語(yǔ)言 正文
Unicode是計(jì)算機(jī)科學(xué)領(lǐng)域里的一項(xiàng)業(yè)界標(biāo)準(zhǔn),包括字符集、編碼方案等。Unicode 是為了解決傳統(tǒng)的字符編碼方案的局限而產(chǎn)生的,它為每種語(yǔ)言中的每個(gè)字符設(shè)定了統(tǒng)一并且唯一的二進(jìn)制編碼,以滿足跨語(yǔ)言、跨平臺(tái)進(jìn)行文本轉(zhuǎn)換、處理的要求。
在表示一個(gè)Unicode的字符時(shí),通常會(huì)用“U+”然后緊接著一組十六進(jìn)制的數(shù)字來(lái)表示這一個(gè)字符。在 基本多文種平面里的所有字符,要用四位十六進(jìn)制數(shù);在零號(hào)平面以外的字符則需要使用五位或六位十六進(jìn)制數(shù)了。
string str = @"\u0005 \u0002\U00f3 \U +e9\u00e9";
string newStr = UnicodeDecode(str);
Console.WriteLine(newStr);
Console.WriteLine();
newStr = ToUnicode("0 - * @ , 。 ? 真的 繁體字");
Console.WriteLine(newStr);
Console.WriteLine();
正常字符轉(zhuǎn)換為unicode
/// <summary>
/// 對(duì)正常的字符串轉(zhuǎn)換為 Unicode 的字符串
/// </summary>
/// <param name="normalStr">正常的字符串</param>
/// <param name="isIgnoreSpace">是否忽略空格符;默認(rèn) true 空格符不轉(zhuǎn)換;false 空格符要轉(zhuǎn)換</param>
/// <param name="isUpperCaseU">是否大寫(xiě)U字母 ‘\U';默認(rèn) false ‘\u'</param>
/// <returns></returns>
public string ToUnicode(this string normalStr, bool isIgnoreSpace = true, bool isUpperCaseU = false)
{
if (string.IsNullOrEmpty(normalStr))
{
return string.Empty;
}
StringBuilder strResult = new StringBuilder();
void func(int index)
{
if (isUpperCaseU)
{
strResult.Append("\\U");
}
else
{
strResult.Append("\\u");
}
strResult.Append(((int)normalStr[index]).ToString("x").PadLeft(4, '0'));
}
for (int i = 0; i < normalStr.Length; i++)
{
if (isIgnoreSpace)
{
if (normalStr[i] == ' ')
{
strResult.Append(" ");
}
else
{
func(i);
}
}
else
{
func(i);
}
}
return strResult.ToString();
}
解碼
/// <summary>
/// 對(duì) Unicode 的字符串解碼
/// </summary>
/// <param name="unicodeStr">Unicode 字符串</param>
/// <returns></returns>
public string UnicodeDecode(string unicodeStr)
{
if (string.IsNullOrWhiteSpace(unicodeStr) || (!unicodeStr.Contains("\\u") && !unicodeStr.Contains("\\U")))
{
return unicodeStr;
}
string newStr = Regex.Replace(unicodeStr, @"\\[uU](.{4})", (m) =>
{
string unicode = m.Groups[1].Value;
if (int.TryParse(unicode, System.Globalization.NumberStyles.HexNumber, null, out int temp))
{
return ((char)temp).ToString();
}
else
{
return m.Groups[0].Value;
}
}, RegexOptions.Singleline);
return newStr;
}
原文鏈接:https://blog.csdn.net/qq_39569480/article/details/125082358
相關(guān)推薦
- 2022-10-18 Go項(xiàng)目怎么使用枚舉_Golang
- 2021-12-07 Linux下Hbase安裝配置教程_Linux
- 2022-08-04 Python使用RPC例子_python
- 2022-07-28 Python知識(shí)點(diǎn)詳解之正則表達(dá)式語(yǔ)法_python
- 2022-03-15 this.$cookie.set(‘token‘, data.token) token賦值失效
- 2022-10-29 C++ 函數(shù)模板的重載與實(shí)參推斷
- 2024-02-25 Navicat提示Access violation at address **** in modul
- 2023-01-05 Go語(yǔ)音開(kāi)發(fā)中常見(jiàn)Error類型處理示例詳解_Golang
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細(xì)win安裝深度學(xué)習(xí)環(huán)境2025年最新版(
- Linux 中運(yùn)行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲(chǔ)小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運(yùn)算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認(rèn)證信息的處理
- Spring Security之認(rèn)證過(guò)濾器
- Spring Security概述快速入門(mén)
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯(cuò)誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實(shí)現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡(jiǎn)單動(dòng)態(tài)字符串(SD
- arthas操作spring被代理目標(biāo)對(duì)象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊(duì)列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠(yuǎn)程分支