日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

.net6環境下使用RestSharp請求GBK編碼網頁亂碼的解決方案_實用技巧

作者:阿炬 ? 更新時間: 2022-03-16 編程語言
public IActionResult GetHiPda()
        {
            cookies = @"__utmz=128828693.1622702936.1.1.utmcsr=(direct)|utmccn=(direct)|utmcmd=(none); cdb_cookietime=2592000; cdb_auth=fd05ACWP2GIZl8k0oqBaZUtQ8WjXIxIXESeqpdSfAzikXEX4tYdJM%2B4FIBRY7jXLyGQs0yjP3K2kgFK6MFe6fcJkrIH5; smile=1D1; discuz_fastpostrefresh=0; __utmc=128828693; cdb_visitedfid=2D6; cdb_sid=0ZwKQ7; __utma=128828693.1700824799.1622702936.1623767772.1623808037.73; __utmt=1; __utmb=128828693.1.10.1623808037; checkpm=1";
            string url = @"https://www.hi-pda.com/forum/forumdisplay.php?fid=2";
            var client = new RestClient(url);
            var request = new RestRequest();
            request.AddHeader("cookie", cookies);
            var response = client.Get(request);
            Encoding.RegisterProvider(CodePagesEncodingProvider.Instance);
            var data=HttpUtility.UrlDecode(response.RawBytes, Encoding.GetEncoding("gbk"));
            return Content(data);
        }

引入NuGet包:System.Text.Encoding.CodePages

CLR中的Encoding就是用于字節和字符之間的轉換的。

CLR中的Encoding是在System.Text命名空間下的,它是一個抽象類(abstract class),? 所以不能被直接實例化,它主要有如下的派生類:ASCIIEnding,UnicodeEncoding,UTF32Encoding,UTF7Encoding,UTF8Encoding,你可以根據需要選擇一個合適的Encoding來進行編碼和解碼。你也可以調用Encoding的靜態屬性ASCII,Unicode,UTF32,UTF7,UTF8,來構造一個Encoding。其中Unicode是表示16位Encoding。調用靜態屬性和實例化一個子類的效果是一樣的,如下代碼。

1 Encoding encodingUTF8 = Encoding.UTF8;

2 Encoding encodingUTF8 = new UTF8Encoding(true);

以下是這些類型的一些簡單描述:

  • ASCII編碼? 將16位字符編碼成ASCII碼,只能轉換值小于Ox0080的16字符,并且被轉換成單字節,就是說一個字符對應一個字節。當字符都在ASCII范圍(0X00~0X7F)內時,可以用這種編碼,它的速度非???,適合于英美地區的字符。這種編碼非常有限,漢字會被轉換成亂碼。在CLR對應ASCIIEndoing。
  • UTF-16? 每個字符編碼成2個字節,它不會對字符產生任何影響,也不會涉及到壓縮處理,性能非常好,因為CLR中的字符也是16位的Unicode。在CLR中對應UnicodeEncoding。
  • UTF-32? 使用4個字節編碼成一個字符。從內存角度上講,它并不是一種高效能的編碼方案,因為第個字符都是4個字節,特別占內存,所以很少用來做文件和網絡流的編碼解碼。在CLR中對應UTF32Encoding。
  • UTF-8? 值在Ox0080之下的字符壓縮成一個字符,也就是ASCII碼;值在0X0080---0X07FF之間的字符都轉換成2個字符,適合用于歐洲和中東地區。0X0800以上被轉換成3個字符,適合于東亞地區的字符。代理項被轉換成4個字節。因此,它是一種非常流行的編碼,適用于互聯網。它在處理0X0800以上的字符效率不好UTF-16。在CLR中對應UTF8Encoding。
  • UTF-7? 這咱編碼通常用于舊的系統,那時的系統是用7位值表示。目前已經被Unicode協淘汰。在CLR中對應UTF7Encoding。

原文鏈接:https://www.cnblogs.com/quejuwen/p/14888239.html

欄目分類
最近更新