日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

C#使用Tesseract進行Ocr識別的方法實現_C#教程

作者:桿楷 ? 更新時間: 2022-08-06 編程語言

1.Nuget搜索Tesseract

2.項目安裝Tesseract

3.引用命名空間

using Tesseract;

4.上Github下載別人的訓練庫

https://github.com/tesseract-ocr/tessdata?這里下載中文的chi_sim.traineddata,放到了D盤根目錄

5.選擇圖片進行識別

我把圖片命名為image.jpg放在了D盤根目錄

//圖片文件路徑
string imageFileName = @"D:\image.png";
//創建位圖對象
Bitmap image = new Bitmap(imageFileName);
 
//Tesseract.Page
Page page = new TesseractEngine(@"D:\", "chi_sim", EngineMode.Default).Process(PixConverter.ToPix(image));
//釋放程序對圖片的占用
image.Dispose();
 
//打印識別率
Console.WriteLine(String.Format("{0:P}", page.GetMeanConfidence()));
//打印識別文本 //替換'/n'為'(空)'//替換'(空格)'為'(空)'
Console.WriteLine(page.GetText().Replace("\n", "").Replace(" ", ""));

識別率為百分之84,識別文字為立白liby

原文鏈接:https://blog.csdn.net/weixin_46616558/article/details/125179506

欄目分類
最近更新