LEADTOOLS 入门教程: 自动识别和处理表单 – C# .NET Core

本文主要介绍如何使用leadtools自动识别和处理表单,欢迎查阅~

LEADTOOLS 是一个综合工具包的集合,用于将识别、文档、医疗、成像和多媒体技术整合到桌面、服务器、平板电脑、网络和移动解决方案中,是一项企业级文档自动化解决方案,有捕捉,OCR,OMR,表单识别和处理,PDF,打印捕获,归档,注释和显示功能。利用业界领先的图像处理技术,能够智能识别文件,可以用来识别任何类型的扫描或传真形式的图像。

本教程展示了如何LEADDocument使用 LEADTOOLS SDK 在 C# .NET Core 应用程序中向 a 添加页面和从中删除页面。

概括 AutoFormsEngine本教程介绍如何使用C# .NET Core 控制台应用程序中的高级类识别和处理表单。
完成时间 30分钟
视觉工作室项目 下载教程项目 (2 KB)
平台 C# .NET Core 控制台应用程序
IDE 视觉工作室 2019、2022
开发许可证 下载 LEADTOOLS

在学习从 LEADDocument中添加和删除页面 – C# .NET Core 教程之前,通过查看添加引用和设置许可教程来熟悉创建项目的基本步骤。

创建项目并添加 LEADTOOLS 参考

从添加引用和设置许可证教程中创建的项目的副本开始。如果您没有该项目,请按照该教程中的步骤创建它。

所需的参考资料取决于项目的目的。可以通过 NuGet 包添加引用。

本教程需要以下 NuGet 包:

  • Leadtools.Document.Sdk

有关您的应用程序需要哪些 DLL 文件的完整列表,请参阅您的应用程序中包含的文件。

设置许可文件

许可证解锁项目所需的功能。它必须在调用任何工具包函数之前设置。有关详细信息,包括针对不同平台的教程,请参阅设置运行时许可证。

有两种类型的运行时许可证:

  • 评估许可证,在下载评估工具包时获得。它允许评估工具包。
  • 部署许可证。如果需要部署许可证文件和开发人员密钥,请参阅获取许可证。
初始化 AutoFormsEngine、RasterCodes、IOcrEngine 和 DiskMasterFormsRepository

创建项目、添加参考和许可证集后,就可以开始编码了。

在解决方案资源管理器中,打开Program.cs. 将以下语句添加using到Program.cs.

【C#】

using System;using System.IO;using Leadtools;using Leadtools.Codecs;using Leadtools.Document;using Leadtools.Forms.Auto;using Leadtools.Forms.Processing;using Leadtools.Forms.Recognition;using Leadtools.Ocr;

将以下全局变量添加到Program类中。

【C#】

static AutoFormsEngine autoEngine;static RasterCodecs codecs;static IOcrEngine ocrEngine;static DiskMasterFormsRepository formsRepository;

Program向名为的类添加一个新方法InitFormsEngines()。调用set license调用下面的InitFormsEngines()方法里面的Main()方法,如下图。

【C#】

static void Main(string[] args){if (!SetLicense())Console.WriteLine("Error setting license");elseConsole.WriteLine("License file set successfully");InitFormsEngines();}

将以下代码添加到InitFormsEngines()方法中以初始化AutoFormsEngine、RasterCodecs、IOcrEngine和DiskMasterFormsRepository对象。

static void InitFormsEngines(){codecs = new RasterCodecs();ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD);ocrEngine.Startup(codecs, null, null, @"C:LEADTOOLS22BinCommonOcrLEADRuntime");formsRepository = new DiskMasterFormsRepository(codecs, @"C:LEADTOOLS22ResourcesImagesFormsMasterForm SetsOCR");autoEngine = new AutoFormsEngine(formsRepository, ocrEngine, null, AutoFormsRecognitionManager.Default | AutoFormsRecognitionManager.Ocr, 30, 80, true);Console.WriteLine("Engines initialized successfully!");}
添加表单识别和处理代码

在Program类中添加两个名为RecognizeAndProcessForm()和的新方法ShowProcessedResults(AutoFormsRunResult runResult)。在方法之后调用RecognizeAndProcessForm()方法内部的方法,如下一节所示。在方法的底部调用方法,作为重载传递,如下所示。MainInitFormsEngines()ShowProcessedResults()runResultRecognizeAndProcessForm()

将以下代码添加到RecognizeAndProcessForm()方法中,以根据主表单识别给定表单并处理表单以提取所需信息。

static void RecognizeAndProcessForm(){try{string resultMessage = "Form not recognized";string formToRecognize = @"C:LEADTOOLS22ResourcesImagesFormsForms to be RecognizedOCRW9_OCR_Filled.tif";AutoFormsRunResult runResult = autoEngine.Run(formToRecognize, null);if (runResult != null){FormRecognitionResult recognitionResult = runResult.RecognitionResult.Result;resultMessage = $@"This form has been recognized as a {runResult.RecognitionResult.MasterForm.Name} with {recognitionResult.Confidence}% confidence.";}Console.WriteLine("Recognition Results:");Console.WriteLine(resultMessage);Console.WriteLine("=========================================================================");ShowProcessedResults(runResult);}catch (Exception ex){Console.WriteLine(ex.Message);}}

将以下代码添加到ShowProcessedResults()方法中,以将方法的处理结果显示RecognizeAndProcessForm()到控制台。

// Output Processed Resultsprivate static void ShowProcessedResults(AutoFormsRunResult runResult){if (runResult == null)return;string resultsMessage = "";try{foreach (FormPage formPage in runResult.FormFields)foreach (FormField field in formPage)if (field != null)resultsMessage = $"{resultsMessage}{field.Name} = {(field.Result as TextFormFieldResult).Text}n";}catch (Exception ex){Console.WriteLine(ex.Message);}if (string.IsNullOrEmpty(resultsMessage)){Console.WriteLine("Field Processing Results");Console.WriteLine("No fields were processed");Console.WriteLine("Press any key to exit . . .");Console.ReadKey(true);}else{Console.WriteLine("Field Processing Results:");Console.WriteLine(resultsMessage);Console.WriteLine("Press any key to exit . . .");Console.ReadKey(true);}}

LEADTOOLS SDK 随附并安装的是样本主表单集和样本填写表单,用于识别和处理。本教程使用这些示例。示例文件安装在<INSTALL_DIR>LEADTOOLS22ResourcesImagesForms.

关闭 OCR 引擎
static void Main(string[] args){if (!SetLicense())Console.WriteLine("Error setting license");elseConsole.WriteLine("License file set successfully");InitFormsEngines();RecognizeAndProcessForm();autoEngine.Dispose();if (ocrEngine != null && ocrEngine.IsStarted)ocrEngine.Shutdown();}
处理流

如果您想使用内存流加载表单,请在下面的RecognizeAndProcessForm()方法中添加以下代码string formToRecognize = @”C:LEADTOOLS22ResourcesImagesFormsForms to be RecognizedOCRW9_OCR_Filled.tif”;:

【C#】

using (var stream = File.OpenRead(formToRecognize)){var options = new LoadDocumentOptions();using (var document = DocumentFactory.LoadFromStream(stream, options)){// Console commands to double check that the document was loaded properlyConsole.WriteLine(document.DocumentId);Console.WriteLine("Document loaded");}}

F5或选择Debug -> Start Debugging运行项目。

如果正确执行了这些步骤,则会出现控制台并显示以下数据结果:

  1. 公认的形式和置信度值(例如,置信度为 98% 的 W9。)
  2. 处理后的填写数据(例如,公司名称、地址等)

控制台显示已识别的表格和已填写表格的处理结果。

在此示例中,使用了 W-9 表格。它被正确识别,置信度为 98%(其中 0 表示没有置信度,100% 表示完全置信度)。

以上便自动识别和处理表单 – C# .NET Core,如果您还有其他疑问,欢迎咨询我们或者加入我们官方技术交流群。


欢迎下载|体验更多LEADTOOL产品

您还可以加入产品:


标签:

来源:慧都

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年9月17日
下一篇 2022年9月17日

相关推荐

发表回复

登录后才能评论