Oprava výsledku s kontrolou pravopisu v rozpoznávání obrazu OCR

Úvod

oblasti optického rozpoznávání znaků (OCR) je dosažení přesných výsledků zásadní pro extrakci smysluplných informací z obrázků. Jedním z běžných problémů je řešení chybně napsaných slov v procesu rozpoznávání. Naštěstí Aspose.OCR for .NET poskytuje výkonné řešení pro vylepšení výsledků OCR pomocí kontroly pravopisu.

Tento tutoriál vás provede procesem opravy výsledků s kontrolou pravopisu pomocí Aspose.OCR pro .NET. Nakonec budete vybaveni ke zlepšení přesnosti textu odvozeného z OCR a zajistíte tak jemnější a bezchybnější výstup.

Předpoklady

Než se ponoříme do kouzla kontroly pravopisu, ujistěte se, že máte splněny následující předpoklady:

  • Aspose.OCR for .NET Library: Stáhněte si a nainstalujte knihovnu Aspose.OCR zstránka vydání.

  • Adresář dokumentů: Ujistěte se, že máte určený adresář pro vaše dokumenty. Nahraďte “Your Document Directory” ve fragmentech kódu skutečnou cestou.

Importovat jmenné prostory

Začněme importem potřebných jmenných prostorů do vašeho projektu .NET:

using System;
using Aspose.OCR.SpellChecker;
using System.Collections.Generic;

Krok 1: Inicializujte Aspose.OCR

Inicializací instance Aspose.OCR nastartujete proces OCR.

// Cesta k adresáři dokumentů.
string dataDir = "Your Document Directory";

// Inicializujte instanci AsposeOcr
AsposeOcr api = new AsposeOcr();

Krok 2: Rozpoznejte obrázek

Dále rozpoznávejte text v obrázku pomocí Aspose.OCR. Zde je úryvek demonstrující tento proces:

// Rozpoznat obrázek
RecognitionResult result = api.RecognizeImage(dataDir + "sample_bad.png", new RecognitionSettings(Language.Eng));

Krok 3: Před opravou

Před opravou načtěte výsledek OCR, abyste jej mohli porovnat s opravenou verzí.

// Získejte výsledek
Console.WriteLine("BEFORE CORRECTION:\n" + result.RecognitionText);

Krok 4: Po opravě

Chcete-li získat opravený výsledek, použijte kontrolu pravopisu. Tento krok ilustruje následující fragment kódu:

// Získejte opravený výsledek
string correctedResult = result.GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
Console.WriteLine("AFTER CORRECTION:\n" + correctedResult);

Krok 5: Nesprávně napsaná slova a návrhy

Získejte seznam chybně napsaných slov spolu s navrhovanými opravami pomocí následujícího kódu:

// Získejte seznam chybně napsaných slov s návrhy
List<SpellCheckError> errorsList = result.GetSpellCheckErrorList(SpellCheckLanguage.Eng);
foreach (var word in errorsList)
{
	Console.Write("Word:" + word.Word);
	Console.Write(" StartPosition:" + word.StartPosition);
	Console.WriteLine(" Length:" + word.Length);
	Console.WriteLine("SuggestedWords:");
	foreach (var suggest in word.SuggestedWords)
	{
		Console.Write(suggest.Word + " ");
	}
	Console.WriteLine();
}

Krok 6: Opravte uživatelský text

Opravte konkrétní text zadaný uživatelem pomocí knihovny Aspose.OCR:

// Správný uživatelský text
Console.WriteLine("recogniition -> " + api.CorrectSpelling("recogniition"));

Krok 7: Oprava pomocí uživatelského slovníku

Dále vylepšete opravu začleněním vlastního uživatelského slovníku:

// Získejte opravený výsledek pomocí uživatelského slovníku
string correctedResultUserDict = result.GetSpellCheckCorrectedText(SpellCheckLanguage.Eng, dataDir+"dictionary.txt");
Console.WriteLine("AFTER CORRECTION WITH USER DICTIONARY:\n" + correctedResultUserDict);

Závěr

Gratulujeme! Úspěšně jste prošli možnostmi kontroly pravopisu Aspose.OCR pro .NET. Tato funkce vám umožňuje zpřesnit výsledky OCR, zajistit přesnost a eliminovat chyby.

FAQ

Q1: Mohu použít Aspose.OCR pro jiné jazyky než angličtinu?

A1: Ano, Aspose.OCR podporuje více jazyků. Upravte odpovídajícím způsobem nastavení jazyka.

Q2: Jak integruji Aspose.OCR do mého projektu .NET?

A2: Vizdokumentace pro podrobné integrační kroky.

Q3: Je k dispozici zkušební verze pro Aspose.OCR?

A3: Ano, můžete prozkoumat funkce pomocízkušební verze zdarma.

Q4: Mohu nahrát vlastní slovník pro kontrolu pravopisu?

A4: Rozhodně! Výukový program ukazuje, jak zlepšit opravu pomocí slovníku poskytnutého uživatelem.

Q5: Kde mohu hledat podporu pro Aspose.OCR?

A5: NavštivteFórum Aspose.OCR za podporu a vedení komunity.