Wykonywanie OCR z wyborem języka w Aspose.OCR

Wstęp

W stale rozwijającym się środowisku technologicznym optyczne rozpoznawanie znaków (OCR) odgrywa kluczową rolę w wydobywaniu znaczących informacji z obrazów. Aspose.OCR for Java wyróżnia się jako potężne narzędzie, które umożliwia programistom bezproblemową integrację funkcji OCR z aplikacjami Java. W tym przewodniku krok po kroku odkryjemy, jak wykonać OCR z wyborem języka za pomocą Aspose.OCR, odblokowując potencjał precyzyjnego przetwarzania różnorodnych treści.

Warunki wstępne

Zanim przejdziesz do samouczka, upewnij się, że spełniasz następujące wymagania wstępne:

  • Środowisko programistyczne Java: Upewnij się, że masz zainstalowaną Javę w swoim systemie i środowisko programistyczne jest skonfigurowane.

  • Biblioteka Aspose.OCR: Pobierz i zainstaluj bibliotekę Aspose.OCR dla języka Java. Można znaleźć bibliotekę i powiązaną dokumentacjęTutaj.

  • Plik obrazu: Przygotuj plik obrazu zawierający tekst, który chcesz wyodrębnić. Na przykład użyjmy pliku o nazwie „p3.png”.

Importuj pakiety

W swoim projekcie Java zaimportuj niezbędne pakiety, aby wykorzystać funkcjonalność Aspose.OCR. Dodaj następujące wiersze na początku pliku Java:

package com.aspose.ocr.examples.OcrFeatures;

import com.aspose.ocr.AsposeOCR;
import com.aspose.ocr.Language;
import com.aspose.ocr.License;
import com.aspose.ocr.RecognitionResult;
import com.aspose.ocr.RecognitionSettings;
import com.aspose.ocr.examples.License.SetLicense;
import com.aspose.ocr.examples.Utils;

import java.awt.*;
import java.io.IOException;
import java.util.ArrayList;

Krok 1: Skonfiguruj katalog dokumentów

// Ścieżka do katalogu dokumentów.
String dataDir = "Your Document Directory";

Zastąp „Twój katalog dokumentów” rzeczywistą ścieżką do katalogu, w którym znajduje się plik obrazu.

Krok 2: Zdefiniuj ścieżkę obrazu

// Ścieżka obrazu
String file = dataDir + "p3.png";

Dostosuj zmienną pliku, aby wskazywała konkretny plik obrazu.

Krok 3: Utwórz instancję API Aspose.OCR

// Utwórz instancję API
AsposeOCR api = new AsposeOCR();

Zainicjuj obiekt AsposeOCR, aby uzyskać dostęp do jego funkcji.

Krok 4: Ustaw opcje rozpoznawania

// Ustaw opcje rozpoznawania
RecognitionSettings settings = new RecognitionSettings();
settings.setAutoSkew(false);
ArrayList<Rectangle> rectangles = new ArrayList<Rectangle>();
rectangles.add(new Rectangle(90, 186, 775, 95));
settings.setRecognitionAreas(rectangles);
settings.setSkew(0.5);
settings.setLanguage(Language.Eng);

Dostosuj ustawienia rozpoznawania w oparciu o swoje wymagania. Dostosuj parametry, takie jak pochylenie, język i obszary rozpoznawania.

Krok 5: Wykonaj OCR i pobierz wyniki

// Pobierz obiekt wynikowy
RecognitionResult result = null;
try {
    result = api.RecognizePage(file, settings);
} catch (IOException e) {
    e.printStackTrace();
}

Wykonaj operację OCR, korzystając z określonego pliku obrazu i ustawień. Przechwyć wynik w obiekcie RecognitionResult.

Krok 6: Wydrukuj i wykorzystaj wyniki

// Wydrukuj wynik
System.out.println("Result: \n" + result.recognitionText + "\n\n");
for (String n : result.recognitionAreasText) {
    System.out.println(n);
}
for (Rectangle n : result.recognitionAreasRectangles) {
    System.out.println(n.height + ":" + n.width + ":" + n.x + ":" + n.y);
}
System.out.println("\nJSON:" + result.GetJson());
System.out.println("Angle:" + result.skew);
for (String n : result.warnings) {
    System.out.println(n);
}

System.out.println("OCROperationWithLanguageSelection: execution complete");

Wydrukuj wyodrębniony tekst, rozpoznawane obszary, reprezentację JSON, kąt pochylenia i wszelkie ostrzeżenia. Użyj wyników w razie potrzeby w swojej aplikacji.

Wniosek

W tym samouczku zagłębiliśmy się w płynną integrację Aspose.OCR dla Java w celu wykonywania OCR z wyborem języka. Ta potężna biblioteka otwiera świat możliwości dla programistów, którzy chcą dokładnie wyodrębnić tekst z obrazów.

Często zadawane pytania

P1: Czy mogę używać Aspose.OCR dla wielu języków w jednym procesie rozpoznawania?

O1: Tak, możesz ustawić wiele języków w Ustawieniach rozpoznawania, aby zwiększyć dokładność rozpoznawania treści wielojęzycznych.

P2: Jak mogę obsługiwać różne formaty obrazów za pomocą Aspose.OCR?

O2: Aspose.OCR obsługuje różne formaty obrazów, w tym PNG, JPEG i TIFF. Po prostu podaj poprawną ścieżkę pliku w zmiennej ścieżki obrazu.

P3: Czy istnieje ograniczenie rozmiaru obrazu, który może przetworzyć Aspose.OCR?

O3: Aspose.OCR może obsługiwać obrazy o różnych rozmiarach, ale większe obrazy mogą wymagać więcej czasu przetwarzania i zasobów.

P4: Czy mogę dostosować ustawienia rozpoznawania dla określonych obszarów obrazu?

A4: Absolutnie. Skorzystaj z funkcji RecognitionAreas, aby zdefiniować określone prostokąty w obrazie w celu ukierunkowanego rozpoznania.

P5: Czy Aspose.OCR nadaje się zarówno do projektów osobistych, jak i komercyjnych?

Odpowiedź 5: Tak, Aspose.OCR oferuje elastyczne opcje licencjonowania, dzięki czemu nadaje się zarówno do użytku osobistego, jak i komercyjnego.