OCR uitvoeren met taalselectie in Aspose.OCR

Invoering

In het steeds evoluerende technologische landschap speelt Optical Character Recognition (OCR) een cruciale rol bij het extraheren van betekenisvolle informatie uit afbeeldingen. Aspose.OCR voor Java onderscheidt zich als een krachtige tool waarmee ontwikkelaars OCR-mogelijkheden naadloos in hun Java-applicaties kunnen integreren. In deze stapsgewijze handleiding onderzoeken we hoe u OCR kunt uitvoeren met taalselectie met behulp van Aspose.OCR, waardoor het potentieel wordt ontsloten om diverse inhoud met precisie te verwerken.

Vereisten

Voordat u in de zelfstudie duikt, moet u ervoor zorgen dat u aan de volgende vereisten voldoet:

Java-ontwikkelomgeving: Zorg ervoor dat Java op uw systeem is geïnstalleerd en dat uw ontwikkelomgeving is ingesteld.
Aspose.OCR-bibliotheek: Download en installeer de Aspose.OCR-bibliotheek voor Java. U kunt de bibliotheek en bijbehorende documentatie vindenhier.
Afbeeldingsbestand: bereid een afbeeldingsbestand voor met de tekst die u wilt extraheren. Laten we bijvoorbeeld een bestand gebruiken met de naam ‘p3.png’.

Pakketten importeren

Importeer in uw Java-project de benodigde pakketten om de Aspose.OCR-functionaliteit te benutten. Voeg de volgende regels toe aan het begin van uw Java-bestand:

package com.aspose.ocr.examples.OcrFeatures;

import com.aspose.ocr.AsposeOCR;
import com.aspose.ocr.Language;
import com.aspose.ocr.License;
import com.aspose.ocr.RecognitionResult;
import com.aspose.ocr.RecognitionSettings;
import com.aspose.ocr.examples.License.SetLicense;
import com.aspose.ocr.examples.Utils;

import java.awt.*;
import java.io.IOException;
import java.util.ArrayList;

Stap 1: Stel uw documentenmap in

// Het pad naar de documentenmap.
String dataDir = "Your Document Directory";

Vervang “Uw documentenmap” door het daadwerkelijke pad naar de map waar uw afbeeldingsbestand zich bevindt.

Stap 2: Definieer het afbeeldingspad

// Het beeldpad
String file = dataDir + "p3.png";

Pas de bestandsvariabele aan zodat deze naar uw specifieke afbeeldingsbestand verwijst.

Stap 3: Maak een Aspose.OCR API-instantie

// API-instantie maken
AsposeOCR api = new AsposeOCR();

Initialiseer het AsposeOCR-object om toegang te krijgen tot de functies ervan.

Stap 4: Stel herkenningsopties in

// Herkenningsopties instellen
RecognitionSettings settings = new RecognitionSettings();
settings.setAutoSkew(false);
ArrayList<Rectangle> rectangles = new ArrayList<Rectangle>();
rectangles.add(new Rectangle(90, 186, 775, 95));
settings.setRecognitionAreas(rectangles);
settings.setSkew(0.5);
settings.setLanguage(Language.Eng);

Pas de herkenningsinstellingen aan op basis van uw vereisten. Pas parameters zoals scheefheid, taal en herkenningsgebieden aan.

Stap 5: Voer OCR uit en haal resultaten op

// Resultaatobject ophalen
RecognitionResult result = null;
try {
    result = api.RecognizePage(file, settings);
} catch (IOException e) {
    e.printStackTrace();
}

Voer de OCR-bewerking uit met behulp van het opgegeven afbeeldingsbestand en de opgegeven instellingen. Leg het resultaat vast in het RecognitionResult-object.

Stap 6: Resultaten afdrukken en gebruiken

// Resultaat afdrukken
System.out.println("Result: \n" + result.recognitionText + "\n\n");
for (String n : result.recognitionAreasText) {
    System.out.println(n);
}
for (Rectangle n : result.recognitionAreasRectangles) {
    System.out.println(n.height + ":" + n.width + ":" + n.x + ":" + n.y);
}
System.out.println("\nJSON:" + result.GetJson());
System.out.println("Angle:" + result.skew);
for (String n : result.warnings) {
    System.out.println(n);
}

System.out.println("OCROperationWithLanguageSelection: execution complete");

Druk de geëxtraheerde tekst, herkenningsgebieden, JSON-weergave, schuine hoek en eventuele waarschuwingen af. Gebruik de resultaten indien nodig in uw aanvraag.

Conclusie

In deze tutorial hebben we ons verdiept in de naadloze integratie van Aspose.OCR voor Java om OCR uit te voeren met taalselectie. Deze krachtige bibliotheek opent een wereld aan mogelijkheden voor ontwikkelaars die tekst nauwkeurig uit afbeeldingen willen extraheren.

Veelgestelde vragen

V1: Kan ik Aspose.OCR voor meerdere talen gebruiken in één herkenningsproces?

A1: Ja, u kunt meerdere talen instellen in RecognitionSettings om de herkenningsnauwkeurigheid van meertalige inhoud te verbeteren.

V2: Hoe kan ik omgaan met verschillende afbeeldingsformaten met Aspose.OCR?

A2: Aspose.OCR ondersteunt verschillende afbeeldingsformaten, waaronder PNG, JPEG en TIFF. Geef eenvoudigweg het juiste bestandspad op in de afbeeldingspadvariabele.

Vraag 3: Is er een limiet aan de grootte van de afbeelding die Aspose.OCR kan verwerken?

A3: Aspose.OCR kan afbeeldingen van verschillende groottes verwerken, maar grotere afbeeldingen vereisen mogelijk meer verwerkingstijd en middelen.

V4: Kan ik de herkenningsinstellingen voor specifieke regio’s binnen een afbeelding verfijnen?

A4: Absoluut. Gebruik de functie RecognitionAreas om specifieke rechthoeken binnen de afbeelding te definiëren voor gerichte herkenning.

Vraag 5: Is Aspose.OCR geschikt voor zowel persoonlijke als commerciële projecten?

A5: Ja, Aspose.OCR biedt flexibele licentieopties, waardoor het geschikt is voor zowel persoonlijk als commercieel gebruik.

OCR uitvoeren met de modus Gebieden detecteren in Aspose.OCR OCR Herkennen van PDF-documenten in Aspose.OCR voor Java