Hoe krijg je toegang tot de geëxtraheerde tekst uit een afbeelding met behulp van de Google Vision API?

by EITCA Academie / Woensdag, december 27 2023 / Gepubliceerd in Artificial Intelligence, EITC/AI/GVAPI Google Vision API, Tekst in visuele gegevens begrijpen, Handgeschreven tekst detecteren en extraheren, Examenoverzicht

Om toegang te krijgen tot de geëxtraheerde tekst uit een afbeelding met behulp van de Google Vision API, kunt u een reeks stappen volgen waarbij u gebruikmaakt van de Optical Character Recognition (OCR)-mogelijkheden van de API. De OCR-technologie in de Google Vision API maakt de detectie en extractie van tekst uit afbeeldingen mogelijk, inclusief handschrift. Deze functionaliteit is vooral handig in toepassingen die de analyse en het begrip van tekstuele informatie in visuele gegevens vereisen.

Ten eerste moet u de benodigde omgeving opzetten om met de Google Vision API te werken. Dit omvat het maken van een project in de Google Cloud Console, het inschakelen van de Vision API en het verkrijgen van de vereiste authenticatiegegevens, zoals een API-sleutel of serviceaccountsleutel.

Zodra uw omgeving is ingesteld, kunt u gebruik maken van de `asyncBatchAnnotateFiles`-methode van de Vision API om OCR uit te voeren op een afbeeldingsbestand. Met deze methode kunt u een lijst met afbeeldingsbestanden doorgeven voor verwerking en de resultaten asynchroon ontvangen. Als alternatief kunt u de methode `asyncBatchAnnotateImages` gebruiken om een lijst met afbeeldingen rechtstreeks te verwerken.

Om tekst uit een afbeelding te extraheren, moet u een exemplaar van het `AnnotateImageRequest`-object maken en de gewenste functies opgeven. In dit geval zou u de functie `TEXT_DETECTION` instellen om aan te geven dat u tekst uit de afbeelding wilt extraheren. U kunt ook aanvullende parameters opgeven, zoals de taalhint, om de nauwkeurigheid van de OCR te verbeteren.

Vervolgens moet u het afbeeldingsbestand coderen in een base64-gecodeerde string en een exemplaar van het `Image`-object maken met behulp van de gecodeerde afbeeldingsgegevens. Dit `Image`-object moet worden toegevoegd aan het `AnnotateImageRequest`-object dat eerder is gemaakt.

Nadat u het verzoek heeft ingesteld, kunt u het naar de Vision API sturen met behulp van de methode `batchAnnotateImages` of `batchAnnotateFiles`, afhankelijk van de door u gekozen aanpak. De API verwerkt de afbeelding en retourneert een antwoord met de geëxtraheerde tekst.

Om toegang te krijgen tot de geëxtraheerde tekst uit het antwoord, kunt u het veld 'textAnnotations' van het object 'AnnotateImageResponse' herhalen. Dit veld bevat een lijst met 'EntityAnnotation'-objecten, die elk een gedetecteerd tekstelement in de afbeelding vertegenwoordigen. Het veld 'description' van elk object 'EntityAnnotation' bevat de geëxtraheerde tekst.

Hier is een voorbeeldcodefragment in Python dat laat zien hoe u toegang krijgt tot de geëxtraheerde tekst uit een afbeelding met behulp van de Google Vision API:

python
from google.cloud import vision

def extract_text_from_image(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)

    request = vision.AnnotateImageRequest(
        image=image,
        features=[{'type': vision.Feature.Type.TEXT_DETECTION}]
    )

    response = client.batch_annotate_images(requests=[request])

    for annotation in response.responses[0].text_annotations:
        extracted_text = annotation.description
        print(extracted_text)

# Usage
extract_text_from_image('path_to_image.jpg')

In dit voorbeeld neemt de functie `extract_text_from_image` het pad naar een afbeeldingsbestand als invoer en gebruikt de Google Cloud Vision-clientbibliotheek om een verzoek naar de Vision API te sturen. De geëxtraheerde tekst wordt vervolgens afgedrukt.

Om toegang te krijgen tot de geëxtraheerde tekst uit een afbeelding met behulp van de Google Vision API, moet u de omgeving instellen, een `AnnotateImageRequest`-object maken met de gewenste functies, het afbeeldingsbestand coderen, het verzoek naar de API sturen en de geëxtraheerde tekst ophalen. uit de reactie. De OCR-mogelijkheden van de Vision API maken de detectie en extractie van tekst uit afbeeldingen mogelijk, inclusief handschrift.

Andere recente vragen en antwoorden over Handgeschreven tekst detecteren en extraheren:

Meer vragen en antwoorden:

Veld: Artificial Intelligence
programma: EITC/AI/GVAPI Google Vision API (ga naar het certificeringsprogramma)
Les: Tekst in visuele gegevens begrijpen (ga naar gerelateerde les)
Topic: Handgeschreven tekst detecteren en extraheren (ga naar gerelateerd onderwerp)
Examenoverzicht

Tagged onder: Artificial Intelligence, Google Cloud Vision-API, Beeldverwerking, OCR, Optical Character Recognition, Tekstextractie

EITCA Academie

Hoe krijg je toegang tot de geëxtraheerde tekst uit een afbeelding met behulp van de Google Vision API?

Andere recente vragen en antwoorden over Handgeschreven tekst detecteren en extraheren:

Meer vragen en antwoorden:

EITCA Academy maakt deel uit van het Europese IT-certificeringskader

Geschiktheid voor EITCA Academy 80% EITCI DSJC Subsidie-ondersteuning

EITCA Academie

LOG IN OP UW ACCOUNT DOOR UW GEBRUIKERSNAAM OF E-MAILADRES

UW GEGEVENS VERGETEN?

MAAK EEN ACCOUNT

Hoe krijg je toegang tot de geëxtraheerde tekst uit een afbeelding met behulp van de Google Vision API?

Andere recente vragen en antwoorden over Handgeschreven tekst detecteren en extraheren:

Meer vragen en antwoorden:

Geschiktheid voor EITCA Academy 80% EITCI DSJC Subsidie-ondersteuning