Om toegang te krijgen tot de geëxtraheerde tekst uit een afbeelding met behulp van de Google Vision API, kunt u een reeks stappen volgen waarbij u gebruikmaakt van de Optical Character Recognition (OCR)-mogelijkheden van de API. De OCR-technologie in de Google Vision API maakt de detectie en extractie van tekst uit afbeeldingen mogelijk, inclusief handschrift. Deze functionaliteit is vooral handig in toepassingen die de analyse en het begrip van tekstuele informatie in visuele gegevens vereisen.
Ten eerste moet u de benodigde omgeving opzetten om met de Google Vision API te werken. Dit omvat het maken van een project in de Google Cloud Console, het inschakelen van de Vision API en het verkrijgen van de vereiste authenticatiegegevens, zoals een API-sleutel of serviceaccountsleutel.
Zodra uw omgeving is ingesteld, kunt u gebruik maken van de `asyncBatchAnnotateFiles`-methode van de Vision API om OCR uit te voeren op een afbeeldingsbestand. Met deze methode kunt u een lijst met afbeeldingsbestanden doorgeven voor verwerking en de resultaten asynchroon ontvangen. Als alternatief kunt u de methode `asyncBatchAnnotateImages` gebruiken om een lijst met afbeeldingen rechtstreeks te verwerken.
Om tekst uit een afbeelding te extraheren, moet u een exemplaar van het `AnnotateImageRequest`-object maken en de gewenste functies opgeven. In dit geval zou u de functie `TEXT_DETECTION` instellen om aan te geven dat u tekst uit de afbeelding wilt extraheren. U kunt ook aanvullende parameters opgeven, zoals de taalhint, om de nauwkeurigheid van de OCR te verbeteren.
Vervolgens moet u het afbeeldingsbestand coderen in een base64-gecodeerde string en een exemplaar van het `Image`-object maken met behulp van de gecodeerde afbeeldingsgegevens. Dit `Image`-object moet worden toegevoegd aan het `AnnotateImageRequest`-object dat eerder is gemaakt.
Nadat u het verzoek heeft ingesteld, kunt u het naar de Vision API sturen met behulp van de methode `batchAnnotateImages` of `batchAnnotateFiles`, afhankelijk van de door u gekozen aanpak. De API verwerkt de afbeelding en retourneert een antwoord met de geëxtraheerde tekst.
Om toegang te krijgen tot de geëxtraheerde tekst uit het antwoord, kunt u het veld 'textAnnotations' van het object 'AnnotateImageResponse' herhalen. Dit veld bevat een lijst met 'EntityAnnotation'-objecten, die elk een gedetecteerd tekstelement in de afbeelding vertegenwoordigen. Het veld 'description' van elk object 'EntityAnnotation' bevat de geëxtraheerde tekst.
Hier is een voorbeeldcodefragment in Python dat laat zien hoe u toegang krijgt tot de geëxtraheerde tekst uit een afbeelding met behulp van de Google Vision API:
python from google.cloud import vision def extract_text_from_image(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) request = vision.AnnotateImageRequest( image=image, features=[{'type': vision.Feature.Type.TEXT_DETECTION}] ) response = client.batch_annotate_images(requests=[request]) for annotation in response.responses[0].text_annotations: extracted_text = annotation.description print(extracted_text) # Usage extract_text_from_image('path_to_image.jpg')
In dit voorbeeld neemt de functie `extract_text_from_image` het pad naar een afbeeldingsbestand als invoer en gebruikt de Google Cloud Vision-clientbibliotheek om een verzoek naar de Vision API te sturen. De geëxtraheerde tekst wordt vervolgens afgedrukt.
Om toegang te krijgen tot de geëxtraheerde tekst uit een afbeelding met behulp van de Google Vision API, moet u de omgeving instellen, een `AnnotateImageRequest`-object maken met de gewenste functies, het afbeeldingsbestand coderen, het verzoek naar de API sturen en de geëxtraheerde tekst ophalen. uit de reactie. De OCR-mogelijkheden van de Vision API maken de detectie en extractie van tekst uit afbeeldingen mogelijk, inclusief handschrift.
Andere recente vragen en antwoorden over Handgeschreven tekst detecteren en extraheren:
- Welke beperkingen kunnen zich voordoen bij het extraheren van tekst uit complexe documenten met behulp van de Google Vision API?
- Wat is de betekenis van betrouwbaarheidsniveaus in de interpretatie van tekst door de Google Vision API?
- Hoe kan de Google Vision API nauwkeurig tekst uit handgeschreven notities herkennen en extraheren?
- Wat zijn de uitdagingen bij het detecteren en extraheren van tekst uit handgeschreven afbeeldingen?
- Kan Google Vision handschriften herkennen?