×
1 Kies EITC/EITCA-certificaten
2 Online examens leren en afleggen
3 Laat uw IT-vaardigheden certificeren

Bevestig uw IT-vaardigheden en -competenties onder het Europese IT-certificeringskader van overal ter wereld, volledig online.

EITCA Academie

Standaard voor attestering van digitale vaardigheden door het European IT Certification Institute ter ondersteuning van de ontwikkeling van de digitale samenleving

LOG IN OP UW ACCOUNT

MAAK EEN ACCOUNT WACHTWOORD VERGETEN?

WACHTWOORD VERGETEN?

AAH, WACHT, ik herinner me NOW!

MAAK EEN ACCOUNT

REEDS EEN ACCOUNT HEEFT?
EUROPESE INFORMATIETECHNOLOGIEËN CERTIFICATIE ACADEMIE - UW PROFESSIONELE DIGITALE VAARDIGHEDEN PROBEREN
  • INSCHRIJVEN
  • LOG IN
  • INFO

EITCA Academie

EITCA Academie

Het European Information Technologies Certification Institute - EITCI ASBL

Certificeringsaanbieder

EITCI Instituut ASBL

Brussel, Europese Unie

Beheer van het Europese IT-certificeringskader (EITC) ter ondersteuning van IT-professionalisme en de digitale samenleving

  • CERTIFICATEN
    • EITCA-ACADEMIES
      • CATALOGUS VAN EITCA ACADEMIES<
      • EITCA/CG-COMPUTERGRAFIEK
      • EITCA/IS INFORMATIEBEVEILIGING
      • EITCA/BI BEDRIJFSINFORMATIE
      • EITCA/KC BELANGRIJKSTE COMPETENTIES
      • EITCA/EG E-REGERING
      • EITCA/WD WEBONTWIKKELING
      • EITCA/AI KUNSTMATIGE INTELLIGENTIE
    • EITC-CERTIFICATEN
      • CATALOGUS VAN EITC-CERTIFICATEN<
      • COMPUTER GRAFISCHE CERTIFICATEN
      • WEB ONTWERP CERTIFICATEN
      • 3D ONTWERP CERTIFICATEN
      • KANTOOR IT-CERTIFICATEN
      • BITCOIN BLOCKCHAIN ​​CERTIFICAAT
      • WORDPRESS CERTIFICAAT
      • CLOUD PLATFORM CERTIFICAATNIEUW
    • EITC-CERTIFICATEN
      • INTERNET CERTIFICATEN
      • CRYPTOGRAFIE CERTIFICATEN
      • BUSINESS IT-CERTIFICATEN
      • TELEWERKCERTIFICATEN
      • PROGRAMMERING VAN CERTIFICATEN
      • DIGITAAL PORTRETCERTIFICAAT
      • WEBONTWIKKELINGSCERTIFICATEN
      • DIEPE LEREN CERTIFICATENNIEUW
    • CERTIFICATEN VOOR
      • EU-OPENBARE ADMINISTRATIE
      • LERAREN EN ONDERWIJS
      • IT-BEVEILIGINGSPROFESSIONALS
      • GRAFISCHE ONTWERPERS & KUNSTENAARS
      • ZAKENLIEDEN EN MANAGERS
      • BLOCKCHAIN ​​ONTWIKKELAARS
      • WEB ONTWIKKELAARS
      • CLOUD AI-EXPERTSNIEUW
  • FEATURED
  • SUBSIDIE
  • HOE WERKT HET?
  •   IT ID
  • OVER ONS
  • CONTACT
  • MIJN BESTELLING
    Uw huidige bestelling is leeg.
EITCIINSTITUTE
CERTIFIED

Wat is de wiskundige formule van de convolutiebewerking op een 2D-beeld?

by EITCA Academie / Donderdag 23 mei 2024 / Gepubliceerd in Artificial Intelligence, EITC/AI/ADL Advanced Deep Learning, Geavanceerde computervisie, Convolutionele neurale netwerken voor beeldherkenning

De convolutieoperatie is een fundamenteel proces op het gebied van convolutionele neurale netwerken (CNN's), vooral op het gebied van beeldherkenning. Deze operatie is cruciaal bij het extraheren van kenmerken uit afbeeldingen, waardoor deep learning-modellen visuele gegevens kunnen begrijpen en interpreteren. De wiskundige formulering van de convolutiebewerking op een 2D-beeld is essentieel om te begrijpen hoe CNN's beelden verwerken en analyseren.

Wiskundig gezien kan de convolutiebewerking voor een 2D-beeld als volgt worden uitgedrukt:

[ (I * K)(x, y) = som_{i=-m}^{m} som_{j=-n}^{n} I(x+i, y+j) cdot K(i, j ]

Waar:
– ( I ) vertegenwoordigt het invoerbeeld.
– ( K ) geeft de kernel of het filter aan.
– ( (x, y) ) zijn de coördinaten van de uitvoerpixel.
– ( m ) en ( n ) zijn respectievelijk de halve breedte en halve hoogte van de kern.

In deze vergelijking schuift de kernel (K) over het invoerbeeld (I), waarbij elementgewijze vermenigvuldiging wordt uitgevoerd en de resultaten worden opgeteld om een ​​enkele uitvoerpixelwaarde te produceren. Dit proces wordt herhaald voor elke pixel in de uitvoerkenmerkenkaart, wat resulteert in een getransformeerde afbeelding die specifieke kenmerken benadrukt op basis van de waarden van de kernel.

De convolutiebewerking kan beter worden begrepen aan de hand van een stapsgewijs voorbeeld. Beschouw een eenvoudige 3×3 kernel ( K ) en een 5×5 invoerafbeelding ( I ​​):

[ K = begin{bmatrix}
1 & 0 & -1 \
1 & 0 & -1 \
1 & 0 & -1
einde{bmatrix} ] [ I = begin{bmatrix}
1 & 2 & 3 & 4 & 5 \
6 & 7 & 8 & 9 & 10 \
11 & 12 & 13 & 14 & 15 \
16 & 17 & 18 & 19 & 20 \
21 & 22 & 23 & 24 & 25
einde{bmatrix} ]

Om de convolutie te berekenen, plaatsen we het midden van de kernel op elke pixel van de invoerafbeelding en voeren we de volgende stappen uit:

1. Plaats de kernel: Plaats het midden van de kernel in de linkerbovenhoek van de afbeelding.
2. Elementgewijze vermenigvuldiging: Vermenigvuldig elk element van de kernel met het overeenkomstige element van de afbeelding.
3. sommering: Som de resultaten op van de elementgewijze vermenigvuldiging.
4. Verplaats de kernel: Verplaats de kernel naar de volgende positie en herhaal stappen 2-3.

Voor de eerste positie (linkerbovenhoek) is de berekening als volgt:

[ begin{uitgelijnd}
(I * K)(1, 1) &= (1 cdot 1) + (2 cdot 0) + (3 cdot -1) \
&quad + (6 cdot 1) + (7 cdot 0) + (8 cdot -1) \
&quad + (11 cdot 1) + (12 cdot 0) + (13 cdot -1) \
&= 1 + 0 – 3 + 6 + 0 – 8 + 11 + 0 – 13 \
&= -6
einde{uitgelijnd} ]

Dit resultaat, -6, is de waarde van de uitvoerfeaturekaart op positie (1, 1). Door dit proces voor elke positie van de kernel over het invoerbeeld te herhalen, wordt de volledige uitvoerfunctiekaart gegenereerd.

De convolutiebewerking gaat doorgaans gepaard met aanvullende concepten zoals opvulling en pas:

- Vulling: het toevoegen van extra pixels rond de rand van de invoerafbeelding, vaak met nullen (zero-padding), om de ruimtelijke afmetingen van de uitvoerkenmerkenkaart te bepalen. Opvulling zorgt ervoor dat de uitvoerkenmerkenkaart dezelfde afmetingen heeft als de invoerafbeelding, waardoor ruimtelijke informatie behouden blijft.
- stride: De stapgrootte waarmee de kernel over de invoerafbeelding beweegt. Een stap van 1 betekent dat de kernel één pixel tegelijk beweegt, terwijl een stap van 2 betekent dat de kernel twee pixels tegelijk beweegt. Stride beïnvloedt de ruimtelijke afmetingen van de uitvoerfeaturekaart, waarbij grotere stappen resulteren in kleinere uitvoerdimensies.

De uitvoerdimensies van de convolutiebewerking kunnen worden berekend met behulp van de volgende formule:

[ text{Uitvoerbreedte} = leftlfloor frac{text{Invoerbreedte} – text{Kernelbreedte} + 2 cdot text{Padding}}{text{Stride}} rightrfloor + 1 ] [ text{Uitvoerhoogte} = leftlfloor frac{text {Invoerhoogte} – tekst{Kernelhoogte} + 2 cdot tekst{Padding}}{text{Stride}} rightrfloor + 1 ]

Deze formules zorgen ervoor dat de ruimtelijke afmetingen van de uitvoerfeaturekaart correct worden bepaald op basis van de afmetingen van de invoerafbeelding, kernelgrootte, opvulling en paslengte.

In de context van convolutionele neurale netwerken worden meerdere convolutionele lagen op elkaar gestapeld, elk met zijn eigen set leerbare kernels. Deze lagen extraheren geleidelijk kenmerken van een hoger niveau uit het invoerbeeld, waardoor het netwerk complexe patronen en objecten kan herkennen. De kernels in elke laag worden tijdens het trainingsproces geleerd door middel van backpropagation, waardoor de prestaties van het netwerk voor de gegeven taak worden geoptimaliseerd.

Convolutionele lagen worden vaak gevolgd door activeringsfuncties, zoals ReLU (Rectified Linear Unit), die niet-lineariteit in het model introduceren. Door deze niet-lineariteit kan het netwerk complexere representaties leren. Bovendien worden poolinglagen, zoals max pooling of gemiddelde pooling, gebruikt om de ruimtelijke dimensies van de kenmerkkaarten te verkleinen, waardoor het model rekentechnisch efficiënter wordt en minder vatbaar voor overfitting.

Een praktisch voorbeeld van een convolutioneel neuraal netwerk voor beeldherkenning is de beroemde LeNet-5-architectuur, ontworpen voor handgeschreven cijferherkenning. LeNet-5 bestaat uit meerdere convolutionele en poolinglagen, gevolgd door volledig verbonden lagen. De convolutionele lagen extraheren kenmerken uit de invoerbeelden, terwijl de volledig verbonden lagen de uiteindelijke classificatie uitvoeren.

Om de convolutiebewerking in de context van LeNet-5 te illustreren, beschouwen we de eerste convolutionele laag, die een invoerafbeelding van 32×32 nodig heeft en zes 5×5-kernels toepast met een stap van 1 en zonder opvulling. De uitvoerfunctiekaarten hebben afmetingen van 28×28, als volgt berekend:

[ text{Uitvoerbreedte} = leftlfloor frac{32 – 5 + 2 cdot 0}{1} rightrfloor + 1 = 28 ] [ text{Output Height} = leftlfloor frac{32 – 5 + 2 cdot 0}{1} rightrfloor + 1 = 28 ]

Elk van de zes kernels produceert een afzonderlijke 28×28 feature map, waarin verschillende aspecten van het invoerbeeld worden vastgelegd. Deze kenmerkkaarten worden vervolgens door een ReLU-activeringsfunctie en een poolinglaag van maximaal 2×2 gevoerd met een stap van 2, wat resulteert in 14×14 kenmerkkaarten.

De daaropvolgende lagen in LeNet-5 blijven convolutie- en poolingbewerkingen toepassen, waardoor de ruimtelijke dimensies geleidelijk worden verkleind en de diepte van de kenmerkkaarten wordt vergroot. De laatste volledig verbonden lagen voeren de classificatie uit op basis van de geëxtraheerde kenmerken, waarbij de voorspelde cijferklasse wordt weergegeven.

De convolutiebewerking is een hoeksteen van convolutionele neurale netwerken, die de extractie van betekenisvolle kenmerken uit afbeeldingen mogelijk maakt. De wiskundige formulering van de convolutiebewerking omvat het schuiven van een kernel over de invoerafbeelding, het uitvoeren van elementgewijze vermenigvuldiging en het optellen van de resultaten. Aanvullende concepten zoals padding en stride spelen een belangrijke rol bij het regelen van de ruimtelijke dimensies van de uitvoerkenmerkkaart. Convolutionele lagen, gecombineerd met activeringsfuncties en poolinglagen, vormen de bouwstenen van krachtige beeldherkenningsmodellen zoals LeNet-5, die complexe patronen en objecten in visuele gegevens kunnen herkennen.

Andere recente vragen en antwoorden over Geavanceerde computervisie:

  • Wat is de formule voor een activeringsfunctie zoals Rectified Linear Unit om niet-lineariteit in het model te introduceren?
  • Wat is de wiskundige formule voor de verliesfunctie in convolutie neurale netwerken?
  • Wat is de vergelijking voor de maximale pooling?
  • Wat zijn de voordelen en uitdagingen van het gebruik van 3D-convoluties voor actieherkenning in video's, en hoe draagt ​​de Kinetics-dataset bij aan dit onderzoeksgebied?
  • Hoe gebruikt FlowNet, in de context van optische stroomschatting, een encoder-decoder-architectuur om paren afbeeldingen te verwerken, en welke rol speelt de Flying Chairs-dataset bij het trainen van dit model?
  • Hoe maakt de U-NET-architectuur gebruik van skip-verbindingen om de precisie en details van semantische segmentatie-uitvoer te verbeteren, en waarom zijn deze verbindingen belangrijk voor backpropagation?
  • Wat zijn de belangrijkste verschillen tussen tweetrapsdetectoren zoals Faster R-CNN en eentrapsdetectoren zoals RetinaNet in termen van trainingsefficiëntie en het omgaan met niet-differentieerbare componenten?
  • Hoe verbetert het concept van Intersection over Union (IoU) de evaluatie van objectdetectiemodellen vergeleken met het gebruik van kwadratisch verlies?
  • Hoe faciliteren resterende verbindingen in ResNet-architecturen de training van zeer diepe neurale netwerken, en welke impact had dit op de prestaties van beeldherkenningsmodellen?
  • Wat waren de belangrijkste innovaties die AlexNet in 2012 introduceerde en die het gebied van convolutionele neurale netwerken en beeldherkenning aanzienlijk vooruitbrachten?

Bekijk meer vragen en antwoorden in Geavanceerde computervisie

Meer vragen en antwoorden:

  • Veld: Artificial Intelligence
  • Programma EITC/AI/ADL Advanced Deep Learning (ga naar het certificeringsprogramma)
  • Les: Geavanceerde computervisie (ga naar gerelateerde les)
  • Topic: Convolutionele neurale netwerken voor beeldherkenning (ga naar gerelateerd onderwerp)
Tagged onder: Artificial Intelligence, CNN, kronkeling, Functie extractie, Beeldverwerking, pit
Home » Artificial Intelligence » EITC/AI/ADL Advanced Deep Learning » Geavanceerde computervisie » Convolutionele neurale netwerken voor beeldherkenning » » Wat is de wiskundige formule van de convolutiebewerking op een 2D-beeld?

Certificatiecentrum

GEBRUIKERSMENU

  • Mijn Account

CERTIFICAATCATEGORIE

  • EITC-certificering (105)
  • EITCA-certificering (9)

Waar ben je naar op zoek?

  • Introductie
  • Hoe werkt het?
  • EITCA-academies
  • EITCI DSJC-subsidie
  • Volledige EITC-catalogus
  • Jouw order
  • Uitgelicht
  •   IT ID
  • EITCA beoordelingen (Medium publ.)
  • Over ons
  • Contact

EITCA Academy maakt deel uit van het Europese IT-certificeringskader

Het Europese IT-certificeringskader is in 2008 opgericht als een in Europa gevestigde en leveranciersonafhankelijke standaard voor breed toegankelijke online certificering van digitale vaardigheden en competenties op vele gebieden van professionele digitale specialisaties. Het EITC-kader wordt beheerst door de Europees IT-certificeringsinstituut (EITCI), een certificeringsinstantie zonder winstoogmerk die de groei van de informatiemaatschappij ondersteunt en de kloof in digitale vaardigheden in de EU overbrugt.

Geschiktheid voor EITCA Academy 90% EITCI DSJC Subsidie-ondersteuning

90% van de EITCA Academy-vergoedingen gesubsidieerd bij inschrijving door

    Secretariaat van de EITCA Academie

    Europees IT-certificeringsinstituut ASBL
    Brussel, België, Europese Unie

    Operator van het EITC/EITCA-certificeringskader
    Geldende Europese IT-certificeringsnorm
    Toegang Contactformulier of bel + 32 25887351

    Volg EITCI op X
    Bezoek EITCA Academy op Facebook
    Neem contact op met EITCA Academy op LinkedIn
    Bekijk EITCI- en EITCA-video's op YouTube

    Gefinancierd door de Europese Unie

    Gefinancierd door de Europees Fonds voor Regionale Ontwikkeling (EFRO) en Europees Sociaal Fonds (ESF) in een reeks projecten sinds 2007, momenteel beheerd door de Europees IT-certificeringsinstituut (EITCI) sinds 2008

    Informatiebeveiligingsbeleid | DSRRM en AVG-beleid | Gegevensbeschermingsbeleid | Registratie van verwerkingsactiviteiten | HSE-beleid | Anticorruptiebeleid | Beleid inzake moderne slavernij

    Automatisch vertalen naar uw taal

    Algemene Voorwaarden | Privacybeleid
    EITCA Academie
    • EITCA Academy op sociale media
    EITCA Academie


    © 2008-2025  Europees IT-certificeringsinstituut
    Brussel, België, Europese Unie

    TOP
    CHAT MET ONDERSTEUNING
    Heb je nog vragen?