Convolutionele neurale netwerken (CNN's) werden voor het eerst ontworpen met het oog op beeldherkenning op het gebied van computervisie. Deze netwerken zijn een gespecialiseerd type kunstmatig neuraal netwerk dat zeer effectief is gebleken bij het analyseren van visuele gegevens. De ontwikkeling van CNN's werd gedreven door de behoefte om modellen te creëren die afbeeldingen nauwkeurig konden classificeren en categoriseren, en hun succes op dit gebied heeft geleid tot het wijdverbreide gebruik ervan in verschillende andere toepassingen, zoals objectdetectie, beeldsegmentatie en zelfs natuurlijke taalverwerking.
CNN's zijn geïnspireerd door de structuur en functionaliteit van de visuele cortex in het menselijk brein. Net als de visuele cortex bestaan CNN’s uit meerdere lagen van onderling verbonden neuronen die verschillende aspecten van de invoergegevens verwerken. De belangrijkste innovatie van CNN's ligt in hun vermogen om automatisch relevante kenmerken uit afbeeldingen te leren en te extraheren, waardoor handmatige functie-engineering overbodig wordt. Dit wordt bereikt door het gebruik van convolutionele lagen, die filters op het invoerbeeld toepassen om verschillende visuele patronen en kenmerken te detecteren, zoals randen, hoeken en texturen.
De eerste doorbraak in CNN's kwam met de introductie van de LeNet-5-architectuur door Yann LeCun et al. in 1998. LeNet-5 werd specifiek ontworpen voor handgeschreven cijferherkenning en behaalde opmerkelijke prestaties op de MNIST-dataset, een benchmarkdataset die veel wordt gebruikt voor het evalueren van algoritmen voor beeldherkenning. LeNet-5 demonstreerde de kracht van CNN's bij het vastleggen van hiërarchische kenmerken uit afbeeldingen, waardoor nauwkeurige classificatie mogelijk is, zelfs in de aanwezigheid van variaties in schaal, rotatie en vertaling.
Sindsdien zijn CNN’s aanzienlijk geëvolueerd, waarbij diepere en complexere architecturen zijn ontwikkeld. Een opmerkelijke vooruitgang was de introductie van de AlexNet-architectuur door Alex Krizhevsky et al. in 2012. AlexNet bereikte een doorbraak in beeldclassificatie door de ImageNet Large Scale Visual Recognition Challenge (ILSVRC) te winnen met een aanzienlijk lager foutenpercentage vergeleken met eerdere benaderingen. Dit succes maakte de weg vrij voor de wijdverbreide acceptatie van CNN's bij beeldherkenningstaken.
CNN's zijn ook met succes toegepast op andere computervisietaken. Bij objectdetectie kunnen CNN's bijvoorbeeld worden gecombineerd met extra lagen om objecten binnen een afbeelding te lokaliseren en te classificeren. Het beroemde Region-based Convolutional Neural Network (R-CNN), geïntroduceerd door Ross Girshick et al. in 2014 is een voorbeeld van een dergelijke architectuur. R-CNN behaalde state-of-the-art resultaten op het gebied van objectdetectiebenchmarks door gebruik te maken van de kracht van CNN's voor de extractie van kenmerken en deze te combineren met methoden voor regiovoorstellen.
Convolutionele neurale netwerken werden voor het eerst ontworpen voor beeldherkenningstaken op het gebied van computervisie. Ze hebben een revolutie teweeggebracht in het vakgebied door automatisch relevante kenmerken uit afbeeldingen te leren, waardoor handmatige functie-engineering overbodig is geworden. De ontwikkeling van CNN's heeft geleid tot aanzienlijke vooruitgang op het gebied van beeldclassificatie, objectdetectie en diverse andere computervisietaken.
Andere recente vragen en antwoorden over EITC/AI/ADL Advanced Deep Learning:
- Waarom moeten we optimalisaties toepassen in machine learning?
- Wanneer ontstaat er sprake van overfitting?
- Kunnen Convolutional Neural Networks sequentiële gegevens verwerken door convoluties in de loop van de tijd op te nemen, zoals gebruikt in Convolutional Sequence to Sequence-modellen?
- Vertrouwen Generative Adversarial Networks (GAN's) op het idee van een generator en een discriminator?