Het proces van het trainen van een machine learning-model houdt in dat het wordt blootgesteld aan enorme hoeveelheden gegevens, zodat het patronen kan leren en voorspellingen of beslissingen kan maken zonder expliciet voor elk scenario te zijn geprogrammeerd. Tijdens de trainingsfase ondergaat het machine learning-model een reeks iteraties waarbij het de interne parameters aanpast om fouten te minimaliseren en de prestaties voor de gegeven taak te verbeteren.
Supervisie tijdens training verwijst naar het niveau van menselijke tussenkomst dat nodig is om het leerproces van het model te begeleiden. De behoefte aan supervisie kan variëren afhankelijk van het type machine learning-algoritme dat wordt gebruikt, de complexiteit van de taak en de kwaliteit van de gegevens die voor training worden verstrekt.
Bij begeleid leren, een vorm van machinaal leren waarbij het model wordt getraind op gelabelde gegevens, is toezicht essentieel. Gelabelde gegevens betekent dat elk invoergegevenspunt wordt gekoppeld aan de juiste uitvoer, waardoor het model de mapping tussen invoer en uitvoer kan leren. Tijdens begeleide training is menselijk toezicht vereist om de juiste labels voor de trainingsgegevens te geven, de voorspellingen van het model te evalueren en de parameters van het model aan te passen op basis van feedback.
Als het doel van een beeldherkenningstaak onder toezicht bijvoorbeeld is om een model te trainen in het classificeren van afbeeldingen van katten en honden, zou een menselijke supervisor elke afbeelding moeten labelen als een kat of een hond. Het model zou vervolgens van deze gelabelde voorbeelden leren om voorspellingen te doen over nieuwe, onzichtbare beelden. De supervisor evalueert de voorspellingen van het model en geeft feedback om de nauwkeurigheid ervan te verbeteren.
Aan de andere kant hebben onbewaakte leeralgoritmen geen gelabelde gegevens nodig voor training. Deze algoritmen leren patronen en structuren uit de invoergegevens zonder expliciete begeleiding. Leren zonder toezicht wordt vaak gebruikt voor taken zoals clustering, detectie van afwijkingen en vermindering van dimensionaliteit. Bij onbewaakt leren kan de machine zelfstandig leren zonder dat er tijdens de training menselijk toezicht nodig is.
Semi-begeleid leren is een hybride aanpak die elementen van zowel begeleid als onbewaakt leren combineert. Bij deze aanpak wordt het model getraind op een combinatie van gelabelde en ongelabelde gegevens. De gelabelde gegevens bieden enige begeleiding om het leerproces te begeleiden, terwijl de ongelabelde gegevens het model in staat stellen aanvullende patronen en relaties in de gegevens te ontdekken.
Reinforcement learning is een ander paradigma van machinaal leren waarbij een agent leert opeenvolgende beslissingen te nemen door interactie met een omgeving. Bij versterkend leren ontvangt de agent feedback in de vorm van beloningen of straffen op basis van zijn acties. De agent leert door middel van vallen en opstaan zijn cumulatieve beloning in de loop van de tijd te maximaliseren. Hoewel versterkend leren geen expliciete supervisie in de traditionele zin vereist, kan menselijke supervisie nodig zijn om de beloningsstructuur te ontwerpen, de leerdoelen vast te stellen of het leerproces te verfijnen.
De behoefte aan supervisie tijdens machine learning-training hangt af van het leerparadigma dat wordt gebruikt, de beschikbaarheid van gelabelde gegevens en de complexiteit van de taak. Begeleid leren vereist menselijk toezicht om gelabelde gegevens te leveren en de prestaties van het model te evalueren. Voor leren zonder toezicht is geen toezicht nodig, omdat het model onafhankelijk leert van niet-gelabelde gegevens. Semi-gesuperviseerd leren combineert elementen van zowel begeleid als onbewaakt leren, terwijl versterkend leren het leren door interactie met een omgeving inhoudt.
Andere recente vragen en antwoorden over EITC/AI/GCML Google Cloud Machine Learning:
- Tekst naar spraak
- Wat zijn de beperkingen bij het werken met grote datasets in machine learning?
- Kan machinaal leren enige dialogische hulp bieden?
- Wat is de TensorFlow-speeltuin?
- Wat betekent een grotere dataset eigenlijk?
- Wat zijn enkele voorbeelden van de hyperparameters van algoritmen?
- Wat is samenvattend leren?
- Wat als een gekozen machine learning-algoritme niet geschikt is en hoe kun je ervoor zorgen dat je het juiste selecteert?
- Wat zijn de belangrijkste parameters die worden gebruikt in op neurale netwerken gebaseerde algoritmen?
- Wat is TensorBoard?
Bekijk meer vragen en antwoorden in EITC/AI/GCML Google Cloud Machine Learning