AutoML Tables is een krachtige machine learning-tool van Google Cloud waarmee gebruikers machine learning-modellen kunnen bouwen en implementeren zonder uitgebreide kennis van programmeren of datawetenschap. Het automatiseert het proces van feature-engineering, modelselectie, afstemming van hyperparameters en modelevaluatie, waardoor het toegankelijk wordt voor gebruikers met verschillende niveaus van machine learning-kennis.
Als het gaat om gegevenstypen, kan AutoML Tables een breed scala aan gestructureerde gegevenstypen aan. Gestructureerde gegevens verwijzen naar gegevens die zijn georganiseerd in tabelvorm, waarbij rijen instanties of voorbeelden vertegenwoordigen en kolommen kenmerken of variabelen vertegenwoordigen. AutoML Tables kan zowel numerieke als categorische gegevenstypen verwerken, waardoor gebruikers met diverse gegevenssets kunnen werken.
1. Numerieke gegevens: AutoML Tables ondersteunt verschillende numerieke gegevenstypen, waaronder gehele getallen en getallen met drijvende komma. Deze gegevenstypen zijn geschikt om continue of discrete numerieke waarden weer te geven. Als we bijvoorbeeld een dataset van huizenprijzen hebben, zou de prijskolom worden weergegeven als een numeriek gegevenstype.
2. Categorische gegevens: AutoML Tables ondersteunt ook categorische gegevenstypen, die discrete waarden vertegenwoordigen die in specifieke categorieën vallen. Categorische gegevens kunnen verder worden onderverdeeld in twee subtypen:
A. Nominale gegevens: Nominale gegevens vertegenwoordigen categorieën die geen inherente volgorde of hiërarchie hebben. Als we bijvoorbeeld een dataset met feedback van klanten hebben, kan de sentimentkolom categorieën hebben als 'positief', 'neutraal' en 'negatief'. AutoML Tables kan dergelijke nominale categorische gegevens aan.
B. Ordinale gegevens: Ordinale gegevens vertegenwoordigen categorieën die een specifieke volgorde of hiërarchie hebben. Als we bijvoorbeeld een dataset met filmbeoordelingen hebben, kan de beoordelingskolom categorieën bevatten als 'slecht', 'redelijk', 'goed' en 'uitstekend'. AutoML Tables kan dergelijke ordinale categorische gegevens verwerken en houdt tijdens modeltraining rekening met de volgorde van de categorieën.
3. Tekstgegevens: AutoML Tables biedt ook ondersteuning voor tekstgegevens. Tekstgegevens zijn doorgaans ongestructureerd en vereisen voorbewerking om ze om te zetten in een gestructureerd formaat dat geschikt is voor machine learning. AutoML Tables kan tekstgegevens verwerken door gebruik te maken van technieken zoals het insluiten van tekst of het weergeven van een zak met woorden. Als we bijvoorbeeld een dataset met klantrecensies hebben, kan de recensietekst worden omgezet in numerieke kenmerken met behulp van technieken zoals woordinsluitingen, die vervolgens door AutoML Tables kunnen worden gebruikt voor modeltraining.
4. Tijdreeksgegevens: AutoML Tables kan tijdreeksgegevens verwerken, dit zijn gegevens die over een reeks tijdsintervallen worden verzameld. Tijdreeksgegevens komen vaak voor in verschillende domeinen, zoals financiën, weersvoorspellingen en beursanalyse. AutoML Tables kan tijdreeksgegevens verwerken door tijdgerelateerde functies op te nemen, zoals tijdstempels en vertraagde variabelen.
AutoML Tables kan een breed scala aan gestructureerde gegevenstypen verwerken, waaronder numerieke, categorische (zowel nominaal als ordinaal), tekst en tijdreeksgegevens. Deze veelzijdigheid stelt gebruikers in staat om de kracht van AutoML Tables te benutten voor een diverse reeks machine learning-taken in verschillende domeinen.
Andere recente vragen en antwoorden over AutoML-tabellen:
- Waarom zijn AutoML Tables stopgezet en wat is de opvolger?
- Hoe kunnen gebruikers hun model implementeren en voorspellingen krijgen in AutoML Tables?
- Welke opties zijn beschikbaar voor het instellen van een trainingsbudget in AutoML Tables?
- Welke informatie biedt het tabblad Analyseren in AutoML Tables?
- Hoe kunnen gebruikers hun trainingsgegevens importeren in AutoML Tables?