Cloud Machine Learning Engine (CMLE) is een krachtige tool van Google Cloud Platform (GCP) voor het trainen van machine learning-modellen op een gedistribueerde en parallelle manier. Het biedt echter geen automatische resource-acquisitie en -configuratie en het verwerkt ook geen resource-afsluiting nadat de training van het model is voltooid. In dit antwoord zullen we de details van CMLE, de mogelijkheden ervan en de noodzaak van handmatig resourcebeheer bekijken.
CMLE is ontworpen om het proces van het trainen en implementeren van machine learning-modellen op schaal te vereenvoudigen. Het biedt een beheerde omgeving waarmee gebruikers zich kunnen concentreren op modelontwikkeling in plaats van op infrastructuurbeheer. CMLE maakt gebruik van de kracht van de infrastructuur van GCP om de trainingswerklast over meerdere machines te verdelen, waardoor snellere trainingstijden mogelijk zijn en grote datasets kunnen worden verwerkt.
Bij het gebruik van CMLE hebben gebruikers de flexibiliteit om het type en aantal bronnen te kiezen dat nodig is voor hun trainingstaak. Ze kunnen het machinetype, het aantal werknemers en andere parameters selecteren op basis van hun specifieke vereisten. CMLE verkrijgt en configureert deze bronnen echter niet automatisch. Het is de verantwoordelijkheid van de gebruiker om de nodige middelen ter beschikking te stellen voordat hij met de trainingstaak begint.
Om de bronnen te verwerven, kunnen gebruikers GCP-services zoals Compute Engine of Kubernetes Engine gebruiken. Deze services bieden een schaalbare en flexibele infrastructuur om de trainingswerklast op te vangen. Gebruikers kunnen instanties of containers van virtuele machines maken, deze configureren met de vereiste softwareafhankelijkheden en ze vervolgens gebruiken als werkers in CMLE.
Zodra de trainingstaak is voltooid, schakelt CMLE de bronnen die voor training worden gebruikt niet automatisch uit. Dit komt omdat het getrainde model mogelijk moet worden ingezet en gebruikt voor gevolgtrekkingsdoeleinden. Het is aan de gebruiker om te beslissen wanneer en hoe de bronnen worden beëindigd om onnodige kosten te voorkomen.
Samenvattend biedt CMLE een krachtig platform voor parallelle machine learning-modeltraining. Het vereist echter handmatige verwerving en configuratie van bronnen en zorgt niet voor het afsluiten van bronnen nadat de training is voltooid. Gebruikers moeten de benodigde bronnen ter beschikking stellen met behulp van GCP-services zoals Compute Engine of Kubernetes Engine en hun levenscyclus beheren op basis van hun specifieke vereisten.
Andere recente vragen en antwoorden over Vooruitgang in machine learning:
- Wanneer een kernel wordt geforkt met gegevens en het origineel privé is, kan de geforkte kernel dan openbaar zijn? En als dat zo is, is dat dan geen inbreuk op de privacy?
- Wat zijn de beperkingen bij het werken met grote datasets in machine learning?
- Kan machinaal leren enige dialogische hulp bieden?
- Wat is de TensorFlow-speeltuin?
- Voorkomt de enthousiaste modus de gedistribueerde computerfunctionaliteit van TensorFlow?
- Kunnen de cloudoplossingen van Google worden gebruikt om computergebruik los te koppelen van opslag, voor een efficiëntere training van het ML-model met big data?
- Is het mogelijk om machine learning-modellen zonder haperingen te trainen op willekeurig grote datasets?
- Moet bij het gebruik van CMLE voor het maken van een versie een bron van een geëxporteerd model worden opgegeven?
- Kan CMLE gegevens uit Google Cloud-opslag lezen en een gespecificeerd getraind model gebruiken voor gevolgtrekking?
- Kan Tensorflow worden gebruikt voor training en gevolgtrekking van diepe neurale netwerken (DNN's)?
Bekijk meer vragen en antwoorden in Vooruitgang in machine learning