Machine learning in een notendop
De toekomst is onvoorspelbaar. Niemand weet wat er gaat komen. Toch trekken we lessen uit de geschiedenis en stellen we voortdurend verwachtingen voor onze toekomst. We herkennen en categoriseren situaties en worden achterdochtig als iets zich niet gedraagt volgens onze verwachtingen.
Computers daarentegen kunnen niet denken. Ze kunnen geen situaties begrijpen, ze kunnen niet beoordelen en ze kunnen ook geen beslissingen maken op basis van hun gevoel. Wat ze wel kunnen, is ons helpen te begrijpen wat er is gebeurd, wat er gebeurt en wat er gaat gebeuren. Bijvoorbeeld door algoritmes die een vorm van intelligentie vertonen, beter bekend als Artificial Intelligence (AI). Een onderdeel daarvan is Machine learning (ML), dat zich toelegt op algoritmes die “leren”. Hierbij wordt een model getraind met gekende data om de prestaties van het model te verbeteren.
Stel dat we een bedrijf zouden hebben dat energie kan opslaan, bijvoorbeeld hydro-elektrische energieopslag, dan zouden we graag de komende energieprijzen kennen om de winst te maximaliseren. Uit de geschiedenis weten we dat de energieprijzen sterk kunnen veranderen afhankelijk van bijvoorbeeld weersomstandigheden of het uur van de dag. We kunnen voor ons bedrijf machine learning gebruiken om zo een algoritme te maken dat ons een voorspelling kan geven over de komende prijzen.
stappenplan

De eerste stap voor het opstellen van zo’n model, is het verzamelen van de historische gegevens; de trainingsgegevens. Deze gegevens omvatten enerzijds de historische energieprijzen; het doel, wat we willen inschatten. Anderzijds omvatten ze de gegevens die de energieprijzen beïnvloeden; bijvoorbeeld de weersomstandigheden op dat moment, de kenmerken.
Vervolgens onderzoeken we de impact van elk kenmerk op de energieprijs. Aan de hand van relevante kenmerken kunnen we nu een model trainen dat de energieprijzen inschat op basis van de kenmerken.

Algoritmes
Binnen machine learning bestaan er twee verschillende soorten learning. Enerzijds bestaat er supervised learning, anderzijds unsupervised learning. Wanneer we een waarde proberen te voorspellen, zoals in het voorbeeld, spreken we van regressie. Regressie is een vorm van supervised machine learning, waarbij we in onze training data labelen. Hierbij is het doel van ons machine learning model om de labels te bepalen van nieuwe (nog) niet gelabelde data. Een andere vorm van supervised machine learning is classificatie. Een voorbeeld hiervan is handschriftherkenning. Je kunt een model trainen met bekende input, maar het aantal mogelijke outputs ligt in dit geval vast. Onderstaande voorbeelden zijn voorbeelden van supervised machine learning modellen; het algoritme wordt getraind met historische gegevens waarvan we het doel kennen


Naast supervised machine learning bestaat er ook unsupervised machine learning. Hier bestaan twee
hoofdcategorieën; clustering en anomaliedetectie. Bij anomaliedetectie zoeken we naar patronen in
onze binnenkomende gegevens. Wanneer deze teveel afwijken van de algemene patronen binnen
deze gegevens, spreken we van een anomalie. Een voorbeeld hiervan is het opsporen van defecte
machines in een productieomgeving.
Bij clustering worden gegevens automatisch gegroepeerd op basis van vergelijkbare eigenschappen.
Een cluster algoritme groepeert gebruikers van een dienst met vergelijkbare voorkeuren waardoor
gebruikers binnen deze groep vergelijkbare aanbevelingen kunnen krijgen.
