Big Data : approved articles

Big Data; approved articles

In de publicatie 'Big Data; een definitiekwestie' beschreven we de verwarring in discussies over Big Data, veroorzaakt door de definitiekwestie. Naast deze kwestie, zorgt ook de verscheidenheid in het aanbod van online artikelen over Big Data voor mogelijke verwarring. Het aanbod van artikelen loopt uiteen van zeer positief tot kritisch en van toegankelijk tot ‘vol met terminologie’. Erasmus Q-Intelligence wijst u graag de weg door de wirwar van artikelen om u een goed beeld te geven van wat Big Data inhoudt en wat het voor u kan betekenen.


Wat is Big Data?

Willem Vermeend, internetondernemer en hoogleraar economie en Anwar Osseyram, hoogleraar computerwetenschappen en directeur van SURFsara, beschrijven in hun website-boek 'De revolutie van Big Data' op een toegankelijke manier wat Big Data inhoudt. In het eerste hoofdstuk staat geschreven: "De analyse van grote hoeveelheden gegevens maakt het mogelijk om voorheen onzichtbare patronen en wisselwerkingen te ontdekken", waarna deze stelling wordt onderbouwd met theorie en praktijk. Daarnaast heeft Tom Davenport, hoogleraar en een van 's werelds grootste thought-leaders op het gebeid van business analytics, verschillende boeken geschreven over de impact en mogelijkheden van Big Data.


Toepassingen

Via het internet is ook veel te vinden over talrijke succesvolle toepassingen. Van customer intelligence tot fysische studies en van predictive maintenance tot health care analytics. Verschillende website en blogs beschrijven de succesverhalen van Big Data: zie onder meer artikelen van Bernard Marr en het artikel op InformationWeek. De Data Science Association toont een inzichtelijke infographic met voorbeelden van Big Data in diverse industriën. Ook op de website van Erasmus Q-Intelligence zijn verschillende praktijkvoorbeelden van Big Data toepassingen te vinden.
 

Valkuilen

De eerlijkheid gebiedt te zeggen dat er ook kritische noten worden gekraakt. Nassim Thaleb (auteur van The Black Swan, Penguin Books Ltd, 2011) waarschuwt voor cherry-picking: in grote hoeveelheden gegevens zijn altijd quasi-verbanden te herkennen. Het is hierbij de vraag of het gaat om causaliteit of dat er sprake is van een spurious verband. Thaleb concludeert dat waardevolle verbanden steeds vaker moeten worden onderscheiden van vele onzinnige verbanden. Om foute conclusies te voorkomen, is domeinkennis en vakexpertise dan ook van groot belang.

 
Educatie

Meer kennis van methode en technieken is dus essentieel. Verschillende cursussen bieden hierin uitkomst. De Coursera MOOC van de Erasmus Universiteit Rotterdam stelt deelnemers van over de hele wereld in staat op een toegankelijke manier kennis te maken met de achtergrond van analytische methoden. Ook de Machine Learning-cursus van Andrew Ng, hoogleraar aan Stanford University, biedt duidelijke inzichten in de technieken achter Big Data. Voor meer diepgravende kennis verwijzen we naar de post-graduate opleiding Data & Business Analytics. Met goede educatie kan beschikbaarheid van grote gegevensbestanden en analytics tools, omgezet worden in waardevolle bevindingen.

Tot slot noemen we graag nog enkele interessante bronnen om op de hoogte te blijven van nieuwe ontwikkelingen: het Data Science Central en Gil Press' Big Data column in Forbes.