Introductie Data Science met R

Ontdek het potentieel van data science
Script in programmeertaal

Data Science draait om het ontsluiten van patronen uit data en het gebruik maken van deze patronen om de toekomst te voorspellen en daarop te acteren. In vrijwel alle sectoren is het gebruik van data in opkomst of reeds gemeengoed. Data science wordt daarbij veelvuldig onderschreven als manier om organisaties toekomstbestendig te maken. In deze tweedaagse Masterclass leer je de beginselen van data science en maak je kennis met R, een veelgebruikte programmeertaal onder data scientists. Je leert een basis data science workflow en leert enkele veelgebruikte, breed-inzetbare, en krachtige analysetechnieken.

Creëer toegevoegde waarde en verbeter het bedrijfsresultaat met data science

Het vermogen om de toekomst te voorspellen stelt organisaties in staat om beter te reageren op wat komen gaat. Organisaties die in staat zijn daar gebruik van te maken en toekomstgericht te handelen, kunnen meer toegevoegde waarde leveren en zijn beter in staat hun missie waar te maken. Van finance tot logistiek en van marketing tot operations: data science als manier tot waarde creatie is een groot competitief voordeel. Als professional met data science kennis kun jij hierbij helpen.

R: een simpele manier om met complexe data te werken

De gebruiksvriendelijke programmeertaal R is een van de meest gebruikte programmeertalen onder data scientists. R geeft via zogeheten ‘software libraries’ toegang tot allerhande geavanceerde statistische technieken en technieken uit de kunstmatige intelligentie. Om die reden is R een soort Zwitsers zakmes voor data scientist en een zeer nuttige taal om te kennen. R kan ook gemakkelijk gekoppeld worden aan BI pakketten zoals Power BI. In deze masterclass maak je kennis met twee state-of-the-art technieken in R voor het detecteren van samenhangen (bijvoorbeeld het classificeren van klantgroepen) en het voorspellen van ontwikkelingen (bijvoorbeeld uitgaven per klant).

Big Data

Het goed ontsluiten van patronen gaat vaak samen met het combineren van data uit diverse bronnen. In R is het eenvoudig om data uit meerdere bronnen te bekijken en te combineren. Daarbij heeft R krachtige visualisatiemogelijkheden om complexe data sets op een eenvoudige manier inzichtelijk te maken. De kunst daarbij is om inzichtelijk te maken wat er werkelijk toe doet, gegeven een bepaalde business vraag en om de patronen in de data op een juiste manier te interpreteren.

Wat leer je in deze Masterclass?

Na afloop  ben je in staat om:

  • Een basis data science workflow in R uit te voeren
  • Visualisaties van data te maken
  • Een classificatietechniek (K-means) in te zetten om clusters in datasets op te sporen
  • Een voorspeltechniek (random forest) in te zetten om patronen in datasets te ontdekken en daarmee voorspellingen te maken

Doelgroep

Deze Masterclass is bedoeld voor iedereen die kennis wil maken met data science en ervaring wil opdoen met programmeren in de taal R. Van adviseurs, analisten, consultants, accountants, onderzoekers, managers en management controllers: een basiskennis van data science is voor vrijwel iedereen waardevol. Deelnemers worden verwacht te beschikken over een academisch werk- en denkniveau. Basiskennis van statistiek is aanbevolen.

Handig om te weten

Data 

Vrijdag 24 en 31 maart 2023

Collegegeld € 999,- vrij van BTW
STAP-budget

Indien je je aanmeldt met een STAP-budget, wordt je inschrijving behandeld als een voorlopige inschrijving. Wanneer je STAP-aanvraag is goedgekeurd, wordt de inschrijving definitief gemaakt. Erasmus Q-Intelligence ontvangt bericht van het UWV als je aanvraag is goedgekeurd.

Je kunt op 2 januari 2023 STAP-budget aanvragen voor deze Masterclass. 

Locatie

Campus Woudestein, Erasmus Universiteit Rotterdam

Certificaat

Als je de volledige Masterclass hebt gevolgd, krijg je een certificaat van deelname van de Erasmus Universiteit Rotterdam.

Programma

09:00 - 09:30

Introductie en kennismaking

9:30 - 10:30
  • De basis data science workflow
  • R en R Studio: set-up en uitleg
10:30 - 10:45Pauze
10:45 - 12:00
  • Het aanroepen van software libraries
  • Basis data-analyse en -manipulatie
12:00 - 13:00Lunch
13:00 - 14:00
  • Basis data visualisaties (histogrammen, density plots, box plots, scatterplots, time series plots)
14:00 - 14:45
  • Praktijkoefeningen met basis data-analyse en -visualisatie
14:45 - 15:00Pauze
15:00 - 16:00
  • Dimensiereductie: hoe visualiseer je grote data sets met veel variabelen?
  • Interpretatie van dimensiereductie plots
16:00 - 16:45
  • Praktijkoefeningen met dimensiereductie en interpretatie
16:45 - 17:00Samenvatting en afsluiting dag 1

09:00 - 09:15

Opening en bespreking dagprogramma

9:15 - 10:30
  • Clusteranalyse: wat is het en wat doet het?
  • De K-means methode
  • Hoe en wanneer kun je clusteranalyse uitvoeren?
10:30 - 10:45Pauze
10:45 - 12:00
  • Case: onderscheiden van klantgroepen
12:00 - 13:00Lunch
13:00 - 14:00
  • Patroonherkenning en voorspellen
  • Beslisbomen
  • Random forest
14:00 - 14:45
  • Trainen vs testen
  • Evaluatie van voorspelprestaties
14:45 - 15:00Pauze
15:00 - 16:00
  • Case: voorspellen van uitgaven
16:00 - 16:30
  • Exporteren van bevindingen
16:30 - 17:00Samenvatting, evaluatie en afsluiting

Vergelijk @count opleiding

  • @title

    • Tijdsduur: @duration
Vergelijk opleidingen