Wetenschap: Mix van aankoopmotivaties geeft online shoppers passende aanbevelingen uit een groot assortiment

Wetenschap: Mix van aankoopmotivaties geeft online shoppers

Door: Bruno JacobsBas Donkers en Dennis Fok

Gepersonaliseerde productaanbevelingen in webshops of nieuwsbrieven zijn effectief, blijkt uit onderzoek. Maar als ze niet goed passend zijn, werken ze juist averechts. Voor grote webwinkels vormt dat een extra uitdaging. Veel bestaande algoritmes kunnen namelijk lastig uit de voeten met grote klantenbestanden en een breed assortiment. Ook wetenschappers hebben hun tanden inmiddels in dat probleem gezet. Zo ontwikkelden wij een veelbelovende nieuwe aanpak die schaalbaar genoeg is voor elke Nederlandse webshop én prima voorspelresultaten geeft.

In de strijd om marktaandeel breiden de grote webwinkels hun assortiment steeds verder uit. Vaak niet alleen binnen de oorspronkelijke productcategorieën, maar ook ver daarbuiten. Zo vind je bij de Nederlandse big three (Bol.com, Wehkamp en Coolblue) net zo makkelijk tuingereedschap als verzorgingsproducten. Gepersonaliseerde aanbevelingen en aanbiedingen helpen de bezoeker wegwijs te maken en te prikkelen. Om ook tijdens het bezoek aan de site te kunnen inspelen op het zoekgedrag van de bezoeker is een razendsnel algoritme nodig.

Vergelijkbare klantprofielen lastig te vinden
De meeste webshops bepalen hun aanbevelingen met behulp van collaborative filtering technieken: een nieuwe klant krijgt aanbevelingen op basis van voorkeuren van andere klanten met een vergelijkbaar klantprofiel. Bij een heterogeen klantenbestand is het met deze technieken echter lastig om goede overeenkomsten te bepalen. Het nauwkeurig beschrijven van de heterogeniteit binnen een klantenbestand is nu juist de kracht van keuzemodellen. Deze modellen zijn echter niet goed toepasbaar op hele grote datasets. Opsplitsen van de dataset rekt de mogelijkheden van beide aanpakken wel wat op, maar leidt ook tot verlies van relevante informatie. Met onze nieuwe methode slaan wij een brug tussen deze twee benaderingen.

Van tekstdocumenten naar retail
Om het schaalbaarheidsprobleem te tackelen, maakten we een uitstapje naar tekstclassificatie. De hier gebruikte modellen werken met gigantische datasets. Zo werden via latent Dirichlet allocation (LDA) ondermeer 8 miljoen Twitter-posts geanalyseerd op meer dan 5 miljoen verschillende woorden en ingedeeld op impliciete onderwerpen. Door zo’n impliciet onderwerp te beschouwen als aankoopmotivatie, maakten we een vertaalslag naar retail. Teksten worden gezien als klanten en de verzameling woorden vormt het assortiment.

Onderliggende aankoopmotivaties
Het LDA-model vertaalt de bestelhistorie van een klant naar aankoopmotivaties – denk bijvoorbeeld aan biologische producten, goedkope producten, producten voor babyverzorging en producten voor een gevoelige huid. Deze aankoopmotivaties vormen de basis voor nieuwe aanbevelingen. Op basis van de klantgegevens past het model de relevantie van elke motivatie aan en het mooie is dat je dus voortdurend met de volledige dataset kunt werken. Dat maakt LDA krachtig en flexibel.

Extra klantinformatie toevoegen
De meeste klanten hebben een kleine bestelhistorie. Voorkeuren voorspellen is in zo’n geval lastig. Extra klantinformatie kan de voorspelkwaliteit van een model dan sterk verbeteren. Wie immers vanaf een website voor jonge ouders naar een webshop gaat, is vermoedelijk geïnteresseerd in babyproducten. Daarom breidden wij het LDA-model uit, zodat aanvullende klantinformatie kan worden toegevoegd. Het uitgebreide model biedt zo tevens een oplossing voor het cold-start-probleem: ook nieuwe bezoekers ontvangen al gepersonaliseerde aanbevelingen.

Uitstekende performance
Wat de nieuwe methode uniek maakt, is dat deze louter op basis van de bestelhistorie al prima resultaten boekt. Wij vergeleken de performance van het model met bestaande algoritmes. Op vier criteria (heterogeniteit, schattingscomplexiteit, voorspelkwaliteit en vereist geheugen voor real time voorspellingen) scoort het vergelijkbaar of beter dan een benadering via collaborative filtering. Toevoegen van extra klantinformatie verbetert de voorspelkwaliteit nog verder.

De grootste winst boekt de LDA-methode op het gebied van schaalbaarheid. De modellen kunnen makkelijk uit de voeten met een assortiment van 500 producten (of geaggregeerde productgroepen) en een onbeperkt aantal klanten. Met de nieuwe methode kan elke Nederlandse webshop zijn klantenbestand en assortiment doorrekenen. 

Referentie
Bruno J.D. Jacobs, Bas Donkers, Dennis Fok (2016), "Model-Based Purchase Predictions for Large Assortments", Marketing Science, 35-3, pp. 389-404

Cartoon: Rina Piccolo

CV

Promovendus Bruno Jacobs is verbonden aan de sectie Marketing in de capaciteitsgroep Bedrijfseconomie van Erasmus School of Economics en lid van de onderzoeksschool ERIM. Met zijn promotieonderzoek stelt Jacobs zich ten doel een set van gereedschappen te ontwikkelen om klantervaringen bij online-winkelen te verbeteren, dit op basis van eerder waargenomen consumentengedrag. Hij richt zich daarbij nadrukkelijk op schaalbaarheid, zodat deze gereedschappen ook gebruikt kunnen worden in grote klantenbestanden en assortimenten.

Bas Donkers is hoogleraar Marketing Research aan Erasmus School of Economics. Het onderzoek van Donkers richt zich op de modelmatige analyse van het gedrag van consumenten. Hierbij worden inzichten vanuit de economische theorie en de meer gedragsmatige disciplines geïntegreerd en gekwantificeerd. Deze inzichten kunnen vervolgens gebruikt worden door zowel marktpartijen als beleidsmakers. 

Dennis Fok is hoogleraar Toegepaste Econometrie aan Erasmus School of Economics. In zijn onderzoek richt Dennis Fok zich op de ontwikkeling en toepassing van econometrische modellen en technieken om actuele vragen in het bedrijfsleven te beantwoorden. In het bijzonder is hij geïnteresseerd in het modeleren van gedetailleerde informatie over het gedrag van consumenten en bedrijven en het daaruit afleiden van strategische implicaties voor consumenten, marktpartijen en beleidsmakers.

Vergelijk @count opleiding

  • @title

    • Tijdsduur: @duration
Vergelijk opleidingen