Naast het uitvoeren van wetenschappelijk onderzoek heeft het WPR ook als doel om kennisdeling te bevorderen tussen wetenschap, beleid, uitvoering en praktijk. Het WPR geeft op drie manieren invulling aan dit doel:
- Het organiseren van symposia en kennissessies
- Het uitgeven van een digitale nieuwsbrief
- Het onder de aandacht brengen van relevante internationale publicaties op het terrein van risicoverevening
Symposia en kennissessies
Op 7 maart vond op Teams een WPR-webinar plaats over Hoge Risico Verevening (HRV). Aan dit webinar namen 36 geïnteresseerden deel uit wetenschap, beleid en praktijk.
Het Nederlandse risicovereveningsmodel behoort tot de beste vereveningsmodellen ter wereld. Uit onderzoek blijkt dat ons risicovereveningsmodel grotendeels compenseert voor voorspelbare verschillen in zorgkosten tussen verzekerden. De risicoverevening levert daarmee een belangrijke bijdrage aan het bewerkstelligen van een gelijk speelveld voor verzekeraars en het tegengaan van prikkels tot risicoselectie. Desondanks is het risicovereveningsmodel nog niet perfect. Zo worden verzekerden met meerdere chronische aandoeningen nog steeds ondergecompenseerd.
Meer dan 25 jaar geleden is een methode voorgesteld om voorspelbare verliezen op de hoogste risico’s te verminderen: Hoge Risico Verevening (HRV). Deze methode houdt in dat vooraf een groep van hoog-risico verzekerden wordt aangewezen waarvoor verzekeraars achteraf een (gedeeltelijke) compensatie ontvangen op basis van werkelijke kosten. Ondanks veelbelovend onderzoek, is deze methode tot op heden nog niet ingezet, niet in Nederland noch in andere landen.
Het webinar begon met een korte presentatie van Richard van Kleef (ESHPM) over het ‘wat en waarom’ van HRV. Daarna volgden presentaties van Anja Withagen-Koster en Michel Oskam (beiden op persoonlijke titel) over interessante toepassingen van HRV op Nederlandse data. De opname van de presentaties vind je hier. De PowerPoint-slides kun je hier downloaden.
Na afloop van de presentaties werd gediscussieerd over de potentie van HRV voor Nederland. Daarbij kwamen de voor- en nadelen van HRV aan bod, alsook de uitvoeringsaspecten. Een eerste peiling onder de deelnemers wees uit dat 90% het interessant zou vinden om de mogelijkheden voor toepassing van HRV in de Nederlandse basisverzekering verder te verkennen. Vervolgens werd gediscussieerd over potentieel interessante modaliteiten van HRV. Daarbij kwam de vraag naar voren welke partij zou moeten bepalen welke verzekerden in aanmerking komen voor HRV: de overheid, verzekeraars of anders? Bij een tweede peiling gaf 52% van de respondenten aan dat de overheid dit zou moeten doen; 31% gaf aan dit meer een taak voor verzekeraars te vinden; 17% dacht aan een andere partij zoals zorgaanbieders (zie laatste slide PPT).
Kortom: het overgrote deel van de aanwezigen gaf aan wel iets te zien in HRV als aanvulling op de ex-ante risicoverevening, al bleek men het nog niet eens over de beste vormgeving.
Op 28 november 2024 vond op Teams een WPR-webinar plaats over de impact van risicoverevening op de prikkels voor prijs- en volumebeheersing. Aan dit webinar namen 39 geïnteresseerden deel uit wetenschap, beleid en praktijk.
Het webinar begon met een presentatie van Rudy Douven (ESHPM) over een onderzoek waarin maatstaven zijn ontwikkeld voor het kwantificeren van prikkels voor prijs- en volumebeheersing. Samen met internationale collega’s heeft Douven die maatstaven vervolgens toegepast op verschillende landen waaronder Nederland.
Uit het onderzoek blijkt dat de morbiditeitskenmerken in het Nederlandse vereveningsmodel leiden tot een vermindering van prikkels voor prijs- en volumebeheersing, ceteris paribus. De PPT-slides van de presentatie vind je hier.
Vervolgens is gediscussieerd over de vraag in hoeverre de door Douven et al. aangetoonde vermindering in prikkels voor prijs- en volumebeheersing problematisch is voor het Nederlandse zorgstelsel. Daarbij zijn via een peiling de volgende deelvragen voorgelegd aan het publiek: Denk je dat Nederlandse zorgverzekeraars zich bewust zijn van de impact van risicoverevening op de prikkels voor prijs- en volumebeheersing? Denk je dat prijsonderhandelingen tussen zorgverzekeraars en zorgaanbieders worden beïnvloed door de risicoverevening? Denk je dat het beleid van verzekeraars ten aanzien van ‘preventie’ en ‘juiste zorg op de juiste plek’ wordt beïnvloed door de risicoverevening?
Benieuwd naar de uitslag van de peiling? Kijk dan hier.
Op 26 januari 2024 vond op de campus van de Erasmus Universiteit Rotterdam de kick-off plaats van het WPR. Samen met ruim 50 vereveningsexperts uit onderzoek, beleid en praktijk zijn we die middag in gesprek gegaan over
- Het belang van wetenschappelijk onderzoek voor de doorontwikkeling van de risicoverevening
- De doelen van het WPR
- De invulling van het WPR in termen van onderzoek, samenwerking en kennisdeling
De kick-off heeft een lange lijst aan ideeën opgeleverd voor onderzoek en kennisdeling. U kunt het verslag van de paneldisccussie downloaden als ook de slides.
Relevante internationale publicaties
McWilliams, J.M., G. Weinreb, M.B. Landrum & M.E. Chernew (2025). Use Of Patient Health Survey Data For Risk Adjustment To Limit Distortionary Coding Incentives In Medicare. Health Affairs 44: 48-57. https://doi.org/10.1377/hlthaff.2023.01351
In de Verenigde Staten worden risicovereveningsmodellen gebruikt voor zowel de bekostiging van zorgverzekeraars als de bekostiging van zorgaanbieders. Een veelgebruikt model is het Hierarchical Condition Categories (HCC) model. Dit model bevat een zeer geavanceerde morbiditeitsclassificatie op basis van diagnose-informatie. Een groot nadeel van dit model is dat de onderliggende diagnoses beïnvloedbaar zijn door zorgverzekeraars en zorgverleners. In dit onderzoek is nagegaan in hoeverre dit probleem kan worden verminderd via het gebruik van informatie uit gezondheidsenquêtes (die minder gemakkelijk te manipuleren zijn).
De uitkomsten laten zien dat het gebruik van een ‘hybride’ morbiditeitsclassificatie die deels is gebaseerd op enquêtegegevens en deels op diagnose-informatie niet alleen de prikkels voor manipulatie kan verminderen maar ook de prikkels voor risicoselectie. Daarnaast leidt zo’n hybride morbiditeitsclassificatie tot betere prikkels om efficiënte zorg te leveren.
De auteurs erkennen dat betrouwbaarheid en non-response een uitdaging vormen, maar geven aan dat deze uitdagingen niet onoverkomelijk zijn. De conclusie luidt daarom dat het gebruik van enquêtegegevens voor risicoverevening een interessante richting is voor vervolgonderzoek.
Dit artikel is gepubliceerd in het januari (2025) nummer van Health Affairs. Dit nummer bevat nog een aantal andere interessante artikelen over risicoverevening.
Panturu, A., R.C. van Kleef, F. Eijkenaar & D. Cattel (2024). A framework for the design of risk-adjustment models in healthcare provider payment systems (2024). Medical Care Research and Review. https://doi.org/10.1177/10775587241273355
Prospectieve bekostigingssystemen voor zorgverleners gebruiken vaak ‘off-the-shelf’ risicovereveningmodellen die oorspronkelijk voor andere doeleinden zijn ontwikkeld. Het ontwerp van risicovereveningsmodellen voor prospectieve betaling van zorgverleners is echter een complex proces met lastige keuzes en afwegingen. Dit artikel ontwikkelt een conceptueel raamwerk dat deze keuzes en afwegingen samenbrengt. Dat leidt tot een aantal belangrijke inzichten. Ten eerste is het ontwerp van risicovereveningsmodellen geen kwestie van one-size-fits-all. Het ontwerp vereist normatieve keuzes over welke variabelen gecompenseerd moeten worden (C-variabelen) en welke variabelen onder de verantwoordelijkheid van de zorgverleners vallen (R-variabelen). Ten tweede moet het ontwerpproces worden geleid door drie belangrijke criteria: (a) adequate compensatie voor kostenvariatie die is gerelateerd aan C-variabelen; (b) geen compensatie voor kostenvariatie die is gerelateerd aan R-variabelen; en (c) uitvoerbaarheid. Ten derde kunnen de verschillende ontwerpkeuzes en -opties worden gecategoriseerd langs twee overkoepelende dimensies: (a) de keuze van vereveningskenmerken en (b) de keuze van betalingsgewichten die hieraan zijn gekoppeld. De aanbeveling van de auteurs is om deze keuzes expliciet te maken, rekening houdend met de context en de afwegingen tussen selectie, kostenbeheersing en uitvoerbaarheid.
Van Kleef, R.C., Reuser, M., Stam, P.J. & Van de Ven, W.P.M.M. A framework for ex-ante evaluation of the potential effects of risk equalization and risk sharing in health insurance markets with regulated competition (2024). Health Economics Review 14, 57 (2024). https://doi.org/10.1186/s13561-024-00540-4.
Dit artikel biedt een conceptueel kader voor het ex-ante evalueren van risicoverevenings/risicodelingsmodellen in zorgverzekeringsmarkten met gereguleerde concurrentie. Het artikel bestaat uit drie delen. Het eerste deel bespreekt 22 potentiële effecten van risicoverevening en risicodeling. Het tweede deel geeft een overzicht en categorisering van kwantitatieve maatstaven die in de literatuur worden gebruikt voor het evalueren van risicoverevenings/risicodelingsmodellen. Belangrijke observaties zijn dat niet alle maatstaven die worden gebruikt even relevant zijn in het licht van de potentiële effecten en dat niet voor alle 22 potentiële effecten geschikte maatstaven bestaan. Dit leidt tot een belangrijke aanbeveling voor onderzoekers: ontwikkel aanvullende maatstaven voor het kwantificeren van de potentiële effecten van risicoverevening en risicodeling. Het derde deel legt het raamwerk van potentiële effecten en maatstaven naast het WOR-toetsingskader (versie: 2017-2022). Belangrijke observaties zijn dat veel van de 22 effecten niet expliciet worden meegenomen in het WOR-toetsingskader (niet kwantitatief, noch kwalitatief) en dat de set van kwantitatieve maatstaven incompleet en op sommige punten zelfs niet valide is. Dit leidt tot een belangrijke aanbeveling voor beleidmakers: houd het toetsingskader tegen het licht en zorg ervoor dat alle potentiële effecten expliciet worden meegenomen en meegewogen (waar mogelijk kwantitatief, en anders kwalitatief). Inmiddels is de lijst van 22 potentiële effecten toegevoegd aan het WOR-toetsingskader (versie: 2023-heden). Desondanks blijft het WOR-toetsingskader onzes inziens voor verbetering vatbaar, met name als het gaat om de set van kwantitatieve maatstaven (die nog steeds incompleet en op sommige punten niet valide is). Werk aan de winkel!
Ismail, I., P.J.A. Stam, F.R.M. Portrait, A. van Witteloostuijn & X. Koolman. Addressing unanticipated interactions in risk equalization: A machine learning approach to modeling medical expenditure risk (2024). Economic Modelling. https://doi.org/10.1016/j.econmod.2023.106564
Dit artikel onderzoekt de potentiële meerwaarde van het gebruik ‘machine learning’ (ML) voor risicoverevening. De auteurs laten zien hoe machine learning kan helpen bij het opsporen van relevante interactietermen tussen risicofactoren. Een vernieuwend aspect van dit onderzoek is dat de auteurs gebruikmaken van een zeer grote dataset (N=17m) waardoor complexere interactietermen kunnen worden opgespoord dan in eerdere onderzoeken waarin veel kleinere datasets zijn gebruikt. Een ander vernieuwend aspect is dat het artikel een uitgebreide beschrijving geeft van de ML-technieken die worden gebruikt, te weten Random Forest (RF) en Gradient Boosting Machines (GBM). In een empirische simulatie passen de auteurs deze ML-technieken toe op het Nederlandse vereveningsmodel. Daarbij maken zij gebruik van een ‘split-sample’ methode ter voorkoming van ‘overfitting’. Uit de resultaten blijkt dat het gebruik van ML kan leiden tot een toename van de verklaarkracht van het vereveningsmodel en een afname van de voorspelbare winsten/verliezen voor specifieke subgroepen. Het discussiehoofdstuk bespreekt de voor- en nadelen van het gebruik van ML voor risicoverevening.
Van Kleef, R.C., M. Reuser, T.G. McGuire, K. Beck, J. Wasem, S. Brammli-Greenberg, J. Armstrong, E. Schokkaert, F. Paolucci, and R.P. Ellis. Scope and Incentives for Risk Selection in Health Insurance Markets With Regulated Competition: A Conceptual Framework and International Comparison (2024). Medical Care Research & Review. https://doi.org/10.1177/10775587231222584.
Dit artikel biedt een conceptueel kader voor het analyseren van “scope” (i.e., mogelijke acties van verzekeraars en verzekerden) en “incentives” voor risicoselectie in zorgverzekeringsmarkten met gereguleerde concurrentie. Hierbij worden vier hoofdvormen van risicoselectie onderscheiden: 1) risicoselectie door verzekerden in/uit de markt, 2) risicoselectie door verzekerden tussen verzekeringsproducten, 3) risicoselectie door verzekeraars via productdifferentiatie en 4) en risicoselectie door verzekeraars via andere wegen zoals marketing, klantenservice en aanvullende verzekeringen. Het conceptuele kader bespreekt per hoofdvorm hoe “stelselaspecten” van invloed zijn op de scope en incentives voor selectie. Selectie is alleen een probleem als zowel scope als incentives aanwezig zijn. Vervolgens wordt het conceptuele kader toegepast op negen zorgverzekeringsmarkten met gereguleerde concurrentie in Australië, Europa, Israel en de Verenigde Staten. Een belangrijke observatie is dat er grote verschillen bestaan in scope en incentives tussen zorgverzekeringsmarkten. Dit verklaart waarom een selectievorm in de ene verzekeringsmarkt problematischer is dan in de andere. In het discussiehoofdstuk wordt een aantal beleidsimplicaties besproken. Één van die beleidsimplicaties is dat risicoselectie op twee manieren kan worden tegengegaan: 1) via het verkleinen van de ‘scope’ en 2) via het verminderen van ‘incentives’. Een nadeel van het verkleinen van de scope voor risicoselectie (bijvoorbeeld via productstandaardisatie) is echter dat daarmee ook de scope voor doelmatigheid wordt verkleind. In theorie, gaat de voorkeur daarom uit naar het verminderen van de incentives voor risicoselectie.
Van de Ven, W.P.M.M. & R.C. van Kleef (2024). A critical review of the use of R2 in risk equalization research? (2024). European Journal of Health Economics. https://doi.org/10.1007/s10198-024-01709-8.
Bijna alle empirische onderzoeken waarin een risicovereveningsformule wordt geschat, presenteren de waarde van de statistische maatstaf R2 (op individueel niveau). De R2-waarde wordt vaak (impliciet) geïnterpreteerd als een maatstaf voor de mate waarin de vereveningsbijdragen de door regelgeving veroorzaakte voorspelbare winsten en verliezen op verzekerden wegnemen, waarbij een hogere R2-waarde duidt op betere prestaties. In veel gevallen weten we echter niet of een model met R2 = 0,30 de voorspelbare winsten en verliezen meer reduceert dan een model met R2 = 0,20. In dit artikel wordt beargumenteerd dat de R2 in de context van risicoverevening moeilijk te interpreteren is als maatstaf voor selectieprikkels, tot verkeerde en misleidende conclusies kan leiden als het wordt gebruikt als maatstaf voor selectieprikkels, en daarom niet bruikbaar is voor het meten van selectieprikkels. Hetzelfde geldt voor gerelateerde statistische maatstaven zoals de Mean Absolute Prediction Error (MAPE), Cumming’s Prediction Measure (CPM) en de Payment System Fit (PSF). Er zijn enkele uitzonderingen waarbij de R2 nuttig kan zijn. De aanbeveling van de auteurs is om de R2 ofwel met een duidelijke, valide en relevante interpretatie te presenteren, ofwel de R2 niet te presenteren. Hetzelfde geldt voor de gerelateerde statistische maatstaven MAPE, CPM en PSF. De beleidsrelevantie van dit artikel is dat de R2 als evaluatiemaatstaf van de kwaliteit van een vereveningsmodel in het algemeen niet geschikt is. Goede evaluatie-maatstaven zijn de voorspelbare winsten en verliezen per verzekerde voor relevante subgroepen, bijvoorbeeld subgroepen van gezonde verzekerden en subgroepen van ongezonde verzekerden.
Politzer, E. (2024). Utilization Thresholds in Risk Adjustment Systems (2024). American Journal of Health Economics 10: 470-503. https://doi.org/10.1086/724791?journalCode=ajhe
Dit artikel onderzoekt de vormgeving van drempels die worden gebruikt bij de indeling van verzekerden in risicoklassen. De auteur neemt de DDD-drempel die wordt gebruikt bij Farmacie Kosten Groepen (FKGs) als voorbeeld. DDD staat voor ‘Defined Daily Dose’ en de DDD-drempel geeft aan hoeveel standaard dagdoseringen van een bepaald medicijn een verzekerde in het voorgaande jaar moet hebben gebruikt om in een FKG te worden ingedeeld. De auteur van het artikel laat zien hoe de hoogte van de DDD-drempel van invloed is op zowel de verevenende werking als de perverse prikkels voor verzekeraars (dat wil zeggen: de prikkels voor verzekeraars om verzekerden de DDD-drempel te laten passeren ten behoeve van een hogere vereveningsbijdrage). In de praktijk wordt vaak gebruikgemaakt van een uniforme DDD-drempel. In een empirische simulatie met Amerikaanse data laat de auteur zien hoe een FKG-specifieke DDD-drempel kan leiden tot een verbetering van de verevende werking. Vervolgens laat de auteur zien hoe het gebruik van meerdere drempelwaarden per FKG kan leiden tot een verdere verbetering van de verevenende werking en een vermindering van perverse prikkels.