Polygenetische risicoscores — het moet allemaal nog blijken

Met ‘polygenetische risicoscores’ zou men niet alleen ziekten zoals diabetes, maar ook persoonlijkheids- kenmerken zoals intelligentie kunnen voorspellen. Maar de onderzoekers lopen akelig ver voor de muziek uit.

door Cecile Janssens – Skepter 32.2 (2019)

DE markt voor commerciële DNA-tests is booming. Het aantal mensen dat online een DNA-test koopt, is de afgelopen jaren exponentieel gestegen — alleen al in de Verenigde Staten waren het er vorig jaar meer dan 26 miljoen. De belangstelling is het grootst voor de tests naar herkomst van de voorouders, maar ook tests voor leefstijl, gezondheid en de kans op ziekten die voorspeld worden met zogeheten ‘polygenetische risicoscores’ zitten in de lift.

Die polygenetische risicoscores zijn niet nieuw. De eerste wetenschappelijke artikelen waarin voorgesteld werd hoe de genetische aanleg voor allerlei ziekten bepaald zou kunnen worden en hoe die gebruikt zou kunnen worden in de gezondheidszorg dateren van twintig jaar terug, de tijd waarin het menselijk genoom voor het eerst in kaart gebracht werd. De genen moesten nog wel opgespoord worden, maar het idee voor de risicoscores lag voor de hand.

(foto: 23andMe)

Aanvankelijk leken de beloften te worden ingelost. Het werd mogelijk om met een enkele, betaalbare scan het complete DNA — en alle minieme variaties die daarin blijken te zitten — in kaart te brengen. Hierdoor werd het ook mogelijk te bekijken in hoeverre al die variaties samen van invloed waren op het risico op allerlei ziekten. Maar die polygenetische scores bleken uiteindelijk toch niet zo informatief, en de belangstelling zakte langzaam weg. Na ruim tien jaar onderzoek zag ik weinig vooruitgang (en geen grote toekomst) meer in het veld, en besloot ik om de focus van mijn onderzoek te verleggen.
Ik was dan ook verbaasd door de plotseling hernieuwde belangstelling voor de polygenetische risicoscores. Twee factoren lijken aan die recente opbloei te hebben bijgedragen.

Ten eerste kreeg in 2017 de aanbieder van commerciële DNA-tests in de Verenigde Staten, 23andMe, toestemming van de Amerikaanse toezichthouder om onder strenge voorwaarden polygenetische risicoscores aan te bieden. En in augustus vorig jaar kondigden onderzoekers van de Harvard-universiteit onder leiding van Sekar Kathiresan met veel tamtam een doorbraak aan in het onderzoek naar polygenetische risicoscores. Volgens hen ‘was het tijd om te gaan denken over het gebruik van polygenetische risicoscores in de gezondheidszorg’.

Had ik iets over het hoofd gezien?

Genetica

Bij genetisch testen is het belangrijk om een onderscheid te maken tussen monogenetische en complexe ziekten. ‘Monogenetisch’ betekent dat één gen de ziekte veroorzaakt, helemaal of in belangrijke mate. De ziekte van Huntington en taaislijmziekte zijn voorbeelden van erfelijke ziekten waarbij de oorzaak volledig in het DNA ligt. Deze ziekten zijn vaak zeldzaam, en de oorzaak is een defect in het DNA: een DNA-mutatie. Als de mutatie bekend is en de laboratoriumtest is honderd procent betrouwbaar, dan zijn de ziekten nauwkeurig te voorspellen, zelfs al voor de geboorte.

Complexe ziekten ontstaan door een ingewikkeld samenspel van genen en omgeving, van genetische en niet-genetische factoren. Hart- en vaatziekten, diabetes en astma zijn voorbeelden van complexe ziekten, maar ook van mens tot mens wisselende kenmerken als intelligentie, muzikaliteit en persoonlijkheid hebben vaak een erfelijke component. De genetische aanleg wordt hierbij echter niet bepaald door één gen, maar door tientallen of honderden genen. We spreken dan niet van mutaties, maar van variaties, kleine verschillen. En omdat ook niet-genetische factoren een belangrijke rol spelen bij deze ziekten en eigenschappen, zijn genetische tests vaak weinig voorspellend.

Het onderscheid tussen monogenetische en complexe ziekten lijkt simpel, maar er is een grijs gebied. Er zijn mutaties voor aandoeningen zoals borstkanker die het risico weliswaar sterk verhogen maar die niet honderd procent voorspellend zijn, en er zijn complexe ziekten zoals maculadegeneratie, jeugddiabetes en de ziekte van Crohn waarbij een aantal genen zo’n grote rol spelen dat ze samen een goede voorspellende test vormen: dan is de polygenetische risicoscore behoorlijk informatief.

(foto: Pxhere)

Polymorfismen

Polygenetische risicoscores berekenen de gevolgen van DNA-variaties voor een ziekte of kenmerk. De kleinst mogelijke variatie in het DNA is een verandering van een enkele bouwsteen, een single nucleotide polymorphism (SNP, onderzoekers zeggen ‘snip’). Er zijn vier soorten bouwstenen, kortheidshalve aangeduid als A, C, T en G. Als ergens een T zit waar ook een A had kunnen zitten, is er sprake van een SNP. Het DNA krijg je van beide ouders, dus ook je SNP’s krijg je van beide ouders: A of T. Een DNA-variatie wordt daarmee, in ons voorbeeld, AA, AT of TT. Stel nu dat T een bouwsteen is die het risico op ziekte verhoogt, een risicovariant, dan tellen we per SNP 0, 1 of 2 punten. Als we tien SNP’s gebruiken en samenvoegen tot een enkele polygenetische risicoscore, dan heeft die score een minimum van 0 en een maximum van 20 punten.

Wanneer we de risicovarianten simpelweg optellen, veronderstellen we dat alle SNP’s het risico op ziekte in dezelfde mate verhogen. Dat is vaak niet het geval. Sommige genen hebben meer invloed dan andere en de risicovarianten in die genen moeten zwaarder tellen in de score. Daarom rekenen onderzoekers met gewogen polygenetische risicoscores: voordat de risicovarianten worden opgeteld, wordt er een gewicht aan gehangen.

De vermenigvuldigingsfactor wordt bepaald in ‘genoombrede associatiestudies’ waarin, simpel gezegd, onderzocht wordt hoeveel mensen met een bepaalde aandoening vaker een bepaalde genvariant hebben dan mensen zonder die aandoening — als de genvariant veel vaker voorkomt bij zieken, telt hij zwaarder dan wanneer de variant even vaak voorkomt bij zieken als bij niet-zieken.

Een polygenetische risicoscore tussen 0 en 20 is niet hetzelfde als een risico tussen 0 en 20 procent. Om die vertaalslag te maken, moet ook nog worden onderzocht of de score in een cohortstudie kan voorspellen wie uiteindelijk ziek wordt en wie niet, en hoe sterk het verband is.

De polygenetische risicoscore is in feite een statistische constructie. Het is een formule om een selectie van SNP’s met een selectie van gewichten te vertalen in een risico. Er is niet zo-iets als dé polygenetische risicoscore — er is geen gouden standaard hoe ze berekend moeten worden, er zijn geen richtlijnen hoe SNP’s te selecteren, hoe de gewichten te berekenen, en hoe de score om te zetten naar een risicoschatting. Het onderzoek staat nog in de kinderschoenen. Op een enkele mooie vondst na laten de resultaten, als we heel eerlijk zijn, nog op zich wachten. ‘It’s still early days,’ zegt men dan — het moet allemaal nog blijken.

Klinisch nut

Het onderzoek naar polygenetische risicoscores bestaat niet alleen uit het zo goed mogelijk berekenen van de score. We willen immers ook weten of die score werkelijk ziekten voorspelt, en of hij bruikbaar is in de gezondheidszorg.

Onderzoekers die ervaren zijn in het technisch modelleren van complexe data zijn vaak onvoldoende op de hoogte van de eisen die gesteld worden aan de klinische relevantie van tests. Zij bouwen steeds ingewikkelder scores die, mede dankzij de zeer grote databestanden waarvan ze gebruikmaken, leiden tot statistisch significante risico’s en tot de conclusie dat de risicoscores de ziekten kunnen voorspellen. Maar dat een verband statistisch significant is, betekent nog niet dat het verband bruikbaar is.

DNA sequencing (foto: S. Thorpe | US Navy)

Toekomstige gebruikers van de risicoscores — andere onderzoekers, artsen, consumenten — kunnen de ingewikkelde berekeningen niet volgen. Ze vertrouwen op de kennis en kunde van de modelleurs en op de statistische significantie van de risicoscore. Dat associatie niet voldoende is voor klinische relevantie wordt ook door hen gemakkelijk vergeten.

Ik ben geen modelleur en geen toekomstige gebruiker. Ik heb mij gespecialiseerd in ‘translationeel onderzoek’, in vragen over voorspellende waarde van tests: wat hebben gebruikers nodig en kan de modelleur dat leveren? En in die vertaling gaat het nogal eens mis in wetenschappelijke studies. Zo ook vorig jaar augustus.

Haken en ogen

Het onderzoek van Harvard betrof polygenetische risicoscores voor vijf aandoeningen: coronaire hartziekte, boezemfibrilleren, ouderdomsdiabetes, prikkelbaredarmsyndroom en borstkanker. Voor de eerste vier aandoeningen waren de risicoscores opgebouwd uit meer dan zes miljoen SNP’s, voor borstkanker uit ruim vijfduizend. De onderzoekers kwamen tot de bevinding dat hun polygenetische risicoscores zeker zo goed als de reeds bekende ‘monogenetische’ mutaties mensen kon aanwijzen met een verhoogd genetisch risico. ‘Deze resultaten laten zien dat via polygenetische risicoscores bij een aantal veelvoorkomende ziekten een substantieel groter deel van de bevolking met een normaal of verhoogd risico kan worden geïdentificeerd dan via zeldzame monogenetische mutaties,’ concluderen zij tevreden.

Het was, zoals gezegd, groot nieuws in alle media, maar de haken en ogen van het onderzoek kwamen wat minder aan bod.

In genoombrede associatiestudies zijn voor elk van deze ziekten niet meer dan enkele tientallen genen gevonden, dus waar halen deze onderzoekers zes miljoen SNP’s vandaan? Heel simpel: het waren vrijwel alle SNP’s die ze ter beschikking hadden. Ze gebruikten een nieuwe methode om de weging van SNP’s te optimaliseren en die methode gebruikt alle beschikbare SNP’s. Natuurlijk wisten ze niet wat al die zes miljoen SNP’s betekenen voor, zeg, coronaire hartziekten, zelfs niet of ze relevant zijn. Maar dat maakt niet uit. De niet-relevante SNP’s hebben een gewicht van bijna nul, van 0,000 000 001 bijvoorbeeld. Deze SNP’s hebben geen enkel effect op de schatting van het risico, maar ze zitten de modelleurs ook niet in de weg: vermenigvuldigen met nul levert nul.

De risicoschatting blijft gelijk met of zonder de SNP’s die er niet toe doen, maar voor consumenten maakt het wel een verschil. Als een test zegt op zes miljoen SNP’s gebaseerd te zijn, dan verwacht je dat die allemaal relevant zijn. Als er, zoals bij coronaire hartziekte, maar 74 relevante SNP’s gevonden zijn in genoombrede associatiestudies, dan is het niet alleen misleidend om te doen alsof de score gebaseerd is op zes miljoen SNP’s, het wekt ook de indruk dat de ziekte zeer sterk genetisch bepaald is, en dat heeft mogelijk een averechts effect op pogingen het risico te verlagen — hartziekte lijkt dan zeer sterk genetisch bepaald.

Daarnaast is het, om aan te tonen dat polygenetische risicoscores ziekten kunnen voorspellen, niet voldoende om vast te stellen dat er een verband met die ziekten. Sterker, de redenering is circulair: als de SNP’s geselecteerd zijn omdat ze geassocieerd zijn met ziekte, dan is de optelsom van al die SNP’s uiteraard ook geassocieerd. Het probleem bij zulke grote studies — deze telde 300 000 deelnemers — is bovendien dat er wel makkelijk statistisch significante resultaten uitkomen, maar dat die welbeschouwd heel weinig praktische betekenis hebben.

KUNNEN polygenetische risicoscores worden gebruikt om kenmerken als intelligente, agressiviteit en impulsiviteit te voorspellen? Een grote studie onder ruim 1 miljoen mensen vond maar liefst 1271 SNP’s die een rol zouden kunnen spelen bij de erfelijkheid van opleidingsniveau — dat daaraan niet alleen een maatschappelijke, maar ook een genetische component zit, is al langer de heersende opvatting.De onderzoekers gingen ongeveer op dezelfde manier te werk als die van Harvard. De analyse die vooral het nieuws haalde, was de vergelijking tussen de groepen met de meeste en met de minste ‘positieve’ SNP’s: in de groep met de beste SNP’s had 50 procent een universitaire graad, vergeleken met slechts 10 procent in de laagste groep.

De onderzoekers haastten zich te zeggen dat hun polygenetische risicoscore niet voorspelt, maar eigenlijk was hun test voorspellender dan die van Harvard. Dat komt omdat ze er een beperkte definitie van voorspellen op na houden: kan de test voor een individu opleidingsniveau voorspellen? Dat antwoord is uiteraard nee — dat kan geen enkele test.

Maar bekijk het eens van de andere kant: zou een schooldirecteur de prestatiecijfers van zijn school niet kunnen opkrikken door vooral kinderen aan te nemen uit de hogere echelons van zo’n polygenetische risicoverdeling, de kinderen met de beste SNP’s? Als de analyses kloppen, dan is dat niet onmogelijk. De directeur is immers niet geïnteresseerd in het succes van de individuele leerling, maar in een verschuiving van het gemiddelde.

Lee JJ, Wedow R, Okbay A, e.a. Gene discovery and polygenic prediction from a genome-wide association study of educational attainment in 1.1 million individuals. Nature Genetics 2018;50:1112–1121, PMID 30038396.

Diep weggestopt

De onderzoekers hadden overigens een aantal voor de praktijk belangrijke analyses wel uitgevoerd, maar diep weggestopt in het artikel.

Belangrijk is bijvoorbeeld de spreiding van de risico’s. Stel dat je te horen krijgt dat je op grond van je score 3 procent kans op hart- en vaatziekten hebt, is dat dan veel of weinig? Als iedereen in de bevolking rond de 3 procent kans heeft, dan heb je weinig aan die informatie: de score kan mensen die ziek gaan worden niet onderscheiden van degenen die niet ziek worden. Maar als een deel van de mensen een risico heeft minder dan 5 procent en een ander deel een risico hoger dan 50 procent, dan is een uitslag van 3 procent geruststellend: die had een stuk hoger kunnen zijn. De onderzoekers vonden qua hart- en vaatziekten wel enig onderscheid, maar dat kwam voor een flink deel omdat ze ook leeftijd als factor meenamen in hun voorspelling.

De onderzoekers benadrukken hoe sterk een risico verhoogd was, maar dit geeft een vertekend beeld. Er is een verschil tussen een verhoogd risico en een hoog risico. Een forse verhoging van een laag risico geeft nog steeds een betrekkelijk laag risico. Zelfs de mensen met het hoogste risico voor coronaire hartziekten hadden gemiddeld een risico van zo’n 11 procent. Dat betekent dat ze nog altijd 89 procent kans hadden om de ziekte niet te krijgen. Dat klinkt een stuk minder indrukwekkend.

Naast de spreiding is ook de nauwkeurigheid van de risicoschattingen belangrijk. Als de score aangeeft dat je 6 procent kans hebt om, zeg, binnen tien jaar een hartziekte te krijgen (de onderzoekers gaven hun risicoscores op een tiende nauwkeurig) is die kans dan werkelijk 6 procent? En niet 3 procent of 10 procent? De onderzoekers hadden hun scores ontwikkeld en getest in twee delen van dezelfde databank — vooral wat gezondere, welgestelde Britten. De nauwkeurigheid van risicoschattingen wordt pas echt op de proef gesteld als de scores worden onderzocht in een nieuwe, onafhankelijke dataset.

Maandag 17 juni spreekt Cecile Janssens bij Skeptics in the Pub in Amsterdam, 20.00 uur, Café De Doffer (Meetup)

Klinische relevantie

Maar waar het onderzoek met name tekortschoot, was bij de vraag naar de klinische relevantie. Allereerst de vraag of de polygenetische risicoscore beter voorspelt dan andere testen. Voor coronaire hartziekten zijn er voorspellingsmodellen die gebaseerd zijn op klinische risicofactoren. Voorspelt de polygenetische risicoscore beter, even goed, of slechter dan gewoon vragen naar gewicht, bloeddruk, eetgewoonten en misschien familiegeschiedenis? En wat gaan we doen met de hoogrisicogroep die we geïdentificeerd hebben? Wat moeten mensen die zo’n hoge score te horen hebben gekregen? De onderzoekers schrijven iets over een betere besteding van aandacht en middelen aan de mensen die er het meest van profiteren, maar veel verder komen ze niet.

De studie werd gepresenteerd met veel bombarie en ontvangen met groot enthousiasme, alsof dit het bewijs was waarop we zaten te wachten. Maar de irrelevantie van de analyses en de data zijn exemplarisch voor het onderzoek naar polygenetische risicoscores — of het nu gaat om hart- envaatziekten, overgewicht of intelligentie — en dat is iets waar we ons zorgen over moeten maken.

Voorlopig dragen de risicoscores nog erg weinig bij aan ons voorspellend vermogen, en wie pretendeert dat ze al wel zo ver zijn, helpt noch de wetenschap, noch de patiënt, noch de bezorgde burger vooruit. Wetenschappelijke borstklopperij draagt bij aan de hype, maar niet aan de oplossing.

Literatuur

Khera AV, Chaffin M, Aragam KG, e.a. Genome-wide polygenic scores for common diseases identify individuals with risk equivalent to monogenic mutations. Nature Genetics 2018;50:1219–1224, PMID 30104762.

Uit: Skepter 32.2 (2019)

Lees ook het interview met Cecile Janssens uit Skepter 31.2 (2018): Het risico van het genetisch risico

Vond u dit artikel interessant? Overweeg dan eens om Skepsis te steunen door donateur te worden of een abonnement op Skepter te nemen.

Steun Skepsis

Cecile Janssens is hoogleraar epidemiologie aan de Emory-universiteit in Atlanta.