Machine learning om ervaringen van patienten te vinden

Patiënten delen veel van hun ervaringen op fora. Om uiteindelijk de kennis te kunnen gebruiken die verstopt zit in deze ervaringen, moeten we wel eerst deze ervaringen eruit weten te halen. Om dat automatisch te kunnen doen, maken we gebruik van machine learning. Door het filteren automatisch te maken, wordt het mogelijk om het snel op elk forum toe te passen onafhankelijk van de grootte van het forum. Het maakt jammer genoeg nog wel uit in welke taal de berichten zijn geschreven.

Machine learning is als je de computer zelf uit laat vogelen of iets in categorie 1 (het is WEL een ervaring) of categorie 2 (het is NIET een ervaring) thuishoort. Om dit te kunnen doen heeft de computer wel een aantal voorbeelden nodig van beide categorieën. Dan kan het bijvoorbeeld onderzoeken welke woorden voorspellend zijn voor beide gevallen. Je kan de computer ook andere kenmerken van de data geven zoals blokken van 4 letters of meer abstracte kenmerken zoals hoe positief een forumbericht is. Als je dat doet dan kan de computer weer voor die kenmerken uitzoeken welke voorspellend zijn. Uiteindelijk gebruikt de computer alle woorden (of andere kenmerken) van een bepaalde zin om een conclusie te bereiken over of een zin wel of niet over een persoonlijk ervaring gaat. 

We ontdekte tijdens het maken van deze filter dat bepaalde soorten woorden gerelateerd zijn aan zinnen die WEL ervaringen bevatten, namelijk woorden die te maken hebben met : 

  • gezondheid zoals imatinib (een kankermedicijn) 
  • de eerste persoon zoals of my
  • de verleden tijd zoals was

De woorden zijn in dit geval in het Engels omdat het forum in het Engels is.

Woorden die voorspellend zijn voor zinnen zonder persoonlijke ervaringen zijn woorden die te maken hebben met: 

  • emotionele steun zoals pray
  • de tweede persoon zoals you
  • de toekomstige tijd zoals will

Dit laat zien dat patiënten vooral ervaringen delen die over zichzelf gaan (en niet over een familielid bijvoorbeeld) en over hun gezondheid. Ook laat het zien dat de rest van het forum dan juist vooral gaat over het geven van emotionele steun aan anderen. Dit zijn niet per se de enige kenmerken van berichten met en zonder ervaringen maar het zijn wel degene die het meest verschillend zijn tussen de twee categorieën. 

Dus hoeveel ervaringen worden er nou zoal gedeeld op een forum? Wij vonden dat ongeveer 37% van het Engelstalige GIST International Support Facebook forum waar wij naar keken bestond uit ervaringen. En waar gaan die ervaringen dan over? Wij vonden in dit specifieke forum dat ervaringen gingen over 14 verschillende onderwerpen: 

  1. Locatie van de tumor
  2. Emotionele omgang met de ziekte
  3. Duur van de behandeling
  4. Type scans (zoals PET of CT)
  5. De diagnose GIST krijgen
  6. Andere medicatie dan de eerstelijns medicatie (Imatinib)
  7. Bijwerkingen
  8. Operatie van een tumor 
  9. Niet terugkeren van de tumor
  10. Wel terugkregen van de tumor of het terugkeren naar werk of een eerder gebruikt medicijn
  11. Emotionele steun
  12. Dosering van medicatie
  13. Timing van de scans (bijv. na 6 maanden weer een scan)
  14. Het nemen van Imatinib pillen

Natuurlijk is dit pas de eerste stap. We willen verder gaan onderzoeken wat patiënten precies zeggen op het forum over deze onderwerpen zodat we met de kennis die daaruit komt uiteindelijk hypotheses kunnen leveren voor verder klinisch onderzoek. Blijf op de hoogte via dit blog! 


Dit onderzoek zal ik komend weekend presenteren op de European Conference for Information Retrieval in Keulen (14 April 2019).