Patiënten delen op online fora allerlei ervaringen over hun ziekte. Denk bijvoorbeeld aan ervaringen van bijwerkingen die ze hebben, dagelijkse obstakels of financiële zaken. The meest interessante ervaringen voor ons zijn degene die gaan over hoe mensen omgaan met deze problemen, omdat deze ervaringen direct een positieve impact zouden kunnen hebben op de kwaliteit van leven van andere patiënten.
Deze ervaringen zijn ook heel waardevol voor toekomstige klinisch onderzoek: Ze zouden kunnen leiden tot nieuwe inzichten of na verder onderzoek, zelfs tot nieuwe behandelingen.
Jammer genoeg worden deze ervaringen vaak ondergesneeuwd door nieuwe berichten en worden daarom niet opgemerkt door andere patiënten en onderzoekers. Het doel van mijn PhD is dan ook het automatisch terughalen van deze anekdotes om ze daarna te bundelen tot kennis. Deze kennis zou dan weer gebruikt kunnen worden als hypotheses voor verder onderzoek.
Er zijn nogal wat uitdagingen aan dit project en de grootste is wel dat computers taal niet kunnen begrijpen zoals mensen dat kunnen. Voor mensen is taal ‘zeg maar gewoon ons ding’. Wij kunnen ons niet eens voorstellen dat we taal niet zouden begrijpen op het niveau dat computers taal niet begrijpen. Voor computers, is het bijvoorbeeld niet intuïtief dat een spatie betekent dat een woord eindigt. Voor dit project hoeven we de computer gelukkig niet alles over taal te leren maar alleen in zoverre dat het de juiste informatie uit de tekst kan halen.
Een van de andere eerste uitdagingen is dat taal op fora vol met spelfouten en afkortingen zit. De eerste stap van mijn project is dan ook het “schoonmaken” van de data. Een tweede obstakel is dat niet alle berichten ervaringen zullen bevatten. We zullen dus na het schoonmaken een filter moeten ontwerpen om die berichten eruit te halen.
Hierna zullen we de medische concepten uit de relevante berichten gaan halen. Wat we vinden kunnen we dan vergelijken met wat er al bekend is. Hierdoor weten welk deel van de kennis op het forum nieuw is. Van deze nieuwe kennis willen we dan graag nog weten hoe betrouwbaar het is, maar hoe meten we deze betrouwbaarheid? Dat zal de laatste grote vraag worden van mijn project.
Uiteindelijk creëren we zo stap voor stap een automatisch systeem dat voor elk forum wat je erin stopt kan zeggen welke nieuwe kennis erin zit. Zo hopen we vooral voor zeldzame ziektes waar weinig geld is voor onderzoek de patiënten en zorg een handje te helpen.