Mining E-Markets
Een visie op de toekomst van data mining
Peter van der
Putten
Marten den Uyl
Sentient Machine
Research, Amsterdam
Data mining is
de afgelopen vijf jaar definitief doorgebroken. Het onderwerp wordt nog steeds omgeven met een magische hype in
seminar land, privacy issues beheersen - terecht - de publieke opinie en de
integratie in organisaties blijkt in de praktijk vaak een grotere klus dan
gedacht. Desondanks moeten zelfs de grootste critici toegeven dat het data mining proces, het schatgraven in
data, een onmisbare bedrijfsactiviteit
is geworden voor veel bedrijven en overheidsinstellingen. Marketeers gebruiken
het om klanten op te sporen, verzekeraars zetten het in om schade te
voorspellen, doktoren benutten het om prognoses voor patienten vast te stellen
en de politie profiteert er van om jacht te maken op haar eigen 'klanten' .
Wat kan men de
komende vijf jaar van data mining verwachten? Data mining zal in de toekomst op
een wezenlijk andere manier toegepast gaan worden, omdat het meer en meer een
gereedschap wordt voor een nieuwe groep gebruikers: klanten. In dit artikel
zullen we een toekomstscenario schetsen voor data mining, met een nadruk op
elektronische markten. Maar we starten met een terugblik.
De huidige
populariteit van data mining
'You cannot
predict the future without understanding the past' is het belangrijkste credo
voor de data miner. Met hulp van intelligente patroonherkenningstechnieken
ontdekt hij (of zij) interessante, belangrijke en nuttige brokjes kennis in
grote hoeveelheden historische klantgegevens (zie [2], [3], [4] en de aan het
eind genoemde websites voor een introductie). Om wat te kunnen zeggen over
toekomstige ontwikkelingen zullen we, met dit credo in het achterhoofd, eerst
proberen de historische ontwikkeling van data mining te beschrijven.
Voorafgaand aan de doorbraak van
data mining werd in elk bedrijf al gebruik gemaakt van data analyse. Dit was
meestal beperkt tot een kleine groep statistische onderzoekers die als
stafmedewerkers analyses maakten voor het hogere management. Op zich zijn de
meeste data mining technieken ook niet nieuw, maar bestaan al sinds de jaren
tachtig of eerder. De doorbraak bestond vooral uit het feit dat de grote groep
kenniswerkers, management en marketeers zelf in staat werden gesteld gegevens
te analyseren, om grip te krijgen op klantbehoeftes en klantgedrag (zie figuur
1). De toenemende vraag naar een individuele klantbenadering en faciliterende
trends als een betere centrale gegevensverzameling, snellere computers en goedkopere
software tools speelden hierbij een belangrijke rol.
Als we deze trend consequent
doorzetten ligt het voor de hand te voorspellen wat er de komende jaren
principieel gaat veranderen aan de toepassing van data mining: het wordt een
instrument voor de klant. Een instrument om zelf de behoefte te kunnen bepalen,
het juiste productaanbod bij de vraag te zoeken, de beste winkelier te
selecteren en te onderhandelen over prijs en productspecificaties. Hoe zal een dergelijke elektronische markt
(kort: e-markets) er over vijf jaar in de praktijk uitzien? Zijn daar anno 2001
al eenvoudige voorbeelden van te vinden? Hoe wordt data mining dan concreet
ingezet voor bovenstaande stappen, zowel nu als later?
E-markets anno
nu
Huidige voorbeelden van e-markets zijn
bijvoorbeeld consumenten markten voor banen (www.zoomnet.nl), huizen
(www.nvm.nl), occasion auto's en oldtimers (auto.telegraaf.nl) of ski-vakanties
(www.ski-europe.com). Sterk in opkomst zijn de business-to-business gerichte
sites voor bijvoorbeeld freelancers (www.hotheads.net), halfgeleiders (www.fastparts.com),
landbouwproducten (www.rooster.com), auto onderdelen (us.covisint.com),
technologie patenten (www.yet2.com) of transportladingen (www.teleship.nl;
www.shippingworldonline.nl).
Een e-market deelt
een aantal typerende kenmerken met markten in de echte wereld. Zo kunnen zowel
meerdere aanbieders en meerdere vragers een plek hebben op de markt. Er kan een
type product of meerdere typen producten aangeboden worden, maar een markt
richt zich meestal wel op een bepaald thema of doelgroep. Data mining kan een
belangrijke rol spelen bij alle stappen in het koopproces (zie figuur 2, vrij
naar [1]), in de huidige e-markets wordt het nog met name ingezet voor product-
en aanbieder selectie.
Vinden van de
beste producten en aanbieders
Een veel
gebruikte data mining techniek voor het zoeken naar het juiste product van de
juiste aanbieder is patroon matching. Een klant beschrijft de kenmerken van de
ideale baan, auto, freelancer, vakantie aangevuld met wensen met betrekking tot
de aanbieders (service, leveringstijd etc.). De matchengine zoekt daarna die
aanbiedingen die het best passen bij het wensprofiel. Voordeel: de klant krijgt
altijd antwoord en hoeft zich niet bezig te houden met de vraag of zijn of haar
wensen wel realistisch zijn (zie figuur 3).
Er zijn ook
markten waarbij het zoeken op uniforme productkenmerken tekort schiet. Neem
bijvoorbeeld een doe het zelf warenhuis dat honderden verschillende soorten
producten aanbiedt, van spijkers tot hamers. Een spijker heeft compleet andere
productkenmerken en vereist dus andere zoekcriteria dan een hamer. Ook al
beperkt een markt zich tot een soort product, dan kan het matchen op
productkenmerken nog steeds beperkt nut hebben. Op een boeken of cd markt bijvoorbeeld
heeft hoogstens 'hard' zoeken kenmerken als auteur of titel enige zin.
Een oplossing hiervoor is om niet te
matchen op productkenmerken, maar op koopgedrag (ook: collaborative filtering).
In figuur 4 wordt een voorbeeld van een cd markt beschreven. Een lener geeft
drie favoriete artiesten op. De aanbevelingsengine gaat op zoek naar leners die
het best passen bij dit leenprofiel en adviseert artiesten die populair zijn
binnen deze groep. Het paradoxale aan deze aanpak is dat de engine advies geeft
over artiesten, zonder dat er kenmerken van deze artiesten (zoals muziekgenre)
bekend zijn!
E-Markets anno
2005: Intelligent agents en privacy
Volgens een rapport van Forrester
Research zal de Europese handel via Internet marktplaatsen over vier jaar 900 miljard Euro bedragen. Zes procent van
alle b-to-b transacties zullen dan gaan via deze e-markets. De drie grootste
marktsegmenten zullen bestaan uit de automobiel-, transport- en
elektronica-industrie.
Data mining
technologie zal in de toekomst alle stappen in het e-markets koopproces
ondersteunen. Als voorbeeld kan de onderhandel stap dienen. Stel, een klant
heeft met behulp van matching een preselectie gemaakt van tien interessante
aanbiedingen op een banensite. Met behulp van data mining voorspellingstechnieken
kan bijvoorbeeld voorspeld worden wat een redelijk salaris is voor de gevonden
banen, c.q. of het geboden salaris marktconform is of daarvan afwijkt. De
specifieke achtergrond en de wensen van de werkzoekende kan hierbij meegenomen
worden; een werkgever kan natuurlijk eenzelfde analyse maken.
Het valt te
verwachten dat op e-markets van de toekomst intelligent agents de klant zullen
helpen bij het zoek-, selecteer en onderhandel werk. Namens de klant zullen
deze assistenten interessante product- cq behoefte ideeën genereren (stap 1 in figuur 2) en gaan
onderhandelen met de best matchende aanbieders met de best matchende producten
om tot shortlists te komen waaruit de klant een keuze kan maken (stap 2,3,4).
Als de koop gesloten is en het product gebruikt wordt geeft de agent meldingen
van service momenten en slaat de ervaringen met het product op (stap 5 en 6).
Naarmate meer en meer koopprocessen doorlopen zijn, leert de agent zijn
'baasje' steeds beter kennen. Ook bij dit 'meta' leergedrag zal data mining,
als intelligente methode om kennis uit data te destilleren, een belangrijke rol
spelen.
Belangrijke
succesfactor van dit soort 'agent-mediated e-markets' is natuurlijk de
bescherming van de privacy. De kennis die een agent vergaart dient geen eigen
leven te gaan leiden op de e-market en de anonimiteit dient alleen prijsgegeven
te worden indien dit noodzakelijk is voor het uitvoeren van de stap in het
koopproces (grofweg alleen stap 5). De Registratiekamer, de waakhond van
privacy, is samen met Sentient Machine Research en een aantal andere
internationale partijen het PISA project begonnen, waarbinnen technologie
standaarden voor 'privacy-proof' agent-mediated e-markets ontwikkeld worden
(zie www.tno.nl/instit/fel/pisa/).
Power to the
Customers!
Om samen te
vatten: data mining technologie zal een nieuwe groep gebruikers krijgen, n.l.
klanten. E-markets zijn hier een
treffend voorbeeld van. Er is sprake van veel synergie tussen e-markets, data
mining en gerelateerde ontwikkelingen zoals intelligent agents. Maar ook meer
'traditionele' ict toepassingen als customer relationship management, business
intelligence en enterprise resource planning zullen profiteren van een meer
klant-gestuurde inzet van data mining. Allemaal leidend tot hetzelfde resultaat:
de klant aan de macht!
Auteurs
Drs. Peter W.H.
van der Putten is senior consultant bij Sentient Machine Research te Amsterdam.
Hij adviseert diverse klanten over het toepassen van intelligente data mining
technologie voor customer relationship management, e-markets en multimedia. Hij
heeft cognitieve kunstmatige
intelligentie gestudeerd aan de Universiteit van Utrecht en is mede verbonden
aan het Leiden Institute of Advanced Computer Science, waar hij werkt aan een
promotieonderzoek op het gebied van data mining.
Drs. Marten J.
den Uyl (denuyl@smr.nl) is cognitief
psycholoog, oprichter en directeur van Sentient Machine Research. Voor meer
infomatie: http://www.smr.nl.
Verwijzingen
[1] Rob Guttman en Pattie Maes. Agent
Mediated Integrative Negotiation for Retail Electronic Commerce. Proceedings of
the Workshop on Agent Mediated Electronic Trading (AMET'98), Minneapolis,
Minnesota, April 9, 1998.
[2] P van der Putten(1999).
Datamining in Bedrijf. Informatie en Informatiebeleid 17:3, November 1999.
[3] P. van der Putten and J.
Kok. (1999). Aan de slag met datamining. Praktijkgids
Bedrijfsinformatiesystemen. Wolters Kluwer Ten Hagen Stam, The Hague, April
1999.
[4] Rudi van Lent en Damiaan Zwietering.
Data mining in Balans. IT Monitor, ?
Voor een
verzameling wetenschappelijke en populaire artikelen over data mining zie www.liacs.nl/~putten. Het belangrijkste
onafhankelijke data mining portal is www.kdnuggets.com.