Mining E-Markets

Een visie op de toekomst van data mining

 

Peter van der Putten

Marten den Uyl

Sentient Machine Research, Amsterdam

 

Data mining is de afgelopen vijf jaar definitief doorgebroken.  Het onderwerp wordt nog steeds omgeven met een magische hype in seminar land, privacy issues beheersen - terecht - de publieke opinie en de integratie in organisaties blijkt in de praktijk vaak een grotere klus dan gedacht. Desondanks moeten zelfs de grootste critici  toegeven dat het data mining proces, het schatgraven in data,  een onmisbare bedrijfsactiviteit is geworden voor veel bedrijven en overheidsinstellingen. Marketeers gebruiken het om klanten op te sporen, verzekeraars zetten het in om schade te voorspellen, doktoren benutten het om prognoses voor patienten vast te stellen en de politie profiteert er van om jacht te maken op haar  eigen 'klanten' .

Wat kan men de komende vijf jaar van data mining verwachten? Data mining zal in de toekomst op een wezenlijk andere manier toegepast gaan worden, omdat het meer en meer een gereedschap wordt voor een nieuwe groep gebruikers: klanten. In dit artikel zullen we een toekomstscenario schetsen voor data mining, met een nadruk op elektronische markten. Maar we starten met een terugblik.

 

De huidige populariteit van data mining

 

'You cannot predict the future without understanding the past' is het belangrijkste credo voor de data miner. Met hulp van intelligente patroonherkenningstechnieken ontdekt hij (of zij) interessante, belangrijke en nuttige brokjes kennis in grote hoeveelheden historische klantgegevens (zie [2], [3], [4] en de aan het eind genoemde websites voor een introductie). Om wat te kunnen zeggen over toekomstige ontwikkelingen zullen we, met dit credo in het achterhoofd, eerst proberen de historische ontwikkeling van data mining te beschrijven.


Voorafgaand aan de doorbraak van data mining werd in elk bedrijf al gebruik gemaakt van data analyse. Dit was meestal beperkt tot een kleine groep statistische onderzoekers die als stafmedewerkers analyses maakten voor het hogere management. Op zich zijn de meeste data mining technieken ook niet nieuw, maar bestaan al sinds de jaren tachtig of eerder. De doorbraak bestond vooral uit het feit dat de grote groep kenniswerkers, management en marketeers zelf in staat werden gesteld gegevens te analyseren, om grip te krijgen op klantbehoeftes en klantgedrag (zie figuur 1). De toenemende vraag naar een individuele klantbenadering en faciliterende trends als een betere centrale gegevensverzameling, snellere computers en goedkopere software tools speelden hierbij een belangrijke rol.


Als we deze trend consequent doorzetten ligt het voor de hand te voorspellen wat er de komende jaren principieel gaat veranderen aan de toepassing van data mining: het wordt een instrument voor de klant. Een instrument om zelf de behoefte te kunnen bepalen, het juiste productaanbod bij de vraag te zoeken, de beste winkelier te selecteren en te onderhandelen over prijs en productspecificaties.  Hoe zal een dergelijke elektronische markt (kort: e-markets) er over vijf jaar in de praktijk uitzien? Zijn daar anno 2001 al eenvoudige voorbeelden van te vinden? Hoe wordt data mining dan concreet ingezet voor bovenstaande stappen, zowel nu als later?

 


E-markets anno nu

 


Huidige voorbeelden van e-markets zijn bijvoorbeeld consumenten markten voor banen (www.zoomnet.nl), huizen (www.nvm.nl), occasion auto's en oldtimers (auto.telegraaf.nl) of ski-vakanties (www.ski-europe.com). Sterk in opkomst zijn de business-to-business gerichte sites voor bijvoorbeeld freelancers (www.hotheads.net), halfgeleiders (www.fastparts.com), landbouwproducten (www.rooster.com), auto onderdelen (us.covisint.com), technologie patenten (www.yet2.com) of transportladingen (www.teleship.nl; www.shippingworldonline.nl).

Een e-market deelt een aantal typerende kenmerken met markten in de echte wereld. Zo kunnen zowel meerdere aanbieders en meerdere vragers een plek hebben op de markt. Er kan een type product of meerdere typen producten aangeboden worden, maar een markt richt zich meestal wel op een bepaald thema of doelgroep. Data mining kan een belangrijke rol spelen bij alle stappen in het koopproces (zie figuur 2, vrij naar [1]), in de huidige e-markets wordt het nog met name ingezet voor product- en aanbieder selectie.

 

Vinden van de beste producten en aanbieders

 

Een veel gebruikte data mining techniek voor het zoeken naar het juiste product van de juiste aanbieder is patroon matching. Een klant beschrijft de kenmerken van de ideale baan, auto, freelancer, vakantie aangevuld met wensen met betrekking tot de aanbieders (service, leveringstijd etc.). De matchengine zoekt daarna die aanbiedingen die het best passen bij het wensprofiel. Voordeel: de klant krijgt altijd antwoord en hoeft zich niet bezig te houden met de vraag of zijn of haar wensen wel realistisch zijn (zie figuur 3).

Er zijn ook markten waarbij het zoeken op uniforme productkenmerken tekort schiet. Neem bijvoorbeeld een doe het zelf warenhuis dat honderden verschillende soorten producten aanbiedt, van spijkers tot hamers. Een spijker heeft compleet andere productkenmerken en vereist dus andere zoekcriteria dan een hamer. Ook al beperkt een markt zich tot een soort product, dan kan het matchen op productkenmerken nog steeds beperkt nut hebben. Op een boeken of cd markt bijvoorbeeld heeft hoogstens 'hard' zoeken kenmerken als auteur of titel enige zin.


Een oplossing hiervoor is om niet te matchen op productkenmerken, maar op koopgedrag (ook: collaborative filtering). In figuur 4 wordt een voorbeeld van een cd markt beschreven. Een lener geeft drie favoriete artiesten op. De aanbevelingsengine gaat op zoek naar leners die het best passen bij dit leenprofiel en adviseert artiesten die populair zijn binnen deze groep. Het paradoxale aan deze aanpak is dat de engine advies geeft over artiesten, zonder dat er kenmerken van deze artiesten (zoals muziekgenre) bekend zijn!

 


E-Markets anno 2005: Intelligent agents en privacy

 

Volgens een rapport van Forrester Research zal de Europese handel via Internet marktplaatsen over vier jaar 900 miljard Euro bedragen. Zes procent van alle b-to-b transacties zullen dan gaan via deze e-markets. De drie grootste marktsegmenten zullen bestaan uit de automobiel-, transport- en elektronica-industrie.

Data mining technologie zal in de toekomst alle stappen in het e-markets koopproces ondersteunen. Als voorbeeld kan de onderhandel stap dienen. Stel, een klant heeft met behulp van matching een preselectie gemaakt van tien interessante aanbiedingen op een banensite. Met behulp van data mining voorspellingstechnieken kan bijvoorbeeld voorspeld worden wat een redelijk salaris is voor de gevonden banen, c.q. of het geboden salaris marktconform is of daarvan afwijkt. De specifieke achtergrond en de wensen van de werkzoekende kan hierbij meegenomen worden; een werkgever kan natuurlijk eenzelfde analyse maken.

Het valt te verwachten dat op e-markets van de toekomst intelligent agents de klant zullen helpen bij het zoek-, selecteer en onderhandel werk. Namens de klant zullen deze assistenten interessante product- cq behoefte ideeën genereren (stap 1 in figuur 2) en gaan onderhandelen met de best matchende aanbieders met de best matchende producten om tot shortlists te komen waaruit de klant een keuze kan maken (stap 2,3,4). Als de koop gesloten is en het product gebruikt wordt geeft de agent meldingen van service momenten en slaat de ervaringen met het product op (stap 5 en 6). Naarmate meer en meer koopprocessen doorlopen zijn, leert de agent zijn 'baasje' steeds beter kennen. Ook bij dit 'meta' leergedrag zal data mining, als intelligente methode om kennis uit data te destilleren, een belangrijke rol spelen.

Belangrijke succesfactor van dit soort 'agent-mediated e-markets' is natuurlijk de bescherming van de privacy. De kennis die een agent vergaart dient geen eigen leven te gaan leiden op de e-market en de anonimiteit dient alleen prijsgegeven te worden indien dit noodzakelijk is voor het uitvoeren van de stap in het koopproces (grofweg alleen stap 5). De Registratiekamer, de waakhond van privacy, is samen met Sentient Machine Research en een aantal andere internationale partijen het PISA project begonnen, waarbinnen technologie standaarden voor 'privacy-proof' agent-mediated e-markets ontwikkeld worden (zie www.tno.nl/instit/fel/pisa/).

 

Power to the Customers!

 

Om samen te vatten: data mining technologie zal een nieuwe groep gebruikers krijgen, n.l. klanten.  E-markets zijn hier een treffend voorbeeld van. Er is sprake van veel synergie tussen e-markets, data mining en gerelateerde ontwikkelingen zoals intelligent agents. Maar ook meer 'traditionele' ict toepassingen als customer relationship management, business intelligence en enterprise resource planning zullen profiteren van een meer klant-gestuurde inzet van data mining. Allemaal leidend tot hetzelfde resultaat: de klant aan de macht!

 

Auteurs

 

Drs. Peter W.H. van der Putten is senior consultant bij Sentient Machine Research te Amsterdam. Hij adviseert diverse klanten over het toepassen van intelligente data mining technologie voor customer relationship management, e-markets en multimedia. Hij heeft  cognitieve kunstmatige intelligentie gestudeerd aan de Universiteit van Utrecht en is mede verbonden aan het Leiden Institute of Advanced Computer Science, waar hij werkt aan een promotieonderzoek op het gebied van data mining.

 

Drs. Marten J. den Uyl (denuyl@smr.nl) is cognitief psycholoog, oprichter en directeur van Sentient Machine Research. Voor meer infomatie: http://www.smr.nl.

 

Verwijzingen

 

[1]        Rob Guttman en Pattie Maes. Agent Mediated Integrative Negotiation for Retail Electronic Commerce. Proceedings of the Workshop on Agent Mediated Electronic Trading (AMET'98), Minneapolis, Minnesota, April 9, 1998.

 

[2]        P van der Putten(1999). Datamining in Bedrijf. Informatie en Informatiebeleid 17:3, November 1999.

 

[3]        P. van der Putten and J. Kok. (1999). Aan de slag met datamining. Praktijkgids Bedrijfsinformatiesystemen. Wolters Kluwer Ten Hagen Stam, The Hague, April 1999.

 

[4]        Rudi van Lent en Damiaan Zwietering. Data mining in Balans. IT Monitor, ?

 

Voor een verzameling wetenschappelijke en populaire artikelen over data mining zie www.liacs.nl/~putten. Het belangrijkste onafhankelijke data mining portal is  www.kdnuggets.com.