Social data: bagger of goud?

Social media content met name nutteloze prietpraat? Vast staat dat het reuze interessant voor velen is, blijkens de populariteit hiervan. Maar, hoe waardevol is deze informatie voor bedrijven?

Dit ondervinden is het doel van de Customer Intelligence case die Xomnia in samenwerking met Active Professionals uitgevoerd heeft bij Travix, het moederbedrijf van o.a. Cheaptickets.nl. Welke waarde heeft social data in potentie voor deze en andere organisaties?

Stap 1: Informatie verkrijgen

Deze zoektocht bestaat uit meerdere stappen. Allereerst de basis, die bestaat uit het verrijken van de interne klantendatabase met persoonlijke (social) kenmerken. Deze klantkarakteristieken worden inzichtelijk via ‘social profiling’. De uitdaging: social media data is vaak niet direct bruikbaar. Bagger?! Het voornaamste probleem: het is veelal ongestructureerde tekst. Hoe waardevolle informatie uit deze profielinformatie te halen?

Stap 2: Opschonen

‘Opschonen’ is het antwoord. Hierbij worden twee technieken toegepast: text mining en entity recognition. Bij de eerste wordt gekeken of de content aan een aantal vooraf gedefinieerde regels voldoet. Dit levert binaire labels op: iets voldoet wel, of iets voldoet niet aan een bepaalde regel.

Bij de tweede worden er automatisch woorden of combinaties in de tekst herkend die een extra betekenis hebben. Dit kunnen entiteiten (lees: ‘dingen’) zijn als “Vrije Universiteit” of “Amsterdam”, maar ook gebeurtenissen of bijvoorbeeld bedragen.

Uiteindelijk resulteert dit in een ‘schone’ lijst aan kenmerken per individuele klant

Stap 3: Clusteren

Als de hoeveelheid klanten in een klantendatabase groot wordt, dan valt er niet meer te redeneren in losse klanten. Bovendien wordt dat alleen maar lastiger naarmate de data (het aantal kenmerken) per klant toeneemt. Om dit te overkomen worden klanten samengevoegd in bepaalde groepen, ofwel geclusterd. In het geval van Cheaptickets.nl heb je het dan over bijvoorbeeld “Nederlandse studenten” tegenover “Buitenlandse studenten”. Segmentatie herleidt uit salesniveau, bijvoorbeeld van klanten die wel of geen extra verzekering afsluiten bij het boeken van een vliegticket, is uiteraard ook mogelijk.

Deze clustering wordt voornamelijk gedaan op de binaire labels van de text mining stap. Deze groepen kunnen zelf dan weer een label vormen. Nieuwe klanten worden dan op basis van gelijkenis met die kenmerken gecategoriseerd.

Stap 4: Voorspellen

Als we deze clusters hebben, dan wordt het spannend. Voorspellen bij welke cluster een (potentiële) klant hoort en overeenkomstig wat het gedrag van dat specifieke cluster (en dus de klant) zal zijn. Is dat bekend dan wordt het bijvoorbeeld mogelijk de klant specifieker te bedienen naar zijn behoeften en gerichter marketingacties uit te zetten. Resulterend in een hogere conversie tegen lagere kosten en – niet onbelangrijk – een prettiger klantervaring. Goud?!

Conclusie

Uit deze case blijkt dat (met 28% meer zekerheid dan kans) te voorspellen is of een klant behoefte heeft aan een specifieke verzekering. Deze verzekering al dan niet (nadrukkelijk) meenemen in het transactieproces bij de aanschaf van een vliegticket zou dan een logische opvolging kunnen zijn. Het is te vroeg om de ‘business implications’ vast te stellen maar een minimale groei in conversie vertaalt zich bij een organisatie met de omvang als Cheaptickets.nl al snel in tonnen aan extra omzet (per maand!).

Deze pilot heeft aangetoond dat er legio mogelijkheden zijn voor het gebruik van social media data. Alhoewel het idee simpel is, blijkt het ‘minen’ van de (social) data – zodanig dat analyse mogelijk is – een flinke uitdaging.

De case zal gebruikt worden als demo op een aantal upcoming events, waaronder met Big Arena op het Business Analytics event 9 oktober aanstaande.