Passionned Group™

Verhoog de hits op je datawarehouse met Google

Datawarehouses bevatten doorgaans behoorlijk veel content. Laten we er voor het gemak vanuit gaan dat veel van deze content relevant is (op een bepaald moment) en betrouwbaar. Dat is vaak (nog) niet zo, maar okay, we willen hier een ander probleem aansnijden, namelijk dat de gebruiker informatie niet kan vinden en deze wel in de goede kwaliteit beschikbaar is. Google kan dan (als geen ander) uitkomst bieden want dat is nu net wat de zoekmachine goed kan. In dit artikel presenteren we een checklist en tonen we aan hoe je winst kan behalen door Google aan te sluiten op je datawarehouse.

Open inhoudsopgave

Raadpleeg de checklist

Checklist: nagaan waar het aan kan liggen

Ik ben voor mezelf eens nagegaan waar dat aan zou kunnen liggen en heb een voorlopig lijstje samengesteld:

Google begrijpt onze enorme honger naar informatie

Google heeft als geen ander begrepen hoe wij mensen willen omgaan met onze enorme honger naar goede informatie. Het bedrijf biedt bedieningsgemak, snelle resultaten en excellente guidance (help, suggesties, alternatieven; spelfouten automatisch corrigeren). Zoeken met Google vind ik persoonlijk een prettige ervaring.

Voor de eerste twee en de laatste uit bovenstaand lijstje kan Google niet heel veel betekenen. Maar voor de overige vier wel.

Sluit Google rechtstreeks aan op je datawarehouse

Ik wil hier een pleidooi houden om Google ‘rechtstreeks’ aan te sluiten op je datawarehouse en business intelligence systeem. Dat kan op rapportniveau (document), per grafiek of tabel, of wellicht zelfs per feit. Hoe meer gedetailleerde informatie Google kan ontsluiten, des te beter de resultaten zullen kunnen zijn. Bovendien, tegenwoordig kunnen veel van de betere (enterprise) BI tools prima omgaan met wat Google vraagt. Ik kom alleen weinig implementaties tegen waar die functionaliteit wordt toegepast en dat is best jammer.

Bezoekersaantallen zullen stijgen

Je zal verbaasd staan te kijken dat de bezoekersaantallen van je datawarehouse sterk stijgen, evenals het aantal hits. Metadata wordt dan belangrijker dan ooit, anders kunnen we een aantal belangrijke technieken en principes voor search engine optimization niet toepassen. Denk dan aan: keywords, description en title. Maar ook in het datawarehouse zelf zullen wij moeten zorgen voor de juiste tags bij elk record en attribuut, zowel op detailniveau als op geaggregeerd niveau (hier zijn scripts voor te bedenken).

Welke winst kun je hiermee behalen?

Je vraagt je misschien af wat hiervan de winst zou kunnen zijn? Een paar voorbeelden kunnen dat verduidelijken.

Het grote voordeel is dat de gebruiker niet hoeft in te loggen in een systeem; bijna nooit meer lang hoeft te wachten op antwoord; hij wordt geholpen bij zijn zoektocht naar relevante informatie van dat moment; hij krijgt alternatieven voorgeschoteld; en externe en interne stuurinformatie kan worden gecombineerd.

Via natuurlijke taal vragen stellen aan computers

De complexiteit om Google aan te sluiten op het datawarehouse ligt niet zozeer meer in het feit dat Google je vraag wel moet kunnen begrijpen. Uiteraard is natuurlijke taal een fenomeen dat zich niet zomaar laat vangen in een structuur, maar inmiddels is er al zoveel onderzoek naar gedaan dat het een kwestie van tijd lijkt dat we via natuurlijke taal redelijk goed vragen kunnen stellen aan computers. Een goed voorbeeld hiervan is ThoughtSpot Business Intelligence.

Waar ligt nog een hele grote uitdaging?

Waar volgens mij nog een hele grote uitdaging ligt is om ‘alle’ informatie in het datawarehouse om te zetten naar geïndexeerde webpagina’s met afbeeldingen. Deze webpagina’s moeten onderling sterk aan elkaar worden gelinkt, netjes worden opgemaakt, eigenlijk net zoals het goed gebruik is dat te doen op ‘normale’ webpagina’s. Hierdoor kan de gebruiker direct op de pagina doorklikken naar gerelateerde zaken en zich snel laten informeren. We willen de gebruiker immers goed kunnen bedienen op de datawarehouse website.

Blijven we aanmodderen met pixel-perfect rapporten?

De grote vraag is: gaat de markt deze kant op? Of blijven we aanmodderen met het pixel-perfect bouwen van inflexibele rapportjes en starre dashboards. De tijd zal het moeten uitwijzen, maar de dynamiek kan wel eens zo groot worden dat alleen gebruiksgemak en snelheid ons kan redden.