Tross all markskrikersk reklame: Datavarehus er ikke noe tull som vil bli borte iovermorgen. Det er en strålende idé, men som du vet - ingenting er enkelt og ingenting er gratis.
nn Datavarehus er en ny måte for å samle vårt datagrunnlag og generere rapporter fra dem. En ny mulighet for å utnytte våre kostbare data. Er vi riktig flinke, kan vi avlese trender som ligger i datagrunnlaget, men som er skjult fordi vi ikke ser trærne for bare skog. Slike varehus har to særtrekk:
n En separat database for beslutningsstøtte blir opprettet. Det er denne som blir kalt datavarehuset. Poenget er at det er risikabelt å slippe mange spørrelystne sluttbrukere til på produksjonsdata. Risikoen ligger dels i at data kan bli ødelagt dels i at produksjonssystemenes fart kan bli kraftig senket av de mange, ofte komplekse spørsmål. Derfor må produksjons- og beslutningsstøtte-data skilles at.
n Sluttbrukerne får direkte tilgang til datavarehuset med kraftige, grafiske søkehjelpemidler. De kan vandre med sin lille handlevogn langs hyllene som er fylt med data og plukke det de har bruk for, omtrent som på Rimi. Ut fra de data de har funnet frem til kan de gå på jakt etter nye, på "iterativ" manér. For at dette skal være mulig må data i varehuset være tilrettelagt for spørring ved at de er koblet sammen langs flere akser, og for å tilfredsstille ulike brukergrupper blir det skapt mange ulike "vyer" inn i datamengden. Ledere har andre behov enn statistikerne, kunnskapsarbeiderne og kontorpersonalet.
nn Som sagt: ideen er storartet. Jeg tror ikke at store selskaper vil klare seg uten datavarehus. Årsaken er at den eneste konkurransefordelen en stor bedrift kan ha mot små, kjappe nykommere i det lange løp er evnen å lære raskere og utnytte sine kunnskaper bedre. Winston Churchill sa at en nasjon som ikke forstår sin historie vil heller ikke kunne forutsi om sin fremtid. Det samme gjelder bedrifter. Derfor skal datavarehus være fulle av historiske data. Produksjonssystemene skal være rettet mot nåtiden: Hva er saldoen akkurat nå? Datavarehus skal vise hvordan kundene og produktene har oppført seg i de siste årene. Dette setter oss i stand til å forstå kundene bedre, gjette deres beveggrunner - og dermed hva de sannsynligvis kommer til å gjøre i fremtiden. Kunder som har latt være å flytte sine sparepenger fra en bank tross flere rentekutt, kommer høyst sannsynlig til å forbli kunder. Dette er essensiell kunnskap når man skal segmentere markedet og planlegge sine fremstøt.
nn Det finnes en fordel og en ulempe med historiske data. Fordelen er at de ikke skal oppdateres. Ulempen er at de kan vokse uten grenser. Derfor blir datavarehus ganske svære. Kombinerer vi noen års historikk med mange vyer inn i datamassen og med skreddersydde, summariserte bilder beregnet på ulike brukergrupper, opplever vi volumeksplosjonen. I motsetning til "normaliserte" databaser blir de samme data lagret flere ganger for å gjøre spørringen raskest mulig. 20 megabyte av levende data i et produksjonssystem kan bli til 1.000 megabyte i et datavarehus. Svære datamengder skaper en ny, uventet flaskehals: Å laste varehuset med data kan ta for lang tid. Mange store selskaper har bare noen få timer om natten når deres systemer ikke er i bruk. Timene kan bli for få hvis hele datavarehuset skal bygges opp på nytt. Derfor er det blitt populært med såkalte "delta change" verktøy som oppdaterer varehuset bare med det som er nytt istedenfor å pakke om alle hyllene.
nn Tekniske utfordringer finnes det mange av. Et viktigere spørsmål er likevel dette: Hva skal varehuset inneholde og har vi gode nok data å legge dit? I de fleste store selskaper er svaret et rungende nei! Poenget med et datavarehus er å se sammenhenger i datamengden, og det betyr at data skal hentes fra flere produksjonssystemer. Og da oppdager vi harmoniseringsproblemet. Data om de samme subjekter, f.eks. kunder, er uttrykt på forskjellige måter i de ulike systemene. Begrepene er ikke ensartet, behandlingsreglene varierer, saneringsrutinene er ulike, osv. Da blir spørsmålet: Hvilke data er de riktige? Dette er ikke først og fremst et teknisk spørsmål. Organisasjonsenheter kan tørne sammen her. Markedsavdelingen vil ikke bruke finansavdelingens data, finans vil ikke stole på marketings data. Og da forsvinner poenget med ideen.
nn I dag er datavarehus blitt den magiske sølvkulen og svaret på utallige uløste problemer. Ett slikt problem er at bedriften har gamle datasystemer og derav følgende dårlig datakvalitet eller hull. Et datavarehus kan ikke skape gode data ut av dårlige, like lite som vi kan lage en silkepung av svineører. Et datavarehus kan heller ikke gjøre det mulig for de ansatte å ta desentraliserte beslutninger. Vil man det, må man gjøre noe med organisasjonen. Et datavarehus kan ikke integrere systemene bedre. Datavarehuset kan ikke tilby annet enn å gi sluttbrukerne raskere og enklere tilgang til de data som allerede er samlet inn, uten å ødelegge for produksjonssystemene og uten å øke arbeidsbelastningen på IT-avdelingen altfor mye.
nn Hvordan skal vi gripe saken an? Å lage det altomfattende varehuset er en dårlig idé fordi det ikke står i menneskelig makt. Å bygge opp varehus for de ulike funksjoner og koble dem sammen etterpå er en like dårlig idé. Det eneste som nytter er å identifisere de store, tverrgående prosessene i bedriften, og ta tak i dem en for en. La datavarehuset bli en applikasjon som "abonnerer" på hendelser når de oppstår ("blir publisert") i de produksjonssystemene som utgjør deler av prosessen.
Du treffer meg på hidas@oslonett.no