Hvad er datakvalitet, og hvordan opnår man god datakvalitet?
Hvad er datakvalitet – og hvad er god datakvalitet?
Datakvalitet handler i korte træk om, hvor godt data opfylder deres formål. God datakvalitet vil altså sige, at dataene afspejler virkeligheden, at ingen vigtige oplysninger mangler, at de er konsistente og stemmer overens på tværs af systemer, og at de er opdaterede, så de er aktuelle og relevante. Samtidig skal dataene overholde gældende standarder, lovgivning og interne krav. God datakvalitet behøver ikke at være kompliceret, men det kan blive en udfordrende opgave, hvis ikke man har en systematiseret tilgang til, hvordan man håndterer data i sin organisation.
I større organisationer, specielt kommuner, kan data være fordelt på rigtig mange systemer – nogle af dem flere årtier gamle. Derudover sker det ofte, at de samme data er registreret og opbevaret flere steder.
Et eksempel på det kan være en medarbejders telefonnummer. Telefonnumre plejer at være tilgængelige blandt andet på kommunens hjemmeside, i et adressekartotek på intranettet, i medarbejderens e-mail signatur, i Active Directory, i HR-systemet og i lønsystemet. Det kan også være, at man kan finde det i andre systemer som vagtplansystemer, fagsystemer og eksterne systemer til fx kursusadministration. Udover dette kan telefonnummeret også være synlig på fysiske steder, herunder adgangskort og trykte lister på kontorvæggen.
Eksemplet herover viser, hvordan et “simpelt” telefonnummer – og i princippet alle andre dataobjekter – kan leve videre i 10+ systemer. I bedste fald taler alle systemerne sammen og opdaterer data på tværs. Hvis de ikke gør det, bliver opgaven med at opdatere dataene manuelt uoverskueligt, og så er det nok tid til en revurdering af, hvordan dataene registreres, opbevares og organiseres.
Datakvalitet
= At data er korrekte, konsistente, dækkende, anvendelige og samsvarer med standarder, lovgivninger og interne krav.
God datakvalitet betyder, at dataene opfylder deres tilsigtede brug i drift, beslutningstagning og planlægning.
Konsekvenserne ved dårlig datakvalitet
Konsekvenserne ved dårlig datakvalitet kan hurtigt blive alvorlige, når data ikke er konsistente på tværs af systemer. En medarbejder, der har skiftet stilling eller er fratrådt, kan stadig fungere som aktiv i ét system, mens et andet system viser noget helt andet. For en kommune kan det medføre usikkerhed om organiseringen, ineffektive arbejdsgange og i værste fald forkerte forretningskritiske beslutninger baseret på forældede eller forkerte oplysninger.
Endnu mere kritisk er risikoen for, at tidligere medarbejdere bevarer adgange, de ikke burde have. Det kan udgøre en sikkerhedstrussel og bringe kommunen i konflikt med gældende regler for datasikkerhed og databeskyttelse. Samtidig kan der ligge skjulte økonomiske tab i form af licenser, der fortsat betales for brugere, som ikke længere eksisterer i organisationen.
Samtidig kan der opstå betydelige økonomiske konsekvenser, når tid og ressourcer skal bruges på manuelt at gennemgå og rette forkerte data på tværs af systemerne, herunder unødvendige licenser til brugere, der ikke længere er en del af organisationen.
Relateret indhold: Konsekvenserne af dårlig masterdata i kommunerne
Måder at forbedre datakvaliteten på
At forbedre og vedligeholde datakvaliteten er ikke et engangsprojekt, men en kontinuerlig indsats. Det vedrører såvel teknologi som det organisatoriske. Vi har derfor udarbejdet fire punkter, der kan hjælpe dig med at komme i gang med forbedringen af datakvaliteten:
- Skab et overblik over de eksisterende it-systemer i kommunen. Hvad bruges systemerne til, og hvilke data opbevares hvor? En systematisk gennemgang af it-landskabet kan synliggøre både overlap og systemer, hvis ansvar skal indskrænkes, eller ligefrem fjernes. Vurdér også her, om der findes gode alternativer. Masterdatasystemer kan ofte samle de vigtigste organisationsdata ét sted og sørge for automatisk distribution til øvrige systemer.
- Gennemfør en grundig datavask, hvor ufuldstændige, forældede eller dobbelte data identificeres og korrigeres. Selvom det kan være en ressourcekrævende proces, kan den gøres mere overkommelig ved at definere en klar tidsramme, opdele arbejdet i mindre dele, udpege ansvarlige for hver del og sikre, at alt bliver dokumenteret.
- Integrér validering af inputs og automatiserede kontroller i systemerne, så brugere ikke kan taste fejl ved uheld. På denne måde sikres datakvaliteten på tværs af systemlandskabet.
- Etablér klare retningslinjer og arbejdsgange for, hvordan data registreres og vedligeholdes for at fastholde et højt niveau af datakvalitet. Det kan fx. være standarder for navngivning, faste procedurer ved medarbejderfratrædelse og rutinemæssige datatjek. Der kan med fordel også tildeles klare ansvarsroller i forbindelse med datahåndtering i it-systemerne. Roller som dataejer, datakonsument og metadataansvarlig kan hjælpe med at fordele ansvaret.
Hvad er grunden til dårlig datakvalitet?
Typisk har en dansk kommune mellem 300 og 400 it-systemer (kilde: KL). Dette it-landskab er ofte opbygget over mange år, hvor nye systemer er blevet tilføjet for at løse konkrete opgaver. Hvert system administreres typisk lokalt, hvilket betyder, at data registreres og vedligeholdes flere steder samtidig. Det er også sjældent, at systemerne gennemgås regelmæssigt, hvilket betyder, at systemer kan indeholde forældede eller på anden vis ukorrekte data. Når der sker organisationsændringer, eller medarbejdere skifter rolle eller stopper, er der tendens til, at oplysningerne ikke rettes konsekvent i alle systemer. Over tid skaber dette et uensartet og fragmenteret datagrundlag og en forringet datakvalitet.