Wat is Dark Data? En wat zijn de risico’s?

Hoe ongrijpbare gegevens een gevaar vormen

Wat is Dark Data? En wat zijn de risico’s?

Hoe ongrijpbare gegevens een gevaar vormen

De term Dark Data is best wat vaag. Het geeft daarmee gek genoeg wel aan waar het over gaat: de vergeten documenten en informatie die op allerlei plaatsen in de organisatie zijn opgeslagen, maar waarvan niemand meer weet dat ze er zijn. Laat staan waar ze zijn en wat je er aan hebt.

Inhoud

Wat is Dark Data eigenlijk?

De definitie van dark data luidt als volgt:

Dark Data is een term voor gestructureerde (data in databases) of ongestructureerde (data in documentvorm) informatie waarvan men niet weet dat het bestaat en/of niet meer weet waar deze informatie zich bevindt.

Voor velen staat het synoniem voor eenmalig gebruikte of aangemaakte informatie. Denk dan bijvoorbeeld aan een .zip bestand dat wordt uitgepakt en gebruikt, maar waar verder niemand meer naar omkijkt. Maar ook documenten die worden opgeslagen op een plek die vervolgens vergeten wordt. Zelfs content die actief is gebruikt kan veranderen in Dark Data op het moment dat de prioriteiten binnen een organisatie veranderen. Dergelijke informatie krijgt in veel gevallen letterlijk ‘op de plaats rust’ en wordt vervolgens vergeten. Wat erger is, we zien vaak dat informatie die niet snel genoeg wordt gevonden opnieuw wordt aangemaakt. Daarmee wordt het risico op en de hoeveelheid Dark Data alleen maar groter, nog los van het kostenaspect van het opnieuw creëren van informatie die er al is.

Hoe vaak komt dark data voor?

Het korte en duidelijke antwoord is: veel en vaak. Vooral het dubbel aanmaken van al bestaande informatie is de grootste bron van dark data. Metaforisch wordt deze informatie ook wel de ‘dark data ijsberg’ genoemd. Dit houdt in dat het kleinste gedeelte van alle informatie vindbaar en goed georganiseerd is, maar het overgrote gedeelte van de data niet zichtbaar en vindbaar is.

Dark data statistieken binnen een organisatie — Hoeveel dark data bestaat er binnen organisaties?

Zorgen om dark data – wat zijn de risico’s?

Die grote volumes ongebruikte en vergeten informatie kunnen net zo snel groeien als informatie die er wél toe doet. Maar het overzicht verdwijnt volledig. Dat is een grote zorg voor veel bedrijven. De kosten voor eDiscovery – het (juridisch) doorzoeken van digitale data – stijgen daardoor eveneens explosief. Iedere organisatie die rekening houdt met of anticipeert op mogelijke schadeclaims heeft daarmee te maken. Dark Data heeft ook grote invloed op data-analyses die worden gemaakt. Er zit niet alleen veel ruis in de te doorzoeken data, het duurt allemaal langer voor alles is geanalyseerd. De uitkomsten worden tevens beïnvloed door gedateerde informatie die toch wordt meegenomen.

Bovendien brengt die berg aan dark data een aantal bedrijfsrisico’s met zich mee:

Beveiligingsrisico’s: Dark data kan gevoelige informatie bevatten, zoals persoonlijke identificeerbare informatie (PII), financiële gegevens of bedrijfsgeheimen. Als deze gegevens niet goed worden beheerd of beveiligd, kunnen ze het doelwit worden van hackers of kwaadwillende aanvallen, wat kan leiden tot gegevensdiefstal, reputatieschade of juridische consequenties.
Privacy- en compliance-risico’s: Organisaties moeten voldoen aan wet- en regelgeving met betrekking tot gegevensprivacy, zoals de Algemene Verordening Gegevensbescherming (AVG) in de Europese Unie. Dark data kan gegevens bevatten die onderhevig zijn aan deze regelgeving. Als organisaties geen controle hebben over hun dark data en niet voldoen aan de wettelijke vereisten, lopen ze het risico op boetes en juridische sancties.
Operationele inefficiëntie: Ongestructureerde dark data kan de operationele efficiëntie van een organisatie belemmeren. Het kost tijd en middelen om grote hoeveelheden ongeorganiseerde gegevens te doorzoeken, te analyseren en waardevolle inzichten te verkrijgen. Het gebrek aan bruikbare gegevens kan ook leiden tot besluitvormingsprocessen op basis van onvolledige informatie.
Gemiste kansen: Dark data kan waardevolle inzichten en kansen bevatten die niet worden benut. Door het gebrek aan bewustzijn of technologische mogelijkheden om deze gegevens effectief te analyseren, kunnen organisaties mogelijk waardevolle inzichten, nieuwe productkansen, efficiëntieverbeteringen of concurrentievoordelen mislopen.

De oplossing: metadata toekennen

Voordat Dark Data in het licht kan worden gezet, moeten we die eerst identificeren. Dat kan handmatig, maar slimmer is een platform dat documenten automatisch classificeert op basis van de inhoud van het document.

Vervolgens kan een goed ECM-systeem aan de hand van metadata documenten snel en slim organiseren. Of je besluit er voorgoed afscheid van te nemen als er echt geen waarde meer aan toe te kennen is.

Door het toekennen van ‘attributen’ of ‘tags’ aan content kan een intelligent ECM-systeem de informatie direct identificeren en aan elkaar relateren.

Dat geldt zowel voor de ongestructureerde als de gestructureerde data. Voorbeeld: een offerte (ongestructureerde data) kan door metadata worden gekoppeld aan het CRM-account voor Klant A (gestructureerde data). Daarmee wordt het zichtbaar in het CRM-systeem op het moment dat iemand iets met Klant A gaat doen. Op die manier voegt metadata opnieuw waarde toe aan Dark Data. Alle aan Klant A gerelateerde informatie wordt immers volledig weergegeven in het CRM.

Leren kijken in het donker

Wanneer organisaties op die manier leren kijken naar Dark Data en er daadwerkelijk wat mee kunnen doen, wordt de uiteindelijke waarde van de beschikbare informatie veel groter en risico’s worden voorkomen.

Wilt u weten hoe u dark data bestrijdt in uw organisatie? Plan een persoonlijk online adviesgesprek in met een van onze Nederlandse experts.

Kennisdossiers