Ongestructureerde data
Wat zijn ongestructureerde data?
In het geval van Big Data is 20% van de data gestructureerd en 80% ongestructureerd. Ongestructureerde data is data die niet een gespecificeerd format volgen voor Big Data. Het is data die niet verblijven in een traditionele rij-kolom database. Ze zijn dus het tegenovergestelde van gestructureerde data die opgeslagen worden in velden in een database.
Voorbeelden ongestructureerde data
Bovenstaande definitie van ongestructureerde data is misschien nog wat vaag. We geven je daarom hieronder concrete voorbeelden van ongestructureerde data. Net als bij gestructureerde data, wordt unstructured data ofwel door computers ofwel door mensen gegenereerd.
- Allereerst heb je zogenaamde ‘activiteitendata’. Dit is data die gegeneerd worden door digitale music players en eBooks. Bovendien verzamelt je mobiele telefoon data over hoe je hem gebruikt en weet je webbrowers welke informatie je opzoekt. Probeer maar eens een activiteit te bedenken waarbij er geen data van je gegeneerd wordt! Dat is inderdaad moeilijker dan je denkt!
- Social media data zijn een andere bron waaruit een grote stroom ongestructureerde data komt. Hierbij kun je denken aan conversaties op Twitter, LinkedIn en Facebook.
- Interne bedrijfsdata zijn ook een bron van ongestructureerde data. Hierbij kun je denken aan e-mail, tekstdocumenten en onderzoeksresultaten.
- Vandaag de dag is een toename in foto- en videogebruik te zien op het internet. Ook deze zijn een grote bron van unstructured data. Denk bijvoorbeeld aan alle foto’s die we nemen met onze mobiele telefoons en uploaden op social media en de enorme hoeveelheid uren videomateriaal die we op YouTube plaatsen.
- Tegenwoordig worden we omringd door sensoren die continu data verzamelen. Een voorbeeld is de GPS op je mobiele telefoon die kan tracken waar je bent en welke reizen je aflegt.
- Het laatste voorbeeld van unstructured data is ‘The Internet of Things’ (IoT). Tegenwoordig bestaan er apparaten als smartTV’s, smart watches en smart alarms. The IoT verbindt al deze apparaten met elkaar. Om een duidelijker beeld te schetsen van the IoT zou je kunnen denken aan verkeerssensoren die data naar je wekker sturen, waardoor jij weet dat het beter is dat je eerder je bed uit gaat vanwege files.
Unstructured data en big data
Het is wel duidelijk dat organisaties het meest te maken krijgen met unstructured data. Dit vormt tegelijkertijd een grote uitdaging. Het is namelijk niet makkelijk om ongestructureerde data te verzamelen en te analyseren. Het is lastig om waardevolle analyseresultaten te krijgen, terwijl dat is waar het bij Big Data om draait: waarde creëren uit de grote hoeveelheid data. Maar wij kunnen je wel helpen om meer grip te krijgen op Big Data Analyse.
Meer weten over ongestructureerde data?
Als je meer wilt weten over het omgaan met ongestructureerde data volg dan de cursus Data Analyse bij de Big Data Academy. Dit is de plek waar je opgeleid wordt tot vooraanstaand Big Data specialist. De cursus Data Analyse is het startpunt voor jouw carrière als Big Data specialist.