Maart: Cleanen van de data
Publicatiedatum: 08 apr., 2024Inmiddels hebben een groot aantal alumni de HBO-Monitor vragenlijst ingevuld. Alle antwoorden zijn nu verzameld in één grote databestand. Om vanuit deze eerste berg aan ingevulde antwoorden tot een goed te analyseren bestand te komen, gaan wij deze goed ordenen en opschonen. Dit proces wordt datacleaning genoemd. Hierbij doorlopen we alle gegevens die we hebben verzameld en zorgen ervoor dat alles soepel en foutloos werkt. We kijken naar zaken zoals ontbrekende informatie, inconsistenties en onnodige dubbele entries en lossen die op. Daarnaast berekenen we ook variabelen op basis van de vragenlijst en voegen deze toe aan de dataset. Hierbij gaat het om variabelen die bijvoorbeeld nodig zijn voor rapportagedoeleinden en om definitievariabelen zoals de ‘beroepsbevolking’.
Het doel is om de dataset te optimaliseren, zodat we er gemakkelijk mee kunnen werken en betrouwbare analyses kunnen uitvoeren. Het is een cruciale stap omdat het de basis legt voor nauwkeurige resultaten en inzichten uit onze gegevens.
Zodra het datacleaning proces klaar is, gaan we de instellingsrapportages voor de Hogescholen daarmee opbouwen en gaan we ontdekken welke resultaten er op landelijk niveau uitkomen. De publicatie van deze resultaten vindt plaats op 10 april.