Automatisch verzamelen en analyseren van GGD-inspectierappor
Opdracht ID: 57632
Budget: € 60 tot 80 p.u.
Geplaatst: 26 jun
Reacties: 8
Locatie: Op afstand
Laatst gewijzigd: 26 jun
Status: Open
???? Automatisch verzamelen en analyseren van GGD-inspectierapporten BSO Amsterdam
???? Doel van de opdracht:
Ik ben op zoek naar een developer (eventueel met AI-ervaring) die een geautomatiseerde workflow kan bouwen om GGD-inspectierapporten van BSO-locaties in Amsterdam te verzamelen en analyseren.
Het doel is om te bepalen:
Welke locaties als goed, matig of slecht zijn beoordeeld
Of er maatregelen zijn genomen (zoals boetes of aanwijzingen)
Welke organisaties (houders) overwegend goed of slecht scoren
????? Opdrachtomschrijving
Deel 1: Automatisch downloaden van rapporten
Navigeer naar https://www.landelijkregisterkinderopvang.nl/pp/#/
Voer "Amsterdam" in als locatie
Download alle GGD-inspectierapporten (PDF) van locaties die in de laatste 3 jaar actief zijn
Sla deze op in een gestructureerde map (liefst met LRK-ID of naam in bestandsnaam)
Deel 2: Extractie van gegevens uit PDF's
Voor elk rapport:
Extraheer meetbare gegevens uit de tekst, waaronder bijvoorbeeld:
Aantal tekortkomingen
Aard van tekortkomingen (bijv. veiligheid, pedagogiek, administratie)
Wel/geen handhaving: aanwijzing, last onder dwangsom, bestuurlijke boete
Positieve of negatieve oordelen
Structureren van deze data in een overzicht (Excel / CSV / database)
Deel 3: Analyse en rapportage
Genereer een gestructureerd overzicht per locatie
Genereer een overzicht per houder/organisatie met samenvattende inzichten
Eventueel: visuele weergave (bv. in een dashboard of grafiek)
???? Deliverables
Map met alle gedownloade PDF-rapporten (max. 3 jaar terug)
CSV of Excel-bestand met gestructureerde data per locatie:
Naam locatie
LRK-ID
Jaar van inspectie
Status/kwaliteitsoordeel
Maatregelen of boetes (ja/nee + toelichting)
Thema’s van tekortkomingen (indien van toepassing)
Optioneel: samenvattende rapportage of dashboard per houder
? Gewenste skills
Web scraping (Playwright of Selenium)
PDF-tekstextractie (bijv. PDFplumber, PyMuPDF, of NLP-methodes)
Basis NLP / LLM-integratie (bijv. GPT API) om kernzinnen te detecteren
Python (of andere passende taal)
Goede communicatie en documentatie
???? Timing en budget
Start: zo snel mogelijk
Oplevering: binnen 2 tot 3 weken
Budget: in overleg – graag inschatting op basis van bovenstaande scope
???? Reageren
Graag bij reactie:
Voorbeeld van vergelijkbaar werk (web scraping / PDF-analyse / data-extractie)
Eventuele suggesties voor de aanpak of technische keuzes
Indicatie van benodigde tijd en kosten