Sperimentazione di un sistema di controllo e correzione per la codifica dell’attività economica

F. della Ratta-Rinaldi, M. Tibaldi

Versione integrale del n.4/2014

Per migliorare la qualità dei dati il Servizio Istruzione, formazione e lavoro dell'Istat ha messo in campo una procedura di Text Mining per il controllo e la correzione della codifica dell'attività economica effettuata dai rilevatori nell'indagine sulle Forze di lavoro.

La strategia è resa possibile grazie alla presenza nel file dati di un campo testuale in cui i rilevatori riportano le caratteristiche dell'attività economica svolta, così come descritta dagli intervistati, accompagnato dalla codifica relativa all'attività economica.

La procedura, attiva dal quarto trimestre 2011, si basa sul confronto tra il vocabolario adottato dai rispondenti e il vocabolario specifico di ciascuna divisione, desunto dalla classificazione ufficiale (classificazione Ateco 2007, Nace rev. 2). I record nelle cui descrizioni compaiono parole non presenti nel vocabolario ufficiale della divisione specifica sono automaticamente estratti e controllati. In caso di errori ricorrenti, le istruzioni di ricerca sono eseguite automaticamente nelle future sessioni di correzione.

Il processo, che ha permesso di migliorare la qualità dei prodotti, si completa attraverso una verifica puntuale della coerenza degli stessi che, in ogni sessione, prevede sempre un intervento manuale di esperti per la validazione delle correzioni effettuate e la definitiva attribuzione del codice corretto.

tag:
formazione, Istat working papers, istruzione, lavoro
argomento:
Istruzione e formazione, Lavoro e retribuzioni
tipo di documento:
Produzione editoriale
Data di pubblicazione
17 ottobre 2014
No

Per informazioni scrivi a comunica@istat.it