Analisi lessicale delle ordinanze
Il lavoro di Pasquale Pavone
Martedì 19 maggio 2015, nell’aula Seminari del Dipartimento di Economia Marco Biagi dell’Università di Modena e Reggio Emilia, si è svolto un seminario tenuto da Pasquale Pavone, borsista di ricerca del progetto di ricerca Energie Sisma Emilia. Nel corso dell’incontro, Pavone ha esposto il suo lavoro di ricerca sul Corpus delle Ordinanze emanate dai commissari delegati per la ricostruzione dopo i terremoti del 20 e 29 maggio 2012. Il seminario fa seguito all’introduzione su obiettivi e metodologie di analisi dei testi che ha avuto luogo in data 21 aprile 2015.
L’analisi lessico testuale dell’attività normativa dei Commissari Delegati presentata ha come obiettivo l’esplorazione degli interventi che sono stati attuati ed in particolare mira ad evidenziare le tematiche affrontate durante la fase di emergenza e ricostruzione dagli attori pubblici, in modo da offrire spunti per le linee guida di una normativa nazionale.
Il Corpus di documenti sottoposto ad analisi è composto quindi dalle 349 Ordinanze emanate dal 08/06/2012 al 23/02/2015. L’ampiezza del linguaggio dopo il primo parsing del testo è di 31.969 forme grafiche originarie, ovvero le parole diverse o vocabolario del corpus (includendo anche le forme numeriche), mentre l’insieme dei dati testuali raccolti ammonta a 1.278.291 occorrenze di parole, equivalente a 2.550 pagine convenzionali di testo.
Ogni Ordinanza costituisce un’unità testuale del Corpus ed è stata suddivisa al suo interno in tre sezioni di testo: una prima parte narrativa di “Premessa”, una seconda parte di “Disposizioni”, una terza parte di “Allegati”.
La filiera di lavoro è caratterizzata da raccolta delle informazioni; pre-trattamento dei testi; normalizzazione delle lessie; trattamento lessicale; identificazione del cratere; riconoscimento ed estrazione di tutti gli atti normativi citati nelle ordinanze; classificazione automatica su base statistica (Cluster Analysis).
I principali risultati dell’analisi riguardano il riconoscimento di 1.505 atti normativi diversi per un totale di 15.347 citazioni (la cui elaborazione è ancora in corso), e l’identificazione di quattro macro tematiche affrontate nelle ordinanze: criteri concessione contributi; gestione assegnazione risorse; interventi assistenza popolazione; opere urgenti scuole municipi.