Studio ed implementazione di un sistema di supporto ad indagini

Le fasi di un'indagine di polizia che precedono un processo giudiziario, cruciali per lo svolgimento delle udienze, sono molto delicate: gli investigatori devono far fronte ad una grande quantità di dati relativi a prove e testimonianze che costituiscono l'evidenza per il caso in esame, cercando le contraddizioni all'interno di esse, utilizzandole per giudicare la credibilità di ogni deposizione e l'affidabilità dei testimoni e per trovare una strada per proseguire le indagini attraverso la generazione di ipotesi.

In anni recenti, grazie ai miglioramenti continui nelle tecnologie informatiche, sono stati sviluppati alcuni sistemi per la gestione elettronica delle prove relative ad indagini di polizia: i più avanzati, oltre a permettere la raccolta e l'organizzazione in formati digitali dell'evidenza,  applicano tecniche di data mining per individuare collegamenti tra persone, luoghi, crimini e casi differenti agevolando il lavoro quotidiano degli investigatori, che altrimenti dovrebbero cercarli manualmente. Anche il ramo logicista dell'intelligenza artificiale ha generato letteratura e prototipi su questi argomenti: assecondando la pratica comune di chi svolge indagini, consistente nella costruzione di scenari che spieghino le prove raccolte e che conducano verso la ricerca di nuove prove (che devono essere presenti se lo scenario ipotizzato corrisponde all'effettivo svolgimento dei fatti), gli strumenti proposti permettono di rappresentare il ragionamento di un investigatore visualizzando storie che spieghino le osservazioni, fino ad una generazione delle stesse sulla base di pattern presenti nei database che corrispondono all'evidenza disponibile.

Il lavoro di questa tesi si inserisce nel contesto appena descritto fornendo l'implementazione di un sistema proposto in letteratura: si tratta di un prototipo che dovrebbe agevolare il lavoro di chi compie indagini relativo alla ricerca di contraddizioni all'interno dell'evidenza al fine di associare una credibilità ai vari elementi e un'affidabilità alle sorgenti di informazione. Il sistema, basandosi su una rappresentazione formale (mediante la logica del primo ordine) delle informazioni relative all'evidenza, agisce da riconoscitore di contraddizioni generando insiemi di informazioni massimamente consistenti: questi dovrebbero costituire la base di partenza per la generazione di ipotesi su un caso in esame. Utilizzando tecniche numeriche il software dovrebbe generare una classicazione di questi insiemi assegnando un valore alle varie informazioni che ne indichi la credibilità e un valore alle fonti che ne attesti l'affidabilità.

La generazione degli insiemi massimamente consistenti ha le sue fondamenta teoriche nella revisione delle conoscenze (Belief Revision), cioè quella disciplina che si occupa di mantenere la consistenza all'interno di un insieme di informazioni quando ne giungono di nuove: infatti queste potrebbero essere in contraddizione con le conoscenze già possedute e quindi andrebbe cercata una nuova base di informazioni senza inconsistenze, da utilizzare per stabilire ciò che è vero. Possono essere trovate più basi che possono essere ordinate calcolando un valore di credibilità per ognuna delle informazioni a disposizione utilizzando la teoria di Dempster-Shafer sulle belief functions : partendo da un valore a priori di adabilità delle sorgenti di informazione (che ne indica la probabilità che quanto aermino sia vero), si attribuisce un valore ai vari elementi dell'evidenza che corrisponde al grado con cui possono essere considerati credibili. Considerando le contraddizioni emerse può essere ottenuto (attraverso il condizionamento Bayesiano) anche un valore di affidabilità a posteriori per le sorgenti di informazione.

Oltre al motore del software che implementa quanto appena descritto, è stata implementata un'interfaccia grafica per permettere un inserimento ed una visualizzazione agevole delle informazioni all'interno del sistema, con l'obiettivo di consentire test dello stesso relativi a casi reali o di complessità comparabile con essi.

La motivazione principale che ha portato lo sviluppo del sistema è la necessità di uno strumento che aiuti l'investigatore a fare chiarezza nei dati a sua disposizione, escludendone le contraddizioni. Inoltre il sistema è caratterizzato da una componente numerica (la teoria di Dempster-Shafer) documentata in letteratura anche se caratterizzata da alcuni aspetti controversi di cui discuteremo nella tesi: tentativi analoghi sono rari nell'ambito dei sistemi per le investigazioni su crimini. Un software come quello proposto potrebbe integrare quelli per la gestione delle prove e costituire la base per sistemi che aiutino la generazione di scenari ipotetici che spieghino le osservazioni relative ad uno specico caso.

Nel primo capitolo della tesi descriveremo alcuni fondamenti teorici della revisione delle conoscenze.  Nel secondo capitolo passeremo inizialmente in rassegna alcuni sistemi di supporto per indagini relative a crimini; proseguiremo poi con l'analisi del meccanismo numerico alla base del software proposto e concluderemo con la verifica di una proprietà individuata nelle formule utilizzate. Nel terzo capitolo discuteremo l'implementazione del sistema soffermandoci sulla descrizione del motore di ragionamento e mostrando le principali caratteristiche dell'interfaccia grafica. Infine saranno presentate le conclusioni del lavoro di tesi dando particolare risalto a possibili sviluppi futuri.

 

Corso di Laurea: 
Laurea Magistrale in Ingegneria Informatica
Anno Accademico: 
2012
Tesista
Tesista: 
Paolo Sernani
Email: 
Relatore
Relatore: 
Prof. Aldo Franco Dragoni
Email: