L’indagine della procura di Genova relativa alle tangenti ottenute da Giovanni Toti e da Paolo Emilio Signorini ha riaperto il dibattito sui software per la trascrizione automatica utilizzati in molti tribunali e procure italiane.
Infatti, nella trascrizione di un interrogatorio, l’indagato per corruzione Roberto Spinelli avrebbe parlato di “finanziamenti illeciti”, anche se, nella realtà, ha detto “finanziamenti leciti”: il contrario, dunque.
L’origine della svista non è da attribuirsi ad un errore umano: infatti, la trascrizione dell’interrogatorio in questione era stata fatta un software programmato appositamente per convertire una conversazione in un testo scritto.
La tecnologia è certamente un aiuto importante, ma alcune innovazioni devono prima essere valutate attentamente. Questi sistemi di trascrizione e riconoscimento vocale solitamente vengono allenati con centinaia di migliaia di ore di audio provenienti da udienze, dibattiti politici e programmi televisivi, accompagnati dalle trascrizioni ufficiali.
Spiega l’avvocato cassazionista romano Iacopo Benevieri: «Il sistema crea un modello probabilistico sulla base di migliaia di registrazioni in cui persone diverse e in luoghi diversi pronunciano una determinata parola».
«La conseguenza», prosegue, «è che questi sistemi possono essere influenzati negativamente da un pregiudizio culturale determinato dall’insieme di dati di trasmissioni televisive, podcast e notiziari utilizzati per addestrare il sistema. Per rimanere sul caso di Genova: se nei dati vocali inseriti la parola “finanziamenti” è associata, nella maggioranza dei casi, a condotte illecite, il sistema riconoscerà come più probabile l’aggettivo “illeciti” rispetto a “leciti”».
Attualmente non esiste «una regolamentazione e non esiste una consapevolezza critica di questi strumenti. La trascrizione viene semplicemente delegata, senza nessun tipo di controllo».
Tuttavia, i limiti si applicano anche alla trascrizione eseguita da persone umane. Di frequente, le persone che trascrivono le intercettazioni puntano al contenuto, tralasciando di gran lunga la forma, creando inevitabilmente informazioni errate.
Inoltre, nella trascrizione delle intercettazioni manca il contesto enciclopedico, ovvero le conoscenze condivise soltanto tra le persone intercettate, solitamente non accessibili a coloro che ascoltano e trascrivono la conversazione.
Il lavoro del trascrittore è molto sottovalutato: nonostante sia determinante nell’ambito di un’inchiesta, in Italia manca un albo professionale. Inoltre, procure e tribunali non sono obbligati a comprare software per la trascrizione, ma i numerosi tagli al personale hanno obbligato molti a seguire questa strada.
Non ci sono indicazioni o regole specifiche sull’utilizzo di tali software. Conclude Benevieri: «Non possiamo rinunciare a questi software e all’intelligenza artificiale, ma dobbiamo capire come esercitare un controllo, una supervisione, e non delegare passivamente. Senza una revisione corriamo il rischio di concedere una pericolosa delega e di non avere più nessuna forma di garanzia su un potere enorme come la rappresentazione di una prova».
LEGGI ANCHE:
Nordio a Strasburgo e Lussemburgo, il viaggio del Ministro della Giustizia
L’avvocato può essere iscritto in più elenchi dei curatori speciali del minore