Introduzione
Le tecniche di Intelligenza Artificiale (AI) rappresentano uno strumento sempre più utilizzato e diffuso in numerosi ambiti: medico, economico, ambientale e ricreativo. Nel corso degli ultimi dieci anni, anche in archeologia sono stati esplorati diversi metodi di applicazione dell’AI (GUALANDI et al., 2021) e, attualmente, i progetti che mirano ad assistere l’archeologo grazie l’utilizzo di questi metodi sono numerosi (BICKLER, 2021; MANTOVAN & NANNI, 2020). Le tecniche di AI in archeologia sono di supporto principalmente ad attività ripetitive che richiedono un elevato impiego di tempo, come la catalogazione dei reperti, l’identificazione di tracce d’uso su materiale osteologico, o alle attività rischiose per l’essere umano, come l’indagine di siti subacquei collocati a elevate profondità.
Questo articolo è basato sulla tesi di laurea magistrale di Elisa Paperini, “Intelligenza Artificiale e Archeozoologia: l’uso di reti neurali per la classificazione di reperti di avifauna”, con relatori il prof. Gattiglia e la dott.ssa Sciuto (Università di Pisa), il dott. Dubbini (Miningful) e la prof.ssa Demarchi (Università di Torino). L’obiettivo del lavoro, che ha previsto la collaborazione tra esperti di discipline diverse (archeozoologia, archeologia, matematica, informatica), è sperimentare l’uso di reti neurali per affiancare l’archeozoologo nella catalogazione di reperti di avifauna e offrire all’archeologo non specializzato nello studio di resti faunistici uno strumento in grado di fornire un’indicazione immediata sull’identità dei reperti. Lo studio dei reperti faunistici apporta informazioni importanti riguardo la ricostruzione dell’ambiente circostante, come ad esempio della stagionalità al momento della deposizione e le relazioni tra esseri umani e altre specie animali (DINCAUZE, 2010).
Il dataset utilizzato è composto da 1833 fotografie di reperti faunistici di 5 tipologie di osso (fig. 1), che appartengono a 25 specie differenti di anatre e 5 altre specie di uccelli. I resti osteologici analizzati provengono da collezioni di riferimento conservate nel Museo Zoologico di Copenhagen (Danimarca) e nel Museo di Storia Naturale di Tring (Inghilterra). Essi sono stati studiati e fotografati dalla zooarcheologa Lisa Yeomans. Per il conseguimento dell’obiettivo sono state implementate due reti neurali convoluzionali, una per la classificazione della tipologia di osso e una per il riconoscimento della specie di uccello. La classificazione della tipologia di osso ha ottenuto l’86% di accuratezza e quella per l’identificazione della specie di uccello (30 classi) ha raggiunto il 47% nell’accuratezza della top 5.
Figura 1. Tipologie di ossi presenti all’interno del dataset. Gli ossi non sono rappresentati in scala.
Strumenti e metodi
Il 70% delle fotografie componeva il training set, il 20% il validation set e il 10% il test set. Lo sviluppo del codice ha avuto luogo Google Colaboratory (Colab), utilizzando il linguaggio di programmazione Python e il framework di apprendimento automatico PyTorch.
Le reti neurali programmate sono di tipo convoluzionale, perché è la tipologia di reti neurali che si adatta meglio all’elaborazione delle immagini (LINDSAY, 2021). Sono stati creati due progetti diversi, uno riservato all’elaborazione di una rete neurale per la catalogazione della tipologia di osso e uno per l’identificazione della specie di volatile. In entrambi i progetti, i dataset sono stati caricati sulla piattaforma Google Drive, all’interno dell’account istituzionale e sono stati connessi virtualmente all’ambiente di lavoro Colab mediante l’interfaccia GDFuse.
Per il riconoscimento della specie, a causa della difficoltà del problema, unita alla numerosità campionaria non del tutto sufficiente, si è deciso di ottenere una lista formata dalle cinque previsioni a cui corrisponde un punteggio di confidenza più elevato (top 5). Questo sistema permette di lasciare all’archeozoologo il potere decisionale di stabilire quale tra le cinque classi proposte sia quella corretta, favorendo anche un’osservazione critica da parte dell’archeologo non specializzato nel riconoscimento di reperti di avifauna.
Risultati
La rete neurale che classifica i resti osteologici sulla base delle classi tipologiche raggiunge una percentuale di 86% di accuratezza sul validation set (si veda Figura 2).
I risultati del test del modello addestrato sono promettenti: su 183 elementi analizzati, l’algoritmo ha ottenuto un’accuratezza del 94%. La classe di resti osteologici che è stata classificata più correttamente dalla rete neurale è quella del coracoide, che ha raggiunto un’accuratezza del 100% su 53 fotografie. La classe di resti osteologici in cui l’algoritmo ha commesso più errori è quella del tarsometatarso, in cui sono stati classificati correttamente 19 ossi su 26. In particolare, 6 volte su 7 la classe del tarsometatarso è stata identificata erroneamente come coracoide.
Figura 2. Rappresentazione delle funzioni di perdita e accuratezza ottenute dall’addestramento della rete neurale per la classificazione della tipologia di osso. A sinistra, i grafici delle funzioni di training loss (colore blu) e di validation loss (colore arancione); a destra, i grafici delle funzioni di training accuracy (colore blu) e di validation accuracy (colore arancione)
La rete neurale per la classificazione dei resti faunistici in base alla specie ha raggiunto il 47% di accuratezza (top-5, si veda la figura 3).
Figura 3. Rappresentazione delle funzioni di perdita e accuratezza top 5 ottenute dall’addestramento della rete neurale per la classificazione della specie di anatra a cui appartiene l’osso. A sinistra, i grafici delle funzioni di training loss (colore blu) e di validation loss (colore arancione). A destra, i grafici delle funzioni di training accuracy top 5 (colore verde) e di validation accuracy top 5 (colore rosso).
I risultati ottenuti rappresentano un punto di partenza valido dal quale poter implementare ulteriori funzioni. Per ottenere risultati più accurati, è possibile apportare miglioramenti alle due reti neurali gestendo lo sbilanciamento dei dati mediante una riorganizzazione della suddivisione del dataset in training set, validation set e test set; ottimizzando gli iperparametri; utilizzando tecniche di transfer learning e fine tuning. Un’interessante applicazione potrebbe riguardare la classificazione su reperti faunistici che sono di difficile identificazione per gli archeozoologi, come ad esempio la distinzione tra ossi appartenenti a esemplari maschili o esemplari femminili. Questa dinstinzione è importante, in archeologia, per definire il rapporto tra esseri umani e animali sia per quanto riguarda aspetti cultuali (a divinità diverse potevano corrispondere sacrifici di animali distinti anche per sesso), sia per quanto riguarda abitudi alimentari e di caccia. Le reti neurali sviluppate potranno essere addestrate a riconoscere ulteriori specie di volatili o altre famiglie e categorie di animali, quali ad esempio insetti, molluschi, serpenti che forniscono indicazioni preziose soprattutto per quanto riguarda il clima e i caratteri ambientali al momento della deposizione.
Bibliografia
- BICKLER, S. (2021). Machine Learning Arrives in Archaeology. Advances in Archaeological Practice, 9(2), 186-191. https://doi.org/10.1017/aap.2021.6.
- DINCAUZE, D. (2000). FAUNA. In Environmental Archaeology: Principles and Practice (pp. 409-494). Cambridge University Press. https://doi.org/10.1017/CBO9780511607837.
- GUALANDI, M.L., GATTIGLIA, G., & ANICHINI, F. (2021). An Open System for Collection and Automatic Recognition of Pottery through Neural Network Algorithms. Heritage, 4, 140-159. https://doi.org/10.3390/heritage4010008.
- MANTOVAN, L., & NANNI, L. (2020). The Computerization of Archaeology: Survey on Artificial Intelligence Techniques. SN Computer Science, 1. https://doi.org/10.1007/s42979-020-00286-w.
- LINDSAY, G.W. (2021). Convolutional Neural Networks as a Model of the Visual System: Past, Present, and Future. Journal of cognitive neuroscience, 33(10), 2017-2031. https://doi.org/10.1162/jocn_a_01544.