Il gruppo di ricerca si occupa di applicare modelli di Natural Language Processing, in particolare negli ambiti del Topic Mining e della Sentiment Analysys, a testi di natura e cronologie molto diverse tra loro, nell’ottica di verificare i risultati non solo in close reading, ma anche in modo comparativo, interlinguistico e interculturale.
Due sono le direzioni di indagine intraprese:
Teatro ed economia nell’antica Grecia: Scopo del progetto è un’indagine approfondita del lessico dell’economia e della politica nel teatro del V e IV secolo a.C. e, in una seconda fase, nei testi di oratoria coevi. Attraverso gli strumenti delle Digital Humanities (in particolare, della semantica distribuzionale e del topic mining) si fornirà un’analisi semantica e tematica delle occorrenze individuate, non soltanto per definire un nuovo quadro interpretativo, ma per contribuire a una storia culturale dell’antichità, secondo due delle più rilevanti e affascinanti direttrici.
Sentiment Analysis e Gender Studies: Il progetto vuole indagare anche in ottica comparativa i risultati dell’applicazione di modelli di Sentiment Analysis al lessico emozionale delle donne, sia in corpora testuali in cui sono protagoniste (a partire dalla Bibbia in diverse lingue di traduzione) sia nella letteratura e nei documenti scritti dalle donne nei secoli XVI-XVIII (‘donne e saperi’).
Strumenti e tecnologie:
Modelli di Natural Language Processing (NLP) per l’analisi di testi di diversa natura e cronologia
Topic Mining per l’estrazione e l’analisi di temi ricorrenti nei testi
Sentiment Analysis per l’indagine del lessico emozionale e dei contenuti affettivi
Tecniche di analisi comparativa, interlinguistica e interculturale dei dati testuali
Strumenti di semantica distribuzionale e di analisi tematica
POSSIBILI COINVOLGIMENTI NEI PROGETTI
Analisi e annotazione di corpora testuali specifici
Sperimentazione e messa a punto di modelli di Topic Mining e Sentiment Analysis
Elaborazione di studi comparativi tra testi di epoche, lingue e contesti diversi
Creazione di dataset annotati per studi di Digital Humanities e ricerche interdisciplinari