Text & image analytics

Text & image analytics

Overview

Nell’era dei big data appaiono sempre più centrali le esigenze di trattamento dei dati non strutturati, in particolare dati provenienti dal web. Utenti e aziende pubblicano ogni giorno, sotto forma di testi, video e immagini, contenuti che possono avere un grande valore non soltanto informativo ma anche economico. Il corso ha l’obiettivo di presentare i principali aspetti metodologici e applicativi per trattare tali dati ed estrarne conoscenza utile ad analisti e decisori finali. Ci si concentrerà sulle principali problematiche legate all’analisi di tali dati: l’ambiguità del linguaggio parlato e scritto, la classificazione automatica di testi o immagini, la corretta identificazione delle opinioni e del sentiment, la scelta dei modelli di analisi più adatti al tipo di dato e di attività che si vuole avviare.

Descrizione

Il corso prevede una introduzione iniziale alla Social Media Analytics, con la quale le aziende possono monitorare il raggiungimento degli obiettivi di business con dati provenienti dal web. Seguirà la preparazione dei dati non strutturati per le successive analisi di text mining e image analytics. Si tratteranno infine algoritmi di sentiment analysis, topic extraction e classificazione su dati scaricati dal web (es. tweet, post da blog e forum, immagini).

Nella parte pratica di laboratorio si utilizzerà un software open sorce per scaricare, preparare e analizzare i dati con un approccio visuale, senza dover scrivere codice.

In particolare sarà possibile:

  • scaricare tweet in tempo reale
  • applicare tecniche di pre-processing e pruning
  • produrre word cloud e word list dei testi
  • applicare ai dati la sentiment analysis e la topic extraction

Con lo stesso software si sperimenteranno poi tecniche di image analytics, con l’obiettivo di classificare e correlare immagini.

 

Il corso è destinato a professionisti e studenti che vogliono formarsi, o aggiornarsi, sulle principali tecniche di trattamento dei dati non strutturati, ma non hanno specifiche competenze di programmazione. L’approccio visuale fornito dallo strumento adottato permette una veloce e facile comprensione delle potenzialità di queste tecniche, e nello stesso tempo fornisce molteplici possibilità di analisi e visualizzazione di dati sia strutturati sia non strutturati.

 

Prerequisiti: conoscenze dei principali social media e delle tecniche di base di navigazione in internet; conoscenze di base di informatica e di statistica.

Durata del corso

8 ore

Docente del corso

Boselli

Data del corso

9 Marzo - (09-18.00)

Costo del corso

600,00 (il pagamento effettivo avverrà solo al raggiungimento minimo di partecipanti)

Carrello