Aggiunto template presentazione
[SusiTM.git] / sas.tex
blob79441468d87f488878e037002830c0f6c509fc6b
1 \chapter{Esempi di applicazioni}
4 Le maggiori aziende, incluse IBM e Microsoft, investono nella la ricerca riguardo le tecniche di text mining e sviluppano programmi per automatizzare le analisi sui dati. Sono a disposizione vari software, commerciali e non, per il text mining.
6 %TODO da espandere
8 \section{SAS Text Miner}
9 Trattandosi di software proprietario, non è stato possibile effettuare una prova di questo sistema. Riportiamo le informazioni presenti sul sito internet dell'azienda e su alcuni paper trovati in rete (\cite{SAS}) .
11 Il prezzo dell'applicazione (modulo) varia dai circa 10.000\$ per l'uso accademico ai 154,200\$ per l'uso commerciale.
12 \subsection{Overview}
14 SAS Text Miner consiste in un insieme di \textit{tools} per estrarre conoscenza da documenti testuali. Trasforma i documenti in un formato trattabile che ne facilita la classificazione, trovando associazioni tra i vari documenti, e raggruppandoli in categorie. \'E il primo software di \textit{text mining} che integra l'informazione testuale ai dati strutturati per migliorare le analisi ed essere di supporto al processo di \textit{decision making}.
16 Nella figura \ref{sas} viene fornito un esempio dei risultati ottenuti in seguito al processo di clustering di alcuni documenti.
18 \begin{figure}[ht]
19 \begin{center}
20 \includegraphics[width=120mm]{SAS2.png}
21 \caption{Esempio di clustering con SAS Text Miner}
22 \label{sas}
23 \end{center}
24 \end{figure}
27 \subsection{Differenze principali rispetto ad altri software}
28 \begin{itemize}
29 \item SAS Text Miner si integra nel più ampio sistema di analisi statistica SAS. Il beneficio è che non è necessario affrontare problemi relativi all'integrazione di diversi software.
30 \item Le informazioni prodotte dal modulo di text mining possono essere facilmente utilizzate da altri moduli, senza bisogno di conversioni o formattazioni.
31 \end{itemize}
35 \subsection{Caratteristiche principali}
37 Le caratteristiche principali di questo software sono le seguenti:
39 \begin{itemize}
40 \item interfaccia intuitiva ed integrata, che permette agli analisti di ridurre il tempo necessario per apprendere l'uso del software;
41 \item accesso a numerosi formati di file, anche dati web;
42 \item supporto per molteplici lingue;
43 \item avanzate funzioni di text pre-processing: spelling correction, stemming, tagging, gestione dei sinonimi, word splitting;
44 \item feature extraction e dimension reduction;
45 \item funzioni di document clustering e categorization;
46 \end{itemize}
48 \subsection{Ambiti applicativi}
49 Con tutte queste funzionalità, SAS Text Miner è uno strumento molto flessibile che può essere utilizzato per risolvere vari problemi. Di seguito sono riportati alcuni esempi di attività che possono essere svolte:
50 \begin{itemize}
51 \item filtering delle e-mail
52 \item raggruppare documenti per argomento in categorie predefinite
53 \item routing di notizie
54 \item clustering analysis di articoli di ricerca in un database
55 \item clustering analysis di sondaggi
56 \item clustering analysis di reclami dei clienti e commenti
57 \item predirre prezzi del mercato azionario dagli annunci di notizie economiche.
58 \item predirre customer satisfaction dai commenti dei clienti
59 \item predirre i costi, basandosi sui log dei call center.
60 \end{itemize}
62 \pagebreak