martedì 25 novembre 2008

Multidimentional Cube, Slice & Dice, Roll Up, Drill Down, Filtering, Pivoting

Il termine cubo multidimensionale indica l’espansione di una tabella che registra singoli eventi. Tale espansione è basata sulle colonne che l’utente può voler analizzare, denominate dimensioni. Il cubo è, infatti, un set di risultati contenente una tabella incrociata di tutte le possibili combinazioni delle dimensioni.

La creazione di un database OLAP (On-Line Analytical Processing) consiste nell'effettuare una fotografia di informazioni (ad esempio quelle di un database relazionale) in un determinato momento e trasformare queste singole informazioni in dati multidimensionali.

Una struttura OLAP, in pratica, raccchiude un insieme di tecniche software per l'analisi interattiva e veloce di grandi quantità di dati, che è possibile esaminare in modalità piuttosto complesse ed è proprio per questo che essa viene chiamata "cubo" multidimensionale. Ci sono diversi modi per creare un cubo, ma il più conosciuto è quello che utilizza uno schema "a stella": al centro c’è la tabella dei "fatti" che elenca i principali elementi su cui sarà costruita l’interrogazione e collegate a questa tabella ci sono varie tabelle delle "dimensioni" che specificano come saranno aggregati i dati.

Per esempio, un archivio clienti può essere raggruppato per città, provincia, regione; questi clienti possono essere relazionati con i prodotti ed ogni prodotto può essere raggruppato per categoria.

Il calcolo delle possibili combinazioni di queste aggregazioni forma una struttura OLAP che, potenzialmente, potrebbe contenere tutte le risposte per ogni singola combinazione. In realtà, viene memorizzato solo un numero predeterminato di combinazioni, mentre le rimanenti vengono ricalcolate solo al momento in cui quella richiesta viene materialmente effettuata.

Gli strumenti OLAP hanno come obiettivo la performance nella ricerca e il raggiungimento di un'ampiezza di interrogazione quanto più grande possibile.
Eseguendo successivamente delle interrogazioni sui dati strutturati in questa maniera è possibile ottenere risposte in tempi decisamente ridotti rispetto alle stesse operazioni effettuate su altre tipologie di database.


Le funzioni di base di uno strumento OLAP sono:

Slice & Dice.
Funzionalità che consente di ristrutturare le informazioni in modo da renderne più efficace la visualizzazione: creazione di master-detail e rotazione degli assi delle rappresentazioni a matrice.

Roll-up (drill- up).
Esegue aggregazioni delle misure per riduzione di dimensioni o per generalizzazione dei valori nella gerarchia.

Drill Down.
Tecnica usata nell'ambito del data mining per condurre analisi multidimensionali. Essa rappresenta, infatti, la capacità di penetrare nei dati a diversi livelli di gerarchie. Tabelle relazionali e multidimensionali drill-down sono tabelle che permettono con un semplice click del mouse di scendere ad un ulteriore livello di specificità.

Filtering.
Funzione ideata per selezionare una parte dei dati in modo da dare una risposta utile all'utente in modo diretto o in modo indiretto, migliorando la funzione di ricerca.

Pivoting. Si tratta della funzione che consente la creazione di tabelle pivot. Nel caso di un DB OLAP si ha una particolare configurazione di tabella pivot, la quale viene chiamata ipercubo OLAP ed è il report che risulta da una query OLAP su un ipercubo di dati. L'ipercubo è formato da un dato, e da un numero arbitrario di dimensioni di analisi e ogni dato è identificato da una tupla di valori, uno per ogni dimensione di analisi, o caratteristica di analisi; ogni caratteristica può essere rappresentata con un asse cartesiano.

Nessun commento: