giovedì 11 dicembre 2008

Volendo tirare le somme...

Oggi si chiude un percorso importante, importante perchè mi ha portato a comprendere, non solo una miriade di termini e strumenti statistici e informatici lontani dal mio back ground ma, anche e soprattutto, perchè mi ha dimostrato che comunicazione e informazione in senso tecnico non vadano visti come percorsi paralleli e antitetici ma come due facce di una stessa medaglia: due momenti di un unico percorso, quello che porta alla condivisione della conoscenza, la quale diventa, ad un livello ancora più alto, saggezza o saper fare di tutti i coloro che vi partecipano.
Si tratta di un percorso che mi ha insegnato che è necessario prendere consapevolezza della tecnologia che ci circonda al fine di essere sempre e comunque degli utilizzatori critici e che il ruolo del comunicatore è sicuramente un ruolo importante, ma che le sue doti, qualora egli voglia svolgere davvero bene il proprio lavoro, non si fermano all'Ars oratoria. Il comunicare fine a stesso non ha senso.

E' solo quando l'abilità e la tecnica si uniscono ad una ricchezza di contenuti, quando la forma si unisce con la sostanza, che si crea quel connubbio perfetto che porta all'eccellenza.

E' solamente quando le diverse nozioni che apprendiamo durante i diversi percorsi della vita, distillate dall'esperienza, acquistano un senso ulteriore, quasi circolare, che ne prendiamo una reale consapevolezza. Così dall'unità, passando per la molteplicità, arriviamo ad una perfetta sintesi che, altro non è che, piena consapevolezza della coesistenza dei momenti appena trascorsi. Ed in questo processo triadico, hegelianamente parlando, prendiamo via via coscienza di noi e del nostro intorno, acquisendo saggezza, ovvero saper fare, saper vivere.
Proprio per questo vorrei chiudere questo percorso con una immagine che ha aperto questo blog ed ha silenziosamente accompagnato anche tutti i post che via via lo hanno popolato, essendone un postulato fondamentale. Si tratta di una rappresentazione biblica dell'Albero della conoscenza del bene e del male. Questo albero può essere visto come una rappresentazione allegorica di quella che circa duemila anni dopo verrà concettualizzata dal Knowledge Management come Piramide della conoscenza: solo da piccolissimi e selezionati ramoscelli, posti in cima, o meglio all'estremità, di un articolato sistema di circolazione di linfa vitale nascono i frutti. Ed il frutto, dal latino fructus, è proprio ciò che viene goduto di una cosa, qualsiasi rendita o profitto, premio o remunerazione, il giovamento che prova chi raggiunge la cima, la saggezza.


Questo è proprio l'augurio che faccio a tutti i coloro che si troveranno a diverso titolo a "navigare" per questa terra di passaggio, ovvero questo piccolo blog nato per caso: raggiungere la saggezza.

Formalizzazione dei concetti statistici di base

Come precedentemente specificato, il processo che all'interno di un'organizzazione porta alla creazione e condivisione di conoscenza è complesso e delicato, e chi vi ha a che fare deve necessariamente avere, a prescindere dal ruolo che ricopre, una certa dimistichezza, oltre che con termini e strumenti informatici, con quelli che sono concetti e strumenti statistici di base.
Ecco che una seppur sommaria formalizzazione di concetti statistici di base, già ampiamente utilizzati in questo blog, potrà tornare utile.

Carattere o variabile. Per carattere si intende qualsiasi fenomeno (o particolare aspetto di un fenomeno) che ha rilevanza nell'ambito di un particolare obiettivo. Le modalità del carattere sono, invece, i diversi modi con i quali il carattere può manifestarsi sulle varie unità statistiche. Le diverse possibilità di rappresentare le modalità dei caratteri portano alla seguente classificazione:
  1. caratteri misurabili su scala nominale qualora non esista un ordine naturale (es. tipo azienda o stato civile);
  2. caratteri misurabili su scala ordinale laddove esista un ordine in senso naturale o meno (titolo di studio, grado in un organizzazione di tipo gerarchico);
  3. caratteri misurabili su scala ad intevalli quando le modalità sono esprimibili con numeri che hanno il significato di una vera e propria misura, nella scala di misura utililzzata si può però scegliere l'origine in modo arbitrario (es. le temperature);
  4. caratteri misurabili su scala di rapporto quando le unità sono esprimibili con numeri che hanno l'ordinario significato di misura però l'origine delle misure è unica e non fissata in modo arbitrario (es. statura, reddito).
La natura dei caratteri ha implicazioni molto importanti sui metodi utilizzabili per l’elaborazione degli stessi.

Classificazione. In statistica è identificabile come l’ operazione che che permette di passare dalle proprietà alle variabili. In questo caso le categorie nelle quali vengono classificati gli stati della proprietà studiata devono rispettare tre condizioni:
  • esaustività: ogni caso deve cioè essere collocato in una delle categorie previste;
  • mutua esclusività: un caso non può essere classificato in più di una categoria;
  • unicità del fundamentum divisionis: per cui il principio che regola la scelta delle categorie deve essere quello della unidimensionalità.

Dimensioni. Numero dei parametri in base ai quali si determinano gli elementi di un insieme.

Funzioni di aggregazione. Identificano quelle funzioni che elaborano un insieme di righe ma restituiscono sempre un risultato.

Matrice dei dati. Per poter analizzare i dati con tecniche statistiche è necessario che questi vengano organizzati in base ad uno schema di classificazione comune. A tal scopo si ricorre appunto ad una matrice rettangolare di numeri, la cosiddetta matrice "Casi per Variabili" (C x V), in cui in riga sono presenti i casi, in colonna le variabili ed in ogni cella (incrocio tra riga e colonna) un dato, ossia il valore assunto da una variabile su di un particolare caso

Unità statistica.Unità elementare della popolazione statistica. Si tratta di ogni ente portatore del carattere (o dei caratteri) che può avere rilevanza nell'ambito di uno specifico obiettivo di ricerca. Può trattarsi di una persona fisica, di una persona giuridica (l'impresa), di un'istituzione (un istituto scolastico), di un evento (un matrimonio, una nevicata), ecc.. Si possono individuare vari tipi di unità statistiche: in relazione alla completezza della rilevazione, si hanno unità campionarie e unità della popolazione, in relazione alla fase dell'indagine, si hanno unità di campionamento, unità di rilevazione, unità d'informazione, unità di analisi, unità di tabulazione etc..

giovedì 4 dicembre 2008

Elementi teorici e strutturali del report

Il report, come già specificato in altri post, è un documento agile e sintetico focalizzato su quelli che sono i dati di interesse per il soggetto, o i soggetti, cui è rivolto. Proprio la sua vocazione sintetica e focalizzata obbliga i sistemi di reportistica, software creati per generare simili documenti, ad effettuare una selezione e magari anche ricombinazione di quella mole enorme di dati che un'organizzazione si trova a vario titolo a collezionare.


Per tali ragioni gli elementi che caratterizzano fortemente un report sono:

- Le matrici di dati. Rispetto ad una semplice tabella il report si contraddistingue per il fatto di essere un'aggregazione (join) di più tabelle e, dunque, un composto di dati in forma aggregata.
- Dimensioni. I report nelle loro particolari elaborazioni dei dati selezionati ed estratti dai DB finiscono col mostrare una particolare dimensione del cubo multidimensionale dei dati, ovvero una particolare vista o sezione tra le tante che possono essere estratte da un magazzino veramente grande ed eterogeneo di dati;
- Misure. Eleborazioni calcolate su unità statistiche che soddisfino la condizione di possedere una certa combinazione di modalità;
- Aggregazioni di valori, contenuti in una o più abelle attraverso delle funzioni predefinite dette appunto funzioni di aggregazione. Quest'ultime, veri e propri operatori (+, -, *, /, <, >,..), eseguono un calcolo su un insieme di valori restituendo un valore singolo e si applicano all'istruzione SQL "SELECT" con la quale possiamo appunto creare delle interrogazioni al DB di nostro interesse dette query.

martedì 2 dicembre 2008

Creazione di un Data Source con Data Time

1. Le regole per l'estrazione dei dati

Nella creazione del nostro report, un passo davvero importante è la definizione delle regole di estrazione dei dati a partire dai quali metteremo in rilievo una particolare vista del cubo multidimensionale.
Se, infatti, pensiamo anche solo un attimo al fatto che il nostro DataWarehouse è un'architettura davvero complessa e che si configura come un magazzino di dati davvero eterogenei possiamo capire la reale importanza della scelta di mettere in rilievo una dimensione piuttosto che un'altra dei dati.


A questo proposito DataTime mette a disposizione dell'utente due opzioni:

- una che potremmo definire "QIUCK", nella quale sarà il software che automaticamente definirà delle regole molto generali (di ETL ovviamente) di estrazione per il passaggio dei dati direttamente dalla tabella al report, premendo un semplice pulsante "Quick Report" con il mouse.
Si tratta di un approccio semplificato, utile per utenti non troppo esperti ma soprattutto quando il report viene realizzato a partire da un DB semplice. Nel caso di un DW complesso, invece, un simile approccio risulterebbe di certo molto riduttivo non permettendo di cogliere appieno la multidimensionalità di dati attraverso i più svariati Slice&Dice.

- nell'altra opzione, che potremmo definire "NON QUICK", sarà direttamente l'utente, attraverso la creazione di uno o più DataSource, a definire viste potenzialmente infinite di dati. Questo è l'approccio che meglio valorizza la multidimensionalità di un DataWarehouse nella resa di un report, dal momento che sarà possibile creare nel report tanti DataGrid, che pescano i dati dai differenti DataSource che abbiamo scelto di impostare, quante sono le differenti sezioni del cubo multidimensionale dei nostri dati che decidiamo di mettere in evidenza.



2. Come creare un Data Source

Creare un Data Source è molto semplice. Dopo aver creato e salvato col nome un nuovo progetto attraverso il tasto "New Project", clicchiamo su "Open Project". Si aprirà così una nuova finestra dalla quale sarà possibile, dopo aver creato la connessione col DBMS di nostro interesse (attraverso il tasto "New Connection"), scegliere l'opzione "Quick Report" oppure optare per la creazione di un DataSource attraverso il tasto "New Data Source".
Ciò che si aprirà sarà una nuova schermata, "Data Source Designer", nella quale in cima vengono visualizzati i diversi step (7 per l'esattezza) da seguire per la creazione del Data source.

Il primo passo "Design" è sicuramente il più importante e consiste nel definire le tabelle dalle quali vogliamo estrarre i dati per creare la nostra particolare vista del cubo multidimensionale. Nel caso di più tabelle selezionate (join) sarà necessario specificare la relazione che le lega. E questo sarà possibile o manualmente, trascinando il mouse da un campo all'altro della relazione, oppure col tasto destro del mouse scegliendo la prima opzione della finestra a tenda che si apre "Map DBMS Relationships on Objects on Designer Panel" e che permette appunto di visualizzare quelle che sono le relazioni memorizzate nel DB. Ovviamente per i più esperti sarà possibile utilizzare direttamente la sintassi SQL.
Una volta selezionati i campi, provato e salvato il risultato, sarà possibile passare alle fasi successive.
Soprattutto merita rilievo la fase 6 "Manual Refine" nella quale sarà possibile definire nello specifico quelle che sono le rifiniture delle nostre tabelle e dei rispettivi grafici correlati.
Una volta creato il o i Data Source di nostro interesse sarà possibile dedicarsi alla creazione del report nello specifico, il quale conterrà tanti Data Grid, ovvero griglie di dati, che vanno a pescare le informazioni da quelli che sono i Data Source salvati.

lunedì 1 dicembre 2008

Reporting, Elementi stilistici e Charting con Data Time

Le soluzioni di reportistica fornite da DataTime si caratterizzano anche per la grande flessibilità e il forte impatto visivo dei suoi grafici 3D. Il sistema di rappresentazione grafica di DataTime è, infatti, oggi il più avanzato e potente sul mercato.

Il charting di DataTime dispone di un motore di rendering 3D che permette la massima flessibilità nel posizionamento e nella strutturazione dei grafici 3D. I grafici godono della massima flessibilità e modellabità, offrendo all'utente la possibilità di sezionarli e definirli a proprio piacimento. I chart sono collegati direttamente con i dati di riferimento e questo fa sì che i primi riflettano costantemente i secondi in quelle che sono le rigenerazioni drill dell'utente.
Datatime consente, inoltre, di creare cruscotti personalizzati, i cosiddetti "Dashboards", che superano i canonici strumenti della cruscottistica poichè permettono all'utente di creare personalmente i propri gauges. Ovviamente anche i cruscotti sono linkabili direttamente ai dati ai quali si riferiscono.

Più nello specifico...

Dalla finestra di "report composer" è possibile inserire: testi, immagini grafici e gauge con un elevato livello di personalizzazione.

  • I titoli possono essere creati attraverso la finestra "text box properties" che permette di personalizzarne elementi quali: dimensione testo, colore, carattere, allineamento, border style, ecc..

  • Lo sitle della tabella può essere modificato semplicemente con un click sul tasto destro del mouse e selezionando "grid styles". Si aprirà così una finestra "bulk style changes" dalla quale sarà possibile modificare il layout della nostra tabella attraverso il ricorso a stili predefiniti oppure sviluppandone di nuovi (tramite il tasto Bulk changes to styles).

  • DataTime da la possibilità di inserire nel nostro report una serie di immagini predefinite o personali. Anche in questo caso si tratterà di un'operazione davvero semplice: basterà cliccare sul tasto destro del mouse e selezionare nel menù a tendina "new image".

  • Potremo migliorare la comprensibilità del nostro report attraverso il ricorso a dei grafici che sarà possibile personalizzare in ogni aspetto. La schermata "Multichart designer", infatti, offre la possibilità di scegliere tra una serie di grafici bi e tridimensionali dei quali poter modificare proprietà e colori.

  • Tra gli altri elementi stilistici offerti si distinguono i gauges (cruscotti). Si tratta di un oggetto molto simile ad un grafico, ma che si differenzia da quest’ultimo per il fatto di rappresentare i valori delle singole celle (anche appartenenti a diversi ReportGrids). Anche qui le possibilità di scelta e personalizzazione sono molte. Per apportare delle modifiche sarà solamente necessario cliccare sul menù "Multigauge Designer".

Introduzione a Data Time Reporting System: un semplice report

Data Time Reporting Solution è la soluzione di reportistica open source più moderna e potente attualmente sul mercato. Esso si caratterizza per:

- Una connettività universale verso i DB. Basato, infatti, sul protocollo OleDB Data Time è in grado di connettersi a qualsiasi DBMS. Qusto significa connettiità verso Oracle, SQL Server, Access, Sybase, DB2, MySQL, ecc., ma anche fogli Excell e file di testo delimitato.

- Il sistema di reportistica più flessibile attualmente sul mercato. E' possibile creare qualunque tipo di layout con possibilità pressochè illimitate di Slice & Dice del cubo multidimensionale dei dati. E' possibile quindi realizzare:
  • Sezioni verticali e orizzontali;
  • Interruzioni orizzontali e verticali;
  • Totali su livelli multipli;
  • Drill down/Roll up sul qualsiasi livello.
I report creati sono ad alto impatto visivo dal momento che tutti gli elementi stilistici e grafici possono essere controllati dall'utente. E' inoltre possibile pubblicare i report su Web mediante due possibili architetture: Updatable, per i report destinati alla sola consultazione; e Interactive per quelli nei quali è consentito all'utente di interagire. I report web di DataTime sono altamente conformi alle specifiche del W3C e compatibili con tutti i tipi di browser.
I report sono anche esportabili su Excell e rendibili in file PDF o pagine HTML.

- Modalità di impostare le regole di estrazione dei dati customer oriented. Il motore ETL di DataTime rende, infatti, possibile scegliere tra:
  • un approccio QUICK, nel quale è lo stesso programma che si fa carico di impostare delle regole basilari per il passaggio dalla tabella dati al report;
  • un approccio NON QUICK nel quale attraverso la creazione di DataSource sarà proprio l'utente a definire nello specifico le regole di estrazione dei dati. Questo approccio consente davvero una grande flessibilità, rendendo possibile impostare un report con tanti DataGrid che pescano i dati dai più svariati DataSource.
Il potere di questo software sta proprio nella semplicità con la quale trasforma le nostre richieste ed esigenze, formulate con semplici movimenti del mouse, in articolato linguaggio SQL.

- Task di caricamento. Data Time consente di integrare DBMS eterogenei verso un DataWarehouse target.

- Schedulazione settimanale e ad eventi. Sia i report che i task di caricamento sono schedulabili ed oltre alla possibilità di realizzare la schedulazione settimanale è possibile impostare anche una schedulazione ad eventi. E' infatti possibile ad esempio far partire un determinato task caricando un certo file in una certa directory.

- Il sistema di Charting, ovvero di rappresentazione grafica, è molto potente. Esso integra un motore di rendering 3D (intendendo con rending la resa di un'imagine tridimensionale a partire dalla sua descrizione matematica attraverso algoritmi che ne definiscono il colore di ogni punto dell'immagine, la geometria, il punto di vista, l'illuminazione o le caratteristiche ottiche delle superfici) con controller a quaternioni per garantire la massima flessibilità dei grafici, i quali possono essere sezionati o riclorati a piacimento. I chart, inoltre, sono direttamente collegatai ai dati e li riflettono in maniaera costante attraverso le rigenerazioni e i drill dell'utente.

I principali tool software di query reporting: B.O., Microstrategy, Data Time

Con il termine Business Intelligence (BI), termine coniato nel 1958 da Hans Peter Luhn, ricercatore e inventore tedesco impiegato dell'IBM, ci si può solitamente riferire:

1. al PROCESSO, ovvero a un insieme di processi aziendali per raccogliere ed analizzare informazioni strategiche per le organizzazioni al fine di conseguire un vantaggio competitivo. Generalmente queste informazioni vengono raccolte per scopi direzionali interni e per il controllo di gestione, opportunamente elaborate e utilizzate per supportare concretamente, sulla base di dati attuali, le decisioni di chi occupa ruoli direzionali.

2. alla TECNOLOGIA utilizzata per realizzare questi processi. Infatti, i dati generati dai sistemi più svariati (produzione, contabilità, R&S, CRM,...) vengono archiviati in particolari DB chiamati DataWareHouse, che conservano le qualità informative. Le persone coinvolte nei processi di business intelligence sono pertanto tenute ad utilizzare applicazioni software ed altre tecnologie per RACCOGLIRE, IMMAGAZZINARE, ANALIZZARE e DISTRIBUIRE le INFORMAZIONI.

3. al RISULTATO, cioè le informazioni ottenute come prodotto di questi processi.




Tra i sistemi di REPORTISTICA più diffusi in tale ambito meritano particolare attenzione:

-Business Objects. Con circa 3.000 aziende partner in tutto il mondo e 46.000 clienti in più di 80 paesi, fondata nel 1990, è il principale fornitore mondiale di soluzioni per la BI. Essa consente alle organizzazioni di tracciare, comprendere e gestire le prestazioni aziendali, per ottenere una visione completa del proprio business, migliorare il processo decisionale e ottimizzare le prestazioni. Tutto ciò attraverso fondamentali strumenti:
  • il reporting
  • la gestione di dashboard e scorecard
  • le applicazioni per la customer intelligence
  • il reporting finanziario e le extranet rivolte sia a clienti che a partner.

Tutte queste soluzioni consentono alle aziende di ottenere visibilità sul proprio business, acquisire e mantenere relazioni profittevoli con i clienti, ridurre i costi, ottimizzare la supply chain, incrementare la produttività e migliorare le prestazioni finanziarie.


- Microstrategy. Si tratta di una società che offre soluzioni di Business Intelligence sin dal 1989, fornendo una gamma ineguagliabile di funzionalità di Monitoraggio, Reporting e Analisi tutte in una sola architettura software. Tre sono a tal proposito le parole chiave che rappresentano la mission della società: CONTROLLO, REPORT, ANALISI. Infatti, attraverso il software Microstrategy è possibile realizzare:
  1. Un controllo delle prestazioni in tempo reale, fornendo agli utenti aziendali una tecnologia che permette un monitoraggio costante delle metriche per informare e allertare i responsabili di business circa le attività in corso e le decisioni da prendere sulla base di parametri prestabiliti;
  2. Informazioni dettagliate per le decisioni operative, permettendo di ricavare informazioni preziose sulle performance passate e presenti, in modo da rilevare cosa accade nell'impresa e come procede il business. E tutto ciò attraverso una tecnologia avanzata di reporting, che consente un utilizzo davvero intuitivo da parte dell'utente, la possibilità di operare via Web e una grande scalabilità.
  3. Anali dei dati per scoprire trend significativi nelle performance aziendali, consentendo di vedere le informazioni aziendali da molte angolazioni differenti. In questo modo i manager potranno evidenziare con maggiore facilità le cause di problemi nelle performance, scoprire nuove opportunità di business e prevedere i risultati dell'azienda.

- Cognos. Si tratta di un'azienda, fondata nel 1969 e dal 2007 parte del gruppo IBM, leader a livello mondiale nel campo della Business Intelligence (BI) e del Performance Management. Essa fornisce soluzioni per migliorare le performance aziendali a tutti i livelli organizzativi (gestione delle relazioni con i clienti, analisi di vendita, controllo di gestione, pianificazione e reporting, analisi multidimensionale, applicazioni analitiche, ecc.) e le sue soluzioni sono state implementate da oltre 23.000 clienti in più di 135 Paesi.
Con il software e le soluzioni fornite da Cognos è possibile rispondere alle domande aziendali essenziali tipiche del Performance Management, ovvero: Come stiamo procedendo?, Perché? e Come dovremmo agire?
Rispondere alle suddette domande per Cognos diveta possibile offrendo:
  1. il prezioso supporto di scorecard e dashboard per monitorare le performance aziendali con sistemi di valutazione appropriati;
  2. strumenti di reporting e di analisi mirati per esaminare i dati, contestualizzarli per una panoramica più completa, approfondire e valutare le tendenze e identificare eventuali anomalie.
  3. strumenti per applicare un'accorta strategia di budgeting, pianificazione e previsione per definire e condividere una visione affidabile del futuro.

- Data Time Reporting Solution. E' un software open source diretto competitors di quelli appena sopra elencati. Si tratta della soluzione di reportistica più moderna e potente attualmente disponibile sul mercato. Gode di una notevole flessibilità, consentendo di creare Report con qualsiasi tipo di Layout (verticale, orizzontale, cross e misto), con possibilità pressoché illimitate di Slice and Dice del cubo multidimensionale dei dati. Esso riesce a creare report ad alto impatto visisvo, dove l'utente è davvero in grado di controllare tutti gli elementi grafici e stilistici ed inoltre un efficace sistema di formattazione consente di creare Alerts complessi e basati su codice utente per qualsiasi tipo di evento.

Tutti i software di query reporting sopraelencati sono sostanzialmente equivalenti nelle funzioni che mettono a disposizione dell'utente. Tutti infatti consentono flessibilità su 3 livelli operativi fondamentali:
  1. Connettività universale verso i database: ovvero la possibilità di creare report a partire da qualsiasi DBMS utilizzato per la creazione dei DB.
  2. Regole di estrazione: cioè la possibilità di creare con semplici movimenti del mouse le proprie regole generali di ETL per l'estrazione dei dati.
  3. Layout del report: overo la possibilità di impostare delle regole generali di organizzazione del layout che rimangonomemorizzate facendo sì che il report possa ripristinarsi automaticamente con l'immissione dei dati più aggiornati.