• 2 – Server ROLAP – MOLAP – HOLAP nei sistemi di data warehouse: vediamo la differenza

    Date: 2011.01.11 | Category: Analisi di Basi di Dati | Tags:

    Ci sono diversi approcci per implementare i sistemi di Data Warehouse che dipendono dal modello logico utilizzato per la rappresentazione dei dati. La scelta di un sistema piuttosto che un altro, dipende dalla distribuzione dei dati (densi o sparsi? o entrambi?). Quindi in alcuni casi può essere più conveniente utilizzare una rappresentazione relazionale tramite server ROLAP piuttosto che una rappresentazione matriciale implementata attraverso un server MOLAP. Un altro motivo che spiega l’esistenza di diversi modelli per l’implementazione è la scarsa espressività del modello relazionale, il quale non include concetti di dimensione, misura e gerarchia.

    Server ROLAP (Relational OLAP)

    Il primo è il Server ROLAP (Relational OLAP): sono i DBMS relazioni classici che sono stati estesi per rappresentare e analizzare i dati con tecniche OLAP (On-Line Analytical Processing ovvero le tecniche software per l’analisi interattiva e veloce di grandi quantità di dati). Ad esempio, i sistemi come ORACLE e DB2 hanno esteso l’SQL per essere in grado di trattare meglio la parte degli aggregati (hanno aggiunto degli aggregati in più) e si utilizzano tecniche di raggruppamento diverse e ottimizzate per questi scopi. Hanno anche aggiunto degli indici e tecniche di accesso che sono più adatti per gli aggregati.
    Quando i datawarehouse hanno iniziato a diventare un segmento di mercato importante, quindi verso il 1994-1995, i venditori di sistemi relazionali hanno cercato di adeguare la loro offerta per soddisfare queste esigenze. Questo è il comune ROLAP – Relational OLAP.

    Server MOLAP (Multidimensional OLAP)

    Un altro tipo di approccio è quello Multidimensionale – MOLAP – Multidimensional OLAP: sono sistemi che partono da dei presupposti:

    1. non ho il problema della gestione transazionale poiché non è necessaria in quanto i dati sono read-only, tranne il processo di aggiornamente che viene disaccopiato per ovviare il problema.
    2. ignoro l’SQL e tutti gli standard correlati e mi creo un rappresentazione proprietaria interna basata su una matrice che ottimizza l’accesso diretto ai dati. Questo tipo di rappresentazione, funziona molto bene quando i dati sono compatti/densi cioè quando tutte o la maggior parte delle celle della matrice sono piene altrimenti diventa inneficiente perché si allocano a priori tutte le celle della matrice stessa. Sono da evitare in situazione in cui lei Matrice è sparsa, conviene usare una lista (sistema relazionale).

    Server HOLAP (Hybrid OLAP)

    In questi server si possono utilizzare entrambi i sistemi (relazionale, multidimensionale), a seconda di cosa è conveniente. Se il dato è meno denso utilizzo il sistema relazionale altrimenti uso quello multidimensionale.

    ROLAP - MOLAP - HOLAP Server

    Link Utili