Ma perché un Data warehouse e non ad esempio un Database?
Perchè un Database (ovvero un RDBMS) memorizza informazioni in tempo reale su una parte particolare della tua attività: il suo compito principale è elaborare le transazioni quotidiane che la tua azienda effettua, ad esempio, registrare quali articoli hanno venduto. I database gestiscono molto bene e rapidamente un enorme volume di query semplici.
Cos’è un data warehouse?
Di contro, un Data Warehouse è un sistema che non viene aggiornato in tempo reale, ma raccoglie e storicizza un’enorme mole di dati da molte origini diverse con il fine ultimo di analizzare i dati e produrre report.
E’ quindi specializzato nell’esecuzione di query complesse su enormi dataset.
I Database utilizzano OLTP (OnLine Transactional Processing) per eliminare, inserire e aggiornare rapidamente un gran numero di record. Questo tipo di elaborazione risponde immediatamente alle richieste degli utenti e quindi viene utilizzato per elaborare le operazioni quotidiane di un’azienda in tempo reale. Ad esempio, se un utente desidera prenotare una camera d’albergo utilizzando un modulo di prenotazione online, il processo viene eseguito con OLTP.
I Data Warehouse utilizzano l’OLAP (OnLine Analytical Processing) per analizzare rapidamente enormi volumi di dati. Questo processo offre agli analisti il potere di esaminare i dati da diversi punti di vista. Ad esempio, anche se il tuo database registra i dati di vendita per ogni minuto di ogni giorno, potresti semplicemente voler conoscere l’importo totale venduto ogni giorno. Per fare ciò, è necessario raccogliere e sommare i dati di vendita per ogni giorno. OLAP è progettato specificamente per farlo e lo utilizza per il data warehousing 1000 volte più velocemente rispetto a quando si utilizza OLTP per eseguire lo stesso calcolo.