HomeScenariLa gerarchia di storage

La gerarchia di storage

Leggi le riviste ⇢

Ti potrebbero interessare ⇢

La Redazione

Incrementare la qualità del servizio, ridurre i costi di storage ma anche ottimizzare la sicurezza con differenti livelli di protezione dei dati, coerenti con la loro tipologia.

 Lo storage su più livelli, o Tiered Storage, consiste nell’assegnare differenti categorie di dati a diverse tipologie di sistemi di memorizzazione (storage media) considerando da un lato le performance e i costi dei media, e dall’altro la dinamica associata ai dati: quelli cui si accede più frequentemente sono allocati in storage più performanti, quelli più raramente utilizzati in storage più economici, a performance più limitate. Alla tematica Tiered Storage ci si riferisce anche con la dizione HMS, Hierarchical Storage Management, che più propriamente indica la gestione del backup e dell’archiviazione di file secondo una politica di ottimizzazione economica di dispositivi di storage senza che l’utente debba sapere quale media usare per recuperare o memorizzare un dato, con automatismi che spostano dato “vecchio” in una diversa forma di storage, più lenta ma meno costosa, liberando spazio per dati a più alta dinamica.

Evoluzione dello storage su più livelli

Si inizia a parlare di Tiered Storage negli anni ’90, con un modello a tre livelli in cui i dati entravano in Tier 1 (dischi RAID, Redundant Array of Independent Disks), spostandosi nel Tier 2 (Storage Area Network convenzionali) e infine nel Tier 3 (dischi ottici, nastri magnetici) come dati “aged”. Questa semplificazione, che non teneva però conto delle specificità dei contesti e delle applicazioni, era anche abbastanza corretta secondo la regola 80/20: il 20% dei dati più recenti richiama l’80% degli accessi. Il problema è semmai nella tempistica, cioè dopo quanto tempo un dato diventa vecchio e non merita più di permanere in storage performanti e costosi, e la questione ha assunto oggi rilevanza con la crescita esponenziale dei dati con cui le organizzazioni devono confrontarsi. L’evoluzione del tiering è stata a lungo bloccata da alcune criticità: mancanza di strumenti per classificare in modo automatico i dati; carenza di strumenti di gestione delle policy specifiche delle aziende; immatutità della virtualizzazione dello storage; assenza di supporto ad ambientazioni di storage eterogeneo. Anche se resta una debolezza sul fronte della classificazione automatica dei dati, la situazione è cambiata, con passaggio a un five-tier model, che aggiunge Tier 4, per archiviazione a lungo termine e soprattutto il Tier 0, per soddisfare esigenze specializzate.

L’attuale approccio al Tiering

Prima di tutto una nota su Tiering e Caching, tecnologie di storage spesso usate in modo intercambiabile: i “Tiered Data” risiedono sempre in un certo medium, per poi spostarsi su media diversi al modificarsi della frequanza di accesso, mentre il Caching crea una copia temporanea dei dati in un medium a elevate performance, come le memorie RAM o quelle a stato solido, per aumentare le performance di una CPU. Passando al Tiering, il Tier 0, il più costoso e performante, è dedicato a dati time sensitive e di alto valore che devono essere catturati, analizzati e presentati alla massima velocità possibile: i media tipici sono memorie e dischi a stato solido con elevato IOPS (operazioni di input/output al secondo). Il Tier 1, per dati applicativi mission critical, è spesso implementato in tecnologia Fibre Channel per trasmissione gigabit tra server e dispositivi di storage condivisi, tipicamente sistemi a dischi ad alta velocità.  Dopo l’esaurimento delle applicazioni, i dati possono migrare nel Tier 2, dove importa più lo spazio di memoria che non la velocità di risposta, con tecnologia tipica i disk array SATA (Serial Advanced Technology Attachment). Nel Tier 3 trovano allocazione dati di poco frequente accesso ma ancora importanti per analisi di trend e supporto decisionale, quindi-semi attivi. I media tipici sono i dischi ottici o i nastri magnetici, questi ultimi sostituiti oramai dalla tecnologia MAID, Massive Array of Idle Disks, di elevata capacità. Il viaggio dei dati, col tempo, si conclude al Tier 4, che si presenta come tipica ambientazione Cloud, in genere pubblica.

La gerarchia di storage - Ultima modifica: 2017-05-07T15:15:09+02:00 da La Redazione