Vai al contenuto

NoSQL

Da Wikipedia, l'enciclopedia libera.
Versione del 13 giu 2014 alle 11:32 di Vitalij zad (discussione | contributi) (Aggiungo una nota ed un riferimento al teorema CAP)

Template:Avvisounicode NoSQL è un movimento che promuove sistemi software dove la persistenza dei dati è caratterizzata dal fatto di non utilizzare il modello relazionale, di solito usato dai database tradizionali (RDBMS). L'espressione NoSQL fa riferimento al linguaggio SQL, che è il più comune linguaggio di interrogazione dei dati nei database relazionali, qui preso a simbolo dell'intero paradigma relazionale.

Questi archivi di dati il più delle volte non richiedono uno schema fisso (schemaless), evitano spesso le operazioni di unione (join) e puntano a scalare in modo orizzontale. Gli accademici e gli articoli si riferiscono a queste basi di dati come memorizzazione strutturata (structured storage).

Etimologia del termine

Il termine NoSQL fu usato per la prima volta nel 1998 per una base di dati relazionale open source che non usava un'interfaccia SQL. L'autore Carlo Strozzi, dichiarò che "come movimento, NoSQL diparte in modo radicale dal modello relazionale, e quindi andrebbe chiamato in modo più appropriato NoREL, o qualcosa di simile"[1].

All'opposto di quanto si potrebbe pensare, il movimento NOSQL non è contrario all'utilizzo di database relazionali. Il termine NOSQL infatti è acronimo di Not Only SQL, a significare che esistono diversi casi d'uso per i quali il modello relazionale rappresenta una forzatura, ma tanti altri per i quali tale modello è ancora la soluzione migliore.

Il termine fu riutilizzato nel 2009 da un dipendente di Rackspace, Eric Evans, quando Johan Oskarsson di Last.fm volle organizzare un evento per discutere di basi di dati distribuite open source[2]. Il nome era un tentativo per etichettare il crescente numero data base non relazionali e distribuiti che spesso non forniscono le classiche caratteristiche di Atomicità, Coerenza, Isolamento e Durabilità ACID. Il motivo per il quale tali caratteristiche non venivano fornite è il cosiddetto Teorema CAP.

Implementazioni

Implementazioni degne di nota sono BigTable di Google e Dynamo di Amazon.com, e le varianti open source come HBase e Cassandra.

Tassonomia

Le implementazioni di NoSQL possono essere categorizzate dal tipo di modello dei dati adottato. Segue una descrizione delle categorie più diffuse.

Database orientate al documento

Lo stesso argomento in dettaglio: Base di dati orientata al documento.

Una Base di dati orientata al documento è un programma per applicazioni orientate al documento. Questi sistemi potrebbero essere implementati come strato sopra un database relazionale o a oggetti.

Le basi di dati orientate al documento non memorizzano i dati in tabelle con campi uniformi per ogni record come nei database relazionali, ma ogni record è memorizzato come un documento che possiede determinate caratteristiche. Qualsiasi numero di campi con qualsiasi lunghezza può essere aggiunto al documento. I campi possono anche contenere pezzi multipli di dati.

Alcuni esempi di basi dati di questo tipo sono:

Database a grafo

Lo stesso argomento in dettaglio: Base di dati a grafo.

Una base di dati a grafo usa nodi e archi per rappresentare e archiviare l'informazione. La rappresentazione dei dati mediante grafi offre un'alternativa al modello relazionale che fa uso di tabelle, ai database orientati al documento (che usano documenti), o altri, come i sistemi ad archivi strutturati (structured storage) basati su colonne o su cesti non interpretati di dati.

I database a grafo sono spesso più veloci di quelli relazionali nell'associazione di set di dati, e mappano in maniera più diretta le strutture di applicazioni orientate agli oggetti. Scalano più facilmente a grandi quantità di dati e non richiedono le tipiche e onerose operazioni di unione (join). Dipendono meno da un rigido schema entità-relazione e sono molto più adeguati per gestire dati mutevoli con schemi evolutivi. Al contrario, i database relazionali sono tipicamente più veloci nell'eseguire le stesse operazioni su un grande numero di dati.

Alcuni esempi di basi dati di questo tipo sono:

Chiave/valore archiviato su disco

Chiave/valore cache in RAM

Valore/chiave Eventually‐consistente

Chiave-valore che conserva mediante l'implementazione di Paxos

Chiave-valore ordinato

Basi di dati multivalore

Database ad oggetti

Lo stesso argomento in dettaglio: Base di dati ad oggetti.

Un modello di banca dati ad oggetti è un modello in cui l'informazione è rappresentata in forma di oggetti come nei linguaggi di programmazione ad oggetti.

Le banche dati ad oggetti sono situate in un mercato di nicchia rispetto al modello relazionale (RDBMS). Vennero prese in considerazione sin dagli anni ottanta e novanta, ma ebbero uno scarso impatto commerciale e vennero usate solo in campi specifici.

I campi d'applicazione sono: ingegneria, banche dati spaziali, telecomunicazioni, e aree scientifiche come la fisica delle alte energie e la biologia molecolare.

I database ad oggetti detengono il record per la più grande base di dati al mondo (essendo il primo a contenere oltre 1000 TB allo Stanford Linear Accelerator Center) e il più alto tasso di assorbimento mai registrato per un database commerciale di oltre 1 TB per un'ora.

Un altro gruppo di database a oggetti si focalizza sull'uso in sistemi real time.

Alcuni esempi di basi dati di questo tipo sono:

Tabulare

Archiviazione in tuple

Sconosciuto

Voci correlate

Collegamenti esterni

  Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica