Join (SQL)
Il JOIN
è una clausola del linguaggio SQL che serve a combinare le tuple di due o più relazioni di un base di dati. Lo standard ANSI definisce alcune specifiche per il linguaggio SQL sul tipo di JOIN
da effettuare: INNER
, FULL
, LEFT
e RIGHT
, alle quali diversi DBMS aggiungono CROSS
. In alcuni casi è possibile che una tabella possa essere combinata con se stessa, in questo caso si parlerà di self-join.
Tabelle di esempio
Tutti gli esempi che verranno riportati di seguito faranno uso delle seguenti due tabelle
Cognome | ID_dipartimento |
---|---|
Rossi | 31 |
Bianchi | 33 |
Mancini | 33 |
Santoro | 34 |
Monti | 34 |
Grassi | Null
|
ID_dipartimento | Nome_dipartimento |
---|---|
31 | Vendite |
33 | Tecnico |
34 | Risorse umane |
35 | Promozione |
Dipartimenti.ID_dipartimento
è la chiave primaria che ha una cardinalità 0:n nei confronti del campo Impiegati.ID_dipartimento
Nota: Il dipartimento "Promozione" della tabella "Dipartimenti" non ha alcuna corrispondenza nella tabella "Impiegati". Mentre l'impiegato "Grassi" non è stato assegnato ad alcun dipartimento (Null
).
Inner join
Una inner join crea una nuova tabella combinando i valori delle due tabelle di partenza (A and B) basandosi su una certa regola di confronto. La query compara ogni riga della tabella A con ciascuna riga della tabella B cercando di soddisfare la regola di confronto definita. Quando la regola di join viene soddisfatta, i valori di tutte le colonne delle tabelle A e B vengono combinate in un'unica riga nella costruzione della tabella risultante. La inner join è la forma di join usata più di frequente nelle applicazioni e rappresenta la modalità predefinita.
Per esempio, la seguente query unirà le due tabelle Impiegati e Dipartimenti usando la chiave primaria ID_dipartimento che è la colonna presente in entrambe le tabelle. Quando ID_dipartimento corrisponde in entrambe le tabelle (ovvero la regola è soddisfatta), la query combinerà le colonne Cognome, ID_dipartimento e Nome_dipartimento in un'unica riga per la tabella risultante.
Esempio di inner join in forma esplicita:
SELECT *
FROM Impiegati
INNER JOIN Dipartimenti
ON Impiegati.ID_dipartimento = Dipartimenti.ID_dipartimento
che equivale a:
SELECT *
FROM Impiegati, Dipartimenti
WHERE Impiegati.ID_dipartimento = Dipartimenti.ID_dipartimento
Risultato della query di Inner join:
Impiegati.Cognome | Impiegati.ID_dipartimento | Dipartimenti.Nome_dipartimento | Dipartimenti.ID_dipartimento |
---|---|---|---|
Santoro | 34 | Risorse umane | 34 |
Bianchi | 33 | Tecnico | 33 |
Monti | 34 | Risorse umane | 34 |
Mancini | 33 | Tecnico | 33 |
Rossi | 31 | Vendite | 31 |
Nota l'impiegato "Grassi" e il dipartimento "Promozione" non sono presenti in quanto l'impiegato Grassi ha un Null
mentre Promozione non compare in nessun impiegato. A volte come risultato finale si desidera avere anche i record che non hanno corrispondenza: in tal caso è possibile usare la query di tipo Outer join.
Equi-join
La equi-join, altrimenti conosciuta come equijoin, ha un particolare tipo di comparatore, detto theta join, che utilizza come metodo di verifica, solamente l'uguaglianza matematica come regola di confronto. Usare altri operatori di confronto (come ad esempio <
) squalifica la join come equi-join. La query riportata di seguito utilizza una equi-join:
SELECT *
FROM Impiegati
INNER JOIN Dipartimenti
ON Impiegati.ID_dipartimento = Dipartimenti.ID_dipartimento
SQL fornisce una scorciatoia per definire le equi-joins, attraverso la keyword USING
SELECT *
FROM Impiegati
INNER JOIN Dipartimenti
USING (ID_dipartimento)
La keyword USING
è supportata da Microsoft SQL Server Management Studio, MySQL, Oracle, PostgreSQL, SQLite, e DB2/400.
Natural join
Una natural join offre ulteriori specializzazioni di equi-join. Solitamente la join confronta colonne di tabelle diverse che hanno lo stesso nome. La natural join fa proprio questo.
Nell'esempio che segue viene riportata la notazione natural join equivalente alla prima inner-join definita:
SELECT *
FROM Impiegati NATURAL JOIN Dipartimenti
ID_dipartimento | Impiegati.Cognome | Dipartimenti.Nome_dipartimento |
---|---|---|
34 | Monti | Risorse umane |
33 | Bianchi | Tecnico |
34 | Santoro | Risorse umane |
33 | Mancini | Tecnico |
31 | Rossi | Vendite |
Cross join
Una cross join, cartesian join o product fornisce le basi (le infrastrutture informatiche) attraverso cui tutti i tipi di inner join operano. Il risultato di una cross join è il prodotto cartesiano di tutte le righe delle tabelle che concorrono alla query di join. È come dire che stiamo facendo una inner join senza impostare la regola di confronto o in cui la regola di confronto ritorna sempre vero.
Date le due tabelle di partenza A e B, la cross join si scrive A × B.
Esempio di cross join esplicito:
SELECT *
FROM Impiegati CROSS JOIN Dipartimenti
Altro esempio implicito di cross join:
SELECT *
FROM Impiegati, Dipartimenti;
Impiegati.Cognome | Impiegati.ID_dipartimento | Dipartimenti.Nome_dipartimento | Dipartimenti.ID_dipartimento |
---|---|---|---|
Rossi | 31 | Vendite | 31 |
Bianchi | 33 | Vendite | 31 |
Mancini | 33 | Vendite | 31 |
Monti | 34 | Vendite | 31 |
Santoro | 34 | Vendite | 31 |
Grassi | Null |
Vendite | 31 |
Rossi | 31 | Tecnico | 33 |
Bianchi | 33 | Tecnico | 33 |
Mancini | 33 | Tecnico | 33 |
Monti | 34 | Tecnico | 33 |
Santoro | 34 | Tecnico | 33 |
Grassi | Null |
Tecnico | 33 |
Rossi | 31 | Risorse umane | 34 |
Bianchi | 33 | Risorse umane | 34 |
Mancini | 33 | Risorse umane | 34 |
Monti | 34 | Risorse umane | 34 |
Santoro | 34 | Risorse umane | 34 |
Grassi | Null |
Risorse umane | 34 |
Rossi | 31 | Promozione | 35 |
Bianchi | 33 | Promozione | 35 |
Mancini | 33 | Promozione | 35 |
Monti | 34 | Promozione | 35 |
Santoro | 34 | Promozione | 35 |
Grassi | Null |
Promozione | 35 |
Outer join
Una outer join non richiede che ci sia corrispondenza esatta tra le righe di due tabelle. La tabella risultante da una outer join trattiene tutti quei record che non hanno alcuna corrispondenza tra le tabelle. Le outer join si suddividono in left outer join, right outer join, e full outer join, in base a quale sia la tabella di cui intendiamo trattenere i valori in caso di mancata corrispondenza della regola di confronto da (sinistra, destra, o entrambi).
(In questo caso left (sinistra) e right (destra) si riferiscono ai due lati della keyword JOIN
.)
NOTA sulle clausole WHERE e ON:
Si sottolinea come esista un ordine di esecuzione tra le condizioni specificate nella WHERE e quelle presenti nella ON.
Specificatamente le clausole presenti nella ON sono valutate ANTERIORMENTE all'esecuzione del join mentre le clausole nella where sono valutate SUCCESSIVAMENTE all'esecuzione del join.
Left outer join
Il risultato di una query left outer join (o semplicemente left join) per le tabelle A e B contiene sempre tutti i record della tabella di sinistra ("left") A, mentre vengono estratti dalla tabella di destra ("right") B solamente le righe che trovano corrispondenza nella regola di confronto della join. Questo significa che se la clausola ON
trova 0 (zero) righe in B, la join mostrerà una riga risultante con valore NULL in tutte le colonne corrispondenti al risultato per le colonne di B.
Esempio di una left outer join:
SELECT *
FROM Impiegati LEFT OUTER JOIN Dipartimenti
ON Impiegati.ID_dipartimento = Dipartimenti.ID_dipartimento
Impiegati.Cognome | Impiegati.ID_dipartimento | Dipartimenti.Nome_dipartimento | Dipartimenti.ID_dipartimento |
---|---|---|---|
Bianchi | 33 | Tecnico | 33 |
Rossi | 31 | Vendite | 31 |
Santoro | 34 | Risorse umane | 34 |
Monti | 34 | Risorse umane | 34 |
Grassi | Null |
Null |
Null
|
Mancini | 33 | Tecnico | 33 |
Right outer join
Una right outer join (o right join) semplicemente ricalca il funzionamento della left outer join, ma invertendo l'ordine delle tabelle interessate.
Il risultato di una query right outer join per le tabelle A e B contiene sempre tutti i record della tabella di destra ("right") B, mentre vengono estratti dalla tabella di sinistra ("left") A solamente le righe che trovano corrispondenza nella regola di confronto della join. Questo significa che se la clausola ON
trova 0 (zero) righe in A, la join mostrerà una riga risultante con valore NULL in tutte le colonne corrispondenti al risultato per le colonne di A.
Esempio di una right outer join:
SELECT *
FROM Impiegati RIGHT OUTER JOIN Dipartimenti
ON Impiegati.ID_dipartimento = Dipartimenti.ID_dipartimento
Impiegati.Cognome | Impiegati.ID_dipartimento | Dipartimenti.Nome_dipartimento | Dipartimenti.ID_dipartimento |
---|---|---|---|
Monti | 34 | Risorse umane | 34 |
Bianchi | 33 | Tecnico | 33 |
Santoro | 34 | Risorse umane | 34 |
Mancini | 33 | Tecnico | 33 |
Rossi | 31 | Vendite | 31 |
Null |
Null |
Promozione | 35 |
In pratica sono utilizzate maggiormente le query di left outer join rispetto a quelle di right outer join, ma possono verificarsi rari casi in cui in query molto complesse ci sia la necessità di utilizzare contemporaneamente il criterio di left outer join e di right outer join.
Lo stesso risultato della precedente right outer join si può ripetere usando il tipo left outer join:
SELECT *
FROM Dipartimenti LEFT OUTER JOIN Impiegati
ON Impiegati.ID_dipartimento = Dipartimenti.ID_dipartimento
Full outer join
Una full outer join combina i risultati delle due tabelle A e B tenendo conto di tutte le righe delle tabelle, anche di quelle che non hanno corrispondenza tra di loro.
Il risultato di una query full outer join per le tabelle A e B contiene sempre tutti i record della tabella di sinistra ("left") A, estraendo dalla tabella di destra ("right") B solamente le righe che trovano corrispondenza nella regola di confronto della join; inoltre verranno estratti tutti i record della tabella di sinistra ("left") A che non trovano corrispondenza nella tabella di destra ("right") B impostando a NULL i valori di tutte le colonne della tabella B e tutti i record della tabella di destra ("right") B che non trovano corrispondenza nella tabella di sinistra ("left") A impostando a NULL i valori di tutte le colonne della tabella A.
Esempio di una full outer join:
SELECT *
FROM Impiegati
FULL OUTER JOIN Dipartimenti
ON Impiegati.ID_dipartimento = Dipartimenti.ID_dipartimento
Impiegati.Cognome | Impiegati.ID_dipartimento | Dipartimenti.Nome_dipartimento | Dipartimenti.ID_dipartimento |
---|---|---|---|
Monti | 34 | Risorse umane | 34 |
Bianchi | 33 | Tecnico | 33 |
Santoro | 34 | Risorse umane | 34 |
Grassi | Null |
Null |
Null
|
Mancini | 33 | Tecnico | 33 |
Rossi | 31 | Vendite | 31 |
Null |
Null |
Promozione | 35 |
Alcuni database (come ad esempio MySQL) non supportano direttamente questa funzionalità, ma la si può emulare attraverso la combinazione di left e right outer join per mezzo della keyword union.
La creazione di una query di full outer join si realizzerà come segue:
SELECT *
FROM Impiegati
LEFT JOIN Dipartimenti
ON Impiegati.ID_dipartimento = Dipartimenti.ID_dipartimento
UNION
SELECT *
FROM Impiegati
RIGHT JOIN Dipartimenti
ON Impiegati.ID_dipartimento = Dipartimenti.ID_dipartimento
WHERE Impiegati.ID_dipartimento IS NULL
Allo stesso modo senza utilizzare nemmeno la query di right outer join:
SELECT Impiegati.*, Dipartimenti.*
FROM Impiegati
LEFT JOIN Dipartimenti
ON Impiegati.ID_dipartimento = Dipartimenti.ID_dipartimento
UNION
SELECT Impiegati.*, Dipartimenti.*
FROM Dipartimenti
LEFT JOIN Impiegati
ON Impiegati.ID_dipartimento = Dipartimenti.ID_dipartimento
WHERE Impiegati.ID_dipartimento IS NULL
Self-join
La self-join serve ad unire una tabella con se stessa.
Voci correlate
Collegamenti esterni
- Introduzione alle JOIN[collegamento interrotto] nella knowledgebase di AskMonty