Aller au contenu

Apache Sqoop

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 9 novembre 2016 à 12:09 et modifiée en dernier par Wikpan (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.

Sqoop est une interface en ligne de commande de l'application pour transférer des données entre des bases de données relationnelles et Hadoop.[1] Il prend en charge le chargement différentiels d'une seule table ou d'une requête SQL ainsi que des tâches enregistrées qui peuvent être exécutées plusieurs fois pour importer les mises à jour effectuées dans une base de données depuis la dernière importation. Les imports peuvent également être utilisés pour remplir les tables dans Hive ou HBase.[2] les Exportations peuvent être utilisés pour mettre les données de Hadoop dans une base de données relationnelle. Le nom Sqoop est un mot valise constitué de sql et de hadoop.En Mars 2012 Sqoop est devenu un projet haut niveau d'Apache .[3]

Informatica fournit un connecteur[[{{{1}}}|{{{1}}}]] Page d'aide sur l'homonymie pour Sqoop à partir de la version 10.1. Informatica prend en charge à la fois les actions d'Importation et celles d'Exportation, qui sont souvent utilisé pour l'Intégration de Données dans d'Hadoop.

Pentaho fournit également des connecteurs open source basé sur Sqoop ' Sqoop Importat[4] et Sqoop à Export[5] ) dans leur ETL  depuis la version 4.5 du logiciel.[6] Microsoft utilise un connecteur basé sur Sqoop pour aider le transfert des données à partir de Microsoft SQL Server vers les bases de données de Hadoop.[7] Couchbase, Inc. fournit également un connecteur Couchbase Server-Hadoop par le biais de Sqoop.[8]

En 2015, Ralph Kimball décrit Sqoop comme suit, sous le titre The Future of ETL:[9]

Voir aussi

Références

Liens externes