Apache Sqoop
Sqoop est une interface en ligne de commande de l'application pour transférer des données entre des bases de données relationnelles et Hadoop.[1] Il prend en charge le chargement différentiels d'une seule table ou d'une requête SQL ainsi que des tâches enregistrées qui peuvent être exécutées plusieurs fois pour importer les mises à jour effectuées dans une base de données depuis la dernière importation. Les imports peuvent également être utilisés pour remplir les tables dans Hive ou HBase.[2] les Exportations peuvent être utilisés pour mettre les données de Hadoop dans une base de données relationnelle. Le nom Sqoop est un mot valise constitué de sql et de hadoop.En Mars 2012 Sqoop est devenu un projet haut niveau d'Apache .[3]
Informatica fournit un connecteur[[{{{1}}}|{{{1}}}]]
pour Sqoop à partir de la version 10.1. Informatica prend en charge à la fois les actions d'Importation et celles d'Exportation, qui sont souvent utilisé pour l'Intégration de Données dans d'Hadoop.
Pentaho fournit également des connecteurs open source basé sur Sqoop ' Sqoop Importat[4] et Sqoop à Export[5] ) dans leur ETL depuis la version 4.5 du logiciel.[6] Microsoft utilise un connecteur basé sur Sqoop pour aider le transfert des données à partir de Microsoft SQL Server vers les bases de données de Hadoop.[7] Couchbase, Inc. fournit également un connecteur Couchbase Server-Hadoop par le biais de Sqoop.[8]
En 2015, Ralph Kimball décrit Sqoop comme suit, sous le titre The Future of ETL:[9]
Voir aussi
Références
- ↑ "Hadoop: Apache Sqoop".
- ↑ "Apache Sqoop - Overview".
- ↑ "Apache Sqoop Graduates from Incubator".
- ↑ "Sqoop Import".
- ↑ "Sqoop Export".
- ↑ "Big Data Analytics Vendor Pentaho Announces Tighter Integration with Cloudera; Extends Visual Interface to Include Hadoop Sqoop and Oozie".
- ↑ "Microsoft SQL Server Connector for Apache Hadoop".
- ↑ "Couchbase Hadoop Connector".
- ↑ Kimball, Ralph (2015-12-01).
Liens externes