Zum Inhalt springen

DataFinder

aus Wikipedia, der freien Enzyklopädie
DataFinder

Basisdaten

Entwickler DLR-Einrichtung Simulations- und Softwaretechnik
Aktuelle Version 2.2.0
(24. Juni 2011)
Programmier­sprache Python
Lizenz Simplified BSD
github.com/DLR-SC/DataFinder

Der DataFinder ist eine freie Software zur Verwaltung wissenschaftlich-technischer Daten, die durch die DLR-Einrichtung Simulations- und Softwaretechnik entwickelt wurde. Die Einsatzzwecke umfassen Bereiche wie die Erfassung und Analyse des Flugverkehrs[1] oder Simulationen wie TRACE (Turbomachinery Research Aerodynamic Computational Environment) zur Simulation von Strömungen in Turbinen.[2]

Aufgabe des DataFinder ist es, vorhandene und neu erzeugte wissenschaftliche Daten in geeigneter Weise mit Metainformationen zu kennzeichnen, zu strukturieren und so Ordnung zu schaffen. Eine weitere Aufgabe des DataFinder ist die Integration der an diesen Arbeitsprozessen beteiligten Software-Anwendungen. Zur Strukturierung der Daten bietet der DataFinder die Möglichkeit, ein frei definierbares Datenmodell zu erstellen, in dem die wissenschaftlich-technischen Daten abgelegt werden.[3]

Das Datenmodell kann dabei vom DataFinder-Administrator frei vorgegeben werden. Weiterhin basiert die Software auf offenen, flexiblen Standards mit Zukunftsperspektive wie XML und WebDAV. Dadurch ist der DataFinder leicht erweiterbar und flexibel anpassbar.[1] Die Software erlaubt weiterhin die skriptgesteuerte Automatisierung einfacher Workflows und die Integration in weitere Plattformen.[4]

Der DataFinder ermöglicht es, Daten effizient strukturiert und organisiert zu verwalten und sie so jedem Mitarbeiter leicht zugänglich zu machen. Informationen über den Datenkontext bleiben dabei erhalten. Das System ist so ausgelegt, dass es den Anwender in seiner Arbeitsweise unterstützt – ohne die in der wissenschaftlichen Forschung notwendige Flexibilität und Dynamik der Arbeitsvorgänge zu weit einzuschränken. Dabei kann das System auch räumlich verteilte Datenquellen verarbeiten und greift dabei auf eine GridFTP-Implementierung zurück, mit der Ressourcen aus dem D-Grid erschlossen werden können.[2] Ebenso eingebunden werden können Amazon S3 Storage Cloud-Dienste oder gängige Datenbanksysteme wie MongoDB.[5]

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. a b froscon2010: DataFinder. In: Froscon 2010. FrOSCon Free and Open Source Software Conference, 29. August 2010, abgerufen am 22. Januar 2025.
  2. a b Tobias Schlauch, Andreas Schreiber: DataFinder – A Scientific Data Management Solution. Hrsg.: DLR. Oktober 2007 (researchgate.net).
  3. Simulations- und Softwaretechnik (SISTEC) - DataFinder. In: DLR.de. DLR, 25. Februar 2007, archiviert vom Original (nicht mehr online verfügbar) am 25. Februar 2007; abgerufen am 22. Januar 2025.
  4. Tobias Schlauch, Anastasia Eifer, Thomas Soddemann, Andreas Schreiber: A Data Management System for UNICORE 6. In: Euro-Par 2009 – Parallel Processing Workshops. Band 6043. Springer Berlin Heidelberg, Berlin, Heidelberg 2010, ISBN 978-3-642-14121-8, S. 353–362, doi:10.1007/978-3-642-14122-5_40 (springer.com [abgerufen am 22. Januar 2025]).
  5. Miriam Ney, Guy K. Kloss, Andreas Schreiber: Using Provenance to Support Good Laboratory Practice in Grid Environments. In: Studies in Computational Intelligence. Nr. 426, 13. Dezember 2001, doi:10.1007/978-3-642-29931-5-7 (researchgate.net).