https://de.wikipedia.org/w/index.php?action=history&feed=atom&title=Apache_Hadoop
Apache Hadoop - Versionsgeschichte
2025-06-26T08:57:52Z
Versionsgeschichte dieser Seite in Wikipedia
MediaWiki 1.45.0-wmf.6
https://de.wikipedia.org/w/index.php?title=Apache_Hadoop&diff=253737717&oldid=prev
Gunnar.Kaestle: /* Kommerzieller Support und kommerzielle Forks */ BKS aufgelöst
2025-02-27T19:25:02Z
<p><span class="autocomment">Kommerzieller Support und kommerzielle Forks: </span> BKS aufgelöst</p>
<table style="background-color: #fff; color: #202122;" data-mw="interface">
<col class="diff-marker" />
<col class="diff-content" />
<col class="diff-marker" />
<col class="diff-content" />
<tr class="diff-title" lang="de">
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">← Nächstältere Version</td>
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">Version vom 27. Februar 2025, 21:25 Uhr</td>
</tr><tr>
<td colspan="2" class="diff-lineno">Zeile 107:</td>
<td colspan="2" class="diff-lineno">Zeile 107:</td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Kommerzieller Support und kommerzielle Forks ==</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Kommerzieller Support und kommerzielle Forks ==</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>Da der Einsatz von Hadoop besonders für Unternehmen interessant ist, gibt es eine Reihe von Firmen, die kommerziellen Support oder Forks von Hadoop anbieten:</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>Da der Einsatz von Hadoop besonders für Unternehmen interessant ist, gibt es eine Reihe von Firmen, die kommerziellen Support oder Forks von Hadoop anbieten:</div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>* [[Cloudera]] stellt mit CDH eine „enterprise ready“ Open-Source-Distribution für Hadoop bereit (aktuelle Version: CDH 6.0.0<ref>https://www.cloudera.com/downloads/cdh/6-0-0.html</ref>). Anfang 2019 wurde der andere große BigData-Distribution-Anbieter [[Hortonworks]] integriert.<ref>{{cite web | url=https://www.cloudera.com/about/news-and-blogs/press-releases/2019-01-03-cloudera-and-hortonworks-complete-planned-merger.html | title=Cloudera and Hortonworks Complete Planned Merger | quote='' Cloudera, Inc. (NYSE: CLDR), the enterprise data cloud company, today announced completion of its merger with Hortonworks, Inc. Cloudera will deliver the first enterprise data cloud - unlocking the power of any data, running in any cloud from the Edge to AI, on a 100% open-source data platform'' | author=Cloudera | date=2019-01-03 | accessdate=2019-09-22|language=en}}</ref> Hortonworks stammt ursprünglich aus einer Auskopplung von [[Yahoo]] und Benchmark Capital.</div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>* [[Cloudera]] stellt mit CDH eine „enterprise ready“ Open-Source-Distribution für Hadoop bereit (aktuelle Version: CDH 6.0.0<ref>https://www.cloudera.com/downloads/cdh/6-0-0.html</ref>). Anfang 2019 wurde der andere große BigData-Distribution-Anbieter [[Hortonworks]] integriert.<ref>{{cite web | url=https://www.cloudera.com/about/news-and-blogs/press-releases/2019-01-03-cloudera-and-hortonworks-complete-planned-merger.html | title=Cloudera and Hortonworks Complete Planned Merger | quote='' Cloudera, Inc. (NYSE: CLDR), the enterprise data cloud company, today announced completion of its merger with Hortonworks, Inc. Cloudera will deliver the first enterprise data cloud - unlocking the power of any data, running in any cloud from the Edge to AI, on a 100% open-source data platform'' | author=Cloudera | date=2019-01-03 | accessdate=2019-09-22|language=en}}</ref> Hortonworks stammt ursprünglich aus einer Auskopplung von [[<ins style="font-weight: bold; text-decoration: none;">Altaba#Unternehmensgeschichte|</ins>Yahoo]] und Benchmark Capital.</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>* [[Teradata Corporation|Teradata]] stellt in einer Partnerschaft mit Hortonworks eine erweiterte Distribution zur Verfügung.<ref>{{cite web | url=https://www.pressebox.de/inaktiv/teradata-gmbh/Teradata-unterstuetzt-Hadoop-2-mit-aktualisiertem-Hadoop-Portfolio/boxid/684273 | title=Teradata unterstützt Hadoop 2 mit aktualisiertem Hadoop-Portfolio | quote=''Bei der aktualisierten Software Teradata Open Distribution für Hadoop (TDH) 2.1 handelt es sich um eine weiterentwickelte Software-Plattform, die auf der Hortonworks Data Platform 2.1 basiert.'' | author= PresseBox | date= 2014-06-12| accessdate=2017-03-26|language=en}}</ref> Teradata Open Distribution für Hadoop (TDH) 2.1 verknüpft somit Hadoop mit Teradata-Produkten. Teradata ist der globale Marktführer im Bereich Data Warehousing.</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>* [[Teradata Corporation|Teradata]] stellt in einer Partnerschaft mit Hortonworks eine erweiterte Distribution zur Verfügung.<ref>{{cite web | url=https://www.pressebox.de/inaktiv/teradata-gmbh/Teradata-unterstuetzt-Hadoop-2-mit-aktualisiertem-Hadoop-Portfolio/boxid/684273 | title=Teradata unterstützt Hadoop 2 mit aktualisiertem Hadoop-Portfolio | quote=''Bei der aktualisierten Software Teradata Open Distribution für Hadoop (TDH) 2.1 handelt es sich um eine weiterentwickelte Software-Plattform, die auf der Hortonworks Data Platform 2.1 basiert.'' | author= PresseBox | date= 2014-06-12| accessdate=2017-03-26|language=en}}</ref> Teradata Open Distribution für Hadoop (TDH) 2.1 verknüpft somit Hadoop mit Teradata-Produkten. Teradata ist der globale Marktführer im Bereich Data Warehousing.</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>* [[Microsoft]] integriert Hadoop derzeit in [[Microsoft Azure]] und [[Microsoft SQL Server|SQL Server]].<ref>{{cite web | url=https://blogs.technet.microsoft.com/sqlteamgermany/2011/10/31/microsoft-big-data-und-hadoop-was-steckt-dahinter/ | title=Microsoft, Big Data und Hadoop – was steckt dahinter? | quote=''In Zusammenarbeit mit dem Partner Hortonworks ist es geplant, Hadoop vollständig auf dem Windows Server zu „portieren“. [...] Zudem ist es geplant, Hadoop auch als Dienst in Windows Azure anzubieten.'' | author=FSeiwerth | date=2011-10-31 | accessdate=2012-04-03|language=en}}</ref> Die Integration wird Teil des SQL Server 2019 sein.<ref>{{Literatur |Titel=SQL Server 2019 preview combines SQL Server and Apache Spark to create a unified data platform |Online=https://cloudblogs.microsoft.com/sqlserver/2018/09/24/sql-server-2019-preview-combines-sql-server-and-apache-spark-to-create-a-unified-data-platform/ |Abruf=2018-09-25}}</ref></div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>* [[Microsoft]] integriert Hadoop derzeit in [[Microsoft Azure]] und [[Microsoft SQL Server|SQL Server]].<ref>{{cite web | url=https://blogs.technet.microsoft.com/sqlteamgermany/2011/10/31/microsoft-big-data-und-hadoop-was-steckt-dahinter/ | title=Microsoft, Big Data und Hadoop – was steckt dahinter? | quote=''In Zusammenarbeit mit dem Partner Hortonworks ist es geplant, Hadoop vollständig auf dem Windows Server zu „portieren“. [...] Zudem ist es geplant, Hadoop auch als Dienst in Windows Azure anzubieten.'' | author=FSeiwerth | date=2011-10-31 | accessdate=2012-04-03|language=en}}</ref> Die Integration wird Teil des SQL Server 2019 sein.<ref>{{Literatur |Titel=SQL Server 2019 preview combines SQL Server and Apache Spark to create a unified data platform |Online=https://cloudblogs.microsoft.com/sqlserver/2018/09/24/sql-server-2019-preview-combines-sql-server-and-apache-spark-to-create-a-unified-data-platform/ |Abruf=2018-09-25}}</ref></div></td>
</tr>
</table>
Gunnar.Kaestle
https://de.wikipedia.org/w/index.php?title=Apache_Hadoop&diff=252603501&oldid=prev
Eriosw: vorlagenfehler - language
2025-01-25T09:12:21Z
<p>vorlagenfehler - language</p>
<table style="background-color: #fff; color: #202122;" data-mw="interface">
<col class="diff-marker" />
<col class="diff-content" />
<col class="diff-marker" />
<col class="diff-content" />
<tr class="diff-title" lang="de">
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">← Nächstältere Version</td>
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">Version vom 25. Januar 2025, 11:12 Uhr</td>
</tr><tr>
<td colspan="2" class="diff-lineno">Zeile 100:</td>
<td colspan="2" class="diff-lineno">Zeile 100:</td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Auszeichnungen ==</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Auszeichnungen ==</div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>Ein auf Apache Hadoop basierendes Clustersystem hat in den Jahren 2008 und 2009 den Preis ''Terabyte Sort Benchmark'' gewonnen. Es konnte unter den beim [[Benchmark (Computer)|EDV-Benchmark]]<ref>{{Internetquelle | url=http://sortbenchmark.org/ | titel=Sort Benchmark Home Page | autor=Chris Nyberg und Mehul Shah | zugriff=2010-11-30 | sprache=en}}</ref> getesteten Systemen am schnellsten große Datenmengen (im Jahr 2009 einhundert Terabyte [[Integer (Datentyp)|Integer]]) verteilt sortieren – jedoch mit einer deutlich größeren Knotenzahl<!-- Ist das im Artikel [[Knotenzahl]] (Stand 4. Januar 2010) das Gemeinte? --> als die Mitbewerber, da dies nicht in den Benchmarkstatuten reglementiert ist.<ref>[https://databeta.wordpress.com/2009/05/14/bigdata-node-density/ Diverging views on Big Data density, and some gimmes]</ref><ref name=googlemapreduce>{{cite web|url=http://googleblog.blogspot.com/2008/11/sorting-1pb-with-mapreduce.html|title=Sorting 1PB with MapReduce|publisher=google|date=2008-11-21|accessdate=2017-03-26|first=Grzegorz|last=Czajkowski}}</ref></div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>Ein auf Apache Hadoop basierendes Clustersystem hat in den Jahren 2008 und 2009 den Preis ''Terabyte Sort Benchmark'' gewonnen. Es konnte unter den beim [[Benchmark (Computer)|EDV-Benchmark]]<ref>{{Internetquelle | url=http://sortbenchmark.org/ | titel=Sort Benchmark Home Page | autor=Chris Nyberg und Mehul Shah | zugriff=2010-11-30 | sprache=en}}</ref> getesteten Systemen am schnellsten große Datenmengen (im Jahr 2009 einhundert Terabyte [[Integer (Datentyp)|Integer]]) verteilt sortieren – jedoch mit einer deutlich größeren Knotenzahl<!-- Ist das im Artikel [[Knotenzahl]] (Stand 4. Januar 2010) das Gemeinte? --> als die Mitbewerber, da dies nicht in den Benchmarkstatuten reglementiert ist.<ref>[https://databeta.wordpress.com/2009/05/14/bigdata-node-density/ Diverging views on Big Data density, and some gimmes]</ref><ref name=googlemapreduce>{{cite web|url=http://googleblog.blogspot.com/2008/11/sorting-1pb-with-mapreduce.html|title=Sorting 1PB with MapReduce|publisher=google|date=2008-11-21|accessdate=2017-03-26|first=Grzegorz|last=Czajkowski<ins style="font-weight: bold; text-decoration: none;">|language=en</ins>}}</ref></div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>Es war somit das erste Java- und auch das erste Open-Source-Programm, welches diesen Benchmark für sich entscheiden konnte.<ref>{{cite web|url=http://developer.yahoo.net/blogs/hadoop/2008/07/apache_hadoop_wins_terabyte_sort_benchmark.html|title=Apache Hadoop Wins Terabyte Sort Benchmark|date=2008-07|accessdate=2009-10-14|author=Owen O’Malley – Yahoo! Grid Computing Team|archiveurl=https://web.archive.org/web/20091015215436/http://developer.yahoo.net/blogs/hadoop/2008/07/apache_hadoop_wins_terabyte_sort_benchmark.html|archivedate=2009-10-15|quote=''This is the first time that either a Java or an open source program has won.''|offline=yes|archivebot=}} (offline)</ref></div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>Es war somit das erste Java- und auch das erste Open-Source-Programm, welches diesen Benchmark für sich entscheiden konnte.<ref>{{cite web|url=http://developer.yahoo.net/blogs/hadoop/2008/07/apache_hadoop_wins_terabyte_sort_benchmark.html|title=Apache Hadoop Wins Terabyte Sort Benchmark|date=2008-07|accessdate=2009-10-14|author=Owen O’Malley – Yahoo! Grid Computing Team|archiveurl=https://web.archive.org/web/20091015215436/http://developer.yahoo.net/blogs/hadoop/2008/07/apache_hadoop_wins_terabyte_sort_benchmark.html|archivedate=2009-10-15|quote=''This is the first time that either a Java or an open source program has won.''|offline=yes|archivebot=<ins style="font-weight: bold; text-decoration: none;">|language=en</ins>}} (offline)</ref></div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>Der [[The Guardian|Guardian]] verlieh Apache Hadoop im März 2011 bei den ''MediaGuardian Innovation Awards'' die Auszeichnung ''Innovator of the Year''. Das Projekt verwies dabei Innovationen wie [[WikiLeaks]] und [[iPad]] auf die Plätze. Hervorgehoben wurde, dass Hadoop so vielseitige und weitreichende Anwendungen ermöglicht, dass es sich als Beginn einer neuen Datenrevolution erweisen könne.<ref>{{cite web | url=https://www.theguardian.com/megas/winners-2011 | title=Megas 2011: Winners | quote=''Applications of the system are diverse and far reaching, and as data manipulation and management play an increasingly large part in all of our lives Hadoop may come to be seen as the beginning of a new data revolution.'' | author=guardian.co.uk | date=2011-03-25 | accessdate=2011-03-25}}</ref></div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>Der [[The Guardian|Guardian]] verlieh Apache Hadoop im März 2011 bei den ''MediaGuardian Innovation Awards'' die Auszeichnung ''Innovator of the Year''. Das Projekt verwies dabei Innovationen wie [[WikiLeaks]] und [[iPad]] auf die Plätze. Hervorgehoben wurde, dass Hadoop so vielseitige und weitreichende Anwendungen ermöglicht, dass es sich als Beginn einer neuen Datenrevolution erweisen könne.<ref>{{cite web | url=https://www.theguardian.com/megas/winners-2011 | title=Megas 2011: Winners | quote=''Applications of the system are diverse and far reaching, and as data manipulation and management play an increasingly large part in all of our lives Hadoop may come to be seen as the beginning of a new data revolution.'' | author=guardian.co.uk | date=2011-03-25 | accessdate=2011-03-25<ins style="font-weight: bold; text-decoration: none;">|language=en</ins>}}</ref></div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Kommerzieller Support und kommerzielle Forks ==</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Kommerzieller Support und kommerzielle Forks ==</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>Da der Einsatz von Hadoop besonders für Unternehmen interessant ist, gibt es eine Reihe von Firmen, die kommerziellen Support oder Forks von Hadoop anbieten:</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>Da der Einsatz von Hadoop besonders für Unternehmen interessant ist, gibt es eine Reihe von Firmen, die kommerziellen Support oder Forks von Hadoop anbieten:</div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>* [[Cloudera]] stellt mit CDH eine „enterprise ready“ Open-Source-Distribution für Hadoop bereit (aktuelle Version: CDH 6.0.0<ref>https://www.cloudera.com/downloads/cdh/6-0-0.html</ref>). Anfang 2019 wurde der andere große BigData-Distribution-Anbieter [[Hortonworks]] integriert.<ref>{{cite web | url=https://www.cloudera.com/about/news-and-blogs/press-releases/2019-01-03-cloudera-and-hortonworks-complete-planned-merger.html | title=Cloudera and Hortonworks Complete Planned Merger | quote='' Cloudera, Inc. (NYSE: CLDR), the enterprise data cloud company, today announced completion of its merger with Hortonworks, Inc. Cloudera will deliver the first enterprise data cloud - unlocking the power of any data, running in any cloud from the Edge to AI, on a 100% open-source data platform'' | author=Cloudera | date=2019-01-03 | accessdate=2019-09-22}}</ref> Hortonworks stammt ursprünglich aus einer Auskopplung von [[Yahoo]] und Benchmark Capital.</div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>* [[Cloudera]] stellt mit CDH eine „enterprise ready“ Open-Source-Distribution für Hadoop bereit (aktuelle Version: CDH 6.0.0<ref>https://www.cloudera.com/downloads/cdh/6-0-0.html</ref>). Anfang 2019 wurde der andere große BigData-Distribution-Anbieter [[Hortonworks]] integriert.<ref>{{cite web | url=https://www.cloudera.com/about/news-and-blogs/press-releases/2019-01-03-cloudera-and-hortonworks-complete-planned-merger.html | title=Cloudera and Hortonworks Complete Planned Merger | quote='' Cloudera, Inc. (NYSE: CLDR), the enterprise data cloud company, today announced completion of its merger with Hortonworks, Inc. Cloudera will deliver the first enterprise data cloud - unlocking the power of any data, running in any cloud from the Edge to AI, on a 100% open-source data platform'' | author=Cloudera | date=2019-01-03 | accessdate=2019-09-22<ins style="font-weight: bold; text-decoration: none;">|language=en</ins>}}</ref> Hortonworks stammt ursprünglich aus einer Auskopplung von [[Yahoo]] und Benchmark Capital.</div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>* [[Teradata Corporation|Teradata]] stellt in einer Partnerschaft mit Hortonworks eine erweiterte Distribution zur Verfügung.<ref>{{cite web | url=https://www.pressebox.de/inaktiv/teradata-gmbh/Teradata-unterstuetzt-Hadoop-2-mit-aktualisiertem-Hadoop-Portfolio/boxid/684273 | title=Teradata unterstützt Hadoop 2 mit aktualisiertem Hadoop-Portfolio | quote=''Bei der aktualisierten Software Teradata Open Distribution für Hadoop (TDH) 2.1 handelt es sich um eine weiterentwickelte Software-Plattform, die auf der Hortonworks Data Platform 2.1 basiert.'' | author= PresseBox | date= 2014-06-12| accessdate=2017-03-26}}</ref> Teradata Open Distribution für Hadoop (TDH) 2.1 verknüpft somit Hadoop mit Teradata-Produkten. Teradata ist der globale Marktführer im Bereich Data Warehousing.</div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>* [[Teradata Corporation|Teradata]] stellt in einer Partnerschaft mit Hortonworks eine erweiterte Distribution zur Verfügung.<ref>{{cite web | url=https://www.pressebox.de/inaktiv/teradata-gmbh/Teradata-unterstuetzt-Hadoop-2-mit-aktualisiertem-Hadoop-Portfolio/boxid/684273 | title=Teradata unterstützt Hadoop 2 mit aktualisiertem Hadoop-Portfolio | quote=''Bei der aktualisierten Software Teradata Open Distribution für Hadoop (TDH) 2.1 handelt es sich um eine weiterentwickelte Software-Plattform, die auf der Hortonworks Data Platform 2.1 basiert.'' | author= PresseBox | date= 2014-06-12| accessdate=2017-03-26<ins style="font-weight: bold; text-decoration: none;">|language=en</ins>}}</ref> Teradata Open Distribution für Hadoop (TDH) 2.1 verknüpft somit Hadoop mit Teradata-Produkten. Teradata ist der globale Marktführer im Bereich Data Warehousing.</div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>* [[Microsoft]] integriert Hadoop derzeit in [[Microsoft Azure]] und [[Microsoft SQL Server|SQL Server]].<ref>{{cite web | url=https://blogs.technet.microsoft.com/sqlteamgermany/2011/10/31/microsoft-big-data-und-hadoop-was-steckt-dahinter/ | title=Microsoft, Big Data und Hadoop – was steckt dahinter? | quote=''In Zusammenarbeit mit dem Partner Hortonworks ist es geplant, Hadoop vollständig auf dem Windows Server zu „portieren“. [...] Zudem ist es geplant, Hadoop auch als Dienst in Windows Azure anzubieten.'' | author=FSeiwerth | date=2011-10-31 | accessdate=2012-04-03}}</ref> Die Integration wird Teil des SQL Server 2019 sein.<ref>{{Literatur |Titel=SQL Server 2019 preview combines SQL Server and Apache Spark to create a unified data platform |Online=https://cloudblogs.microsoft.com/sqlserver/2018/09/24/sql-server-2019-preview-combines-sql-server-and-apache-spark-to-create-a-unified-data-platform/ |Abruf=2018-09-25}}</ref></div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>* [[Microsoft]] integriert Hadoop derzeit in [[Microsoft Azure]] und [[Microsoft SQL Server|SQL Server]].<ref>{{cite web | url=https://blogs.technet.microsoft.com/sqlteamgermany/2011/10/31/microsoft-big-data-und-hadoop-was-steckt-dahinter/ | title=Microsoft, Big Data und Hadoop – was steckt dahinter? | quote=''In Zusammenarbeit mit dem Partner Hortonworks ist es geplant, Hadoop vollständig auf dem Windows Server zu „portieren“. [...] Zudem ist es geplant, Hadoop auch als Dienst in Windows Azure anzubieten.'' | author=FSeiwerth | date=2011-10-31 | accessdate=2012-04-03<ins style="font-weight: bold; text-decoration: none;">|language=en</ins>}}</ref> Die Integration wird Teil des SQL Server 2019 sein.<ref>{{Literatur |Titel=SQL Server 2019 preview combines SQL Server and Apache Spark to create a unified data platform |Online=https://cloudblogs.microsoft.com/sqlserver/2018/09/24/sql-server-2019-preview-combines-sql-server-and-apache-spark-to-create-a-unified-data-platform/ |Abruf=2018-09-25}}</ref></div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>* Die [[Google App Engine]] MapReduce unterstützt Hadoop-Programme.</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>* Die [[Google App Engine]] MapReduce unterstützt Hadoop-Programme.</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>* Das [[IBM]]-Produkt InfoSphere BigInsights basiert auf Hadoop.</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>* Das [[IBM]]-Produkt InfoSphere BigInsights basiert auf Hadoop.</div></td>
</tr>
</table>
Eriosw
https://de.wikipedia.org/w/index.php?title=Apache_Hadoop&diff=252384685&oldid=prev
Gunnar.Kaestle: BKS aufgelöst
2025-01-18T18:14:48Z
<p>BKS aufgelöst</p>
<table style="background-color: #fff; color: #202122;" data-mw="interface">
<col class="diff-marker" />
<col class="diff-content" />
<col class="diff-marker" />
<col class="diff-content" />
<tr class="diff-title" lang="de">
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">← Nächstältere Version</td>
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">Version vom 18. Januar 2025, 20:14 Uhr</td>
</tr><tr>
<td colspan="2" class="diff-lineno">Zeile 22:</td>
<td colspan="2" class="diff-lineno">Zeile 22:</td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>'''Apache Hadoop''' ist ein [[Freie Software|freies]], in [[Java (Programmiersprache)|Java]] geschriebenes [[Framework]] für skalierbare, verteilt arbeitende Software. Es basiert auf dem [[MapReduce]]-Algorithmus von [[Google Inc.]] sowie auf Vorschlägen des [[Google File System|Google-Dateisystems]] und ermöglicht es, intensive Rechenprozesse mit großen Datenmengen (''[[Big Data]]'', [[Petabyte]]-Bereich) auf [[Computercluster]]n durchzuführen. Hadoop wurde vom [[Lucene]]-Erfinder [[Doug Cutting]] initiiert und 2006 erstmals veröffentlicht.<ref>http://archive.apache.org/dist/hadoop/core/</ref> Am 23. Januar 2008 wurde es zum Top-Level-Projekt der [[Apache Software Foundation]].</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>'''Apache Hadoop''' ist ein [[Freie Software|freies]], in [[Java (Programmiersprache)|Java]] geschriebenes [[Framework]] für skalierbare, verteilt arbeitende Software. Es basiert auf dem [[MapReduce]]-Algorithmus von [[Google Inc.]] sowie auf Vorschlägen des [[Google File System|Google-Dateisystems]] und ermöglicht es, intensive Rechenprozesse mit großen Datenmengen (''[[Big Data]]'', [[Petabyte]]-Bereich) auf [[Computercluster]]n durchzuführen. Hadoop wurde vom [[Lucene]]-Erfinder [[Doug Cutting]] initiiert und 2006 erstmals veröffentlicht.<ref>http://archive.apache.org/dist/hadoop/core/</ref> Am 23. Januar 2008 wurde es zum Top-Level-Projekt der [[Apache Software Foundation]].</div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>Nutzer sind unter anderem [[Facebook]], [[a9.com]], [[AOL]], [[Baidu]], [[IBM]], [[ImageShack]] und [[Yahoo]].<ref>https://cwiki.apache.org/confluence/display/HADOOP2/PoweredBy</ref></div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>Nutzer sind unter anderem [[Facebook]], [[a9.com]], [[AOL]], [[Baidu]], [[IBM]], [[ImageShack]] und [[<ins style="font-weight: bold; text-decoration: none;">Yahoo (2021)|</ins>Yahoo]].<ref>https://cwiki.apache.org/confluence/display/HADOOP2/PoweredBy</ref></div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Bestandteile ==</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Bestandteile ==</div></td>
</tr>
</table>
Gunnar.Kaestle
https://de.wikipedia.org/w/index.php?title=Apache_Hadoop&diff=249890726&oldid=prev
Unicard-ic: /* Oozie */ eingefügt
2024-10-30T12:57:20Z
<p><span class="autocomment">Oozie: </span> eingefügt</p>
<table style="background-color: #fff; color: #202122;" data-mw="interface">
<col class="diff-marker" />
<col class="diff-content" />
<col class="diff-marker" />
<col class="diff-content" />
<tr class="diff-title" lang="de">
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">← Nächstältere Version</td>
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">Version vom 30. Oktober 2024, 14:57 Uhr</td>
</tr><tr>
<td colspan="2" class="diff-lineno">Zeile 84:</td>
<td colspan="2" class="diff-lineno">Zeile 84:</td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Ignite ===</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Ignite ===</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>Ignite ist ein verteilter Big-Data Cache für interaktive Abfragen zur Beschleunigung von Abfragen auf häufig genutzte Daten. Er unterstützt HDFS und Spark. Durch die HDFS-Unterstützung können in Hive ausgewählte Tabellen/Partitionen in-memory gehalten werden.</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>Ignite ist ein verteilter Big-Data Cache für interaktive Abfragen zur Beschleunigung von Abfragen auf häufig genutzte Daten. Er unterstützt HDFS und Spark. Durch die HDFS-Unterstützung können in Hive ausgewählte Tabellen/Partitionen in-memory gehalten werden.</div></td>
</tr>
<tr>
<td colspan="2" class="diff-empty diff-side-deleted"></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td colspan="2" class="diff-empty diff-side-deleted"></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>=== Oozie ===</div></td>
</tr>
<tr>
<td colspan="2" class="diff-empty diff-side-deleted"></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>Oozie ist ein Workflow-Scheduler-System zum Verwalten von Apache Hadoop-Jobs.</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Architektur ==</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Architektur ==</div></td>
</tr>
</table>
Unicard-ic
https://de.wikipedia.org/w/index.php?title=Apache_Hadoop&diff=246584366&oldid=prev
Aka: typografische Anführungszeichen, Komma ergänzt, Kleinkram
2024-07-08T20:51:35Z
<p>typografische Anführungszeichen, Komma ergänzt, Kleinkram</p>
<table style="background-color: #fff; color: #202122;" data-mw="interface">
<col class="diff-marker" />
<col class="diff-content" />
<col class="diff-marker" />
<col class="diff-content" />
<tr class="diff-title" lang="de">
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">← Nächstältere Version</td>
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">Version vom 8. Juli 2024, 22:51 Uhr</td>
</tr><tr>
<td colspan="2" class="diff-lineno">Zeile 43:</td>
<td colspan="2" class="diff-lineno">Zeile 43:</td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Transparente Kompression ===</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Transparente Kompression ===</div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>Hadoop unterstützt die transparente Kompression von Dateien zur optimalen Speicher- und Ressourcen-Unterstützung. Es wird eine Vielzahl von Formaten unterstützt, darunter [[Snappy (Datenkompressionssoftware)|Snappy]] für schnelle Komprimierung, [[zlib]] für hohe Kompressionsraten und [[Bzip2]] für höchste Komprimierung. Es können beliebige weitere Formate Hadoop-Anwendungen transparent zur Verfügung gestellt werden. Kompression kann zur Verbesserung der Performance führen, da diese die notwendigen IO-Operationen signifikant reduziert. Jedoch sind nicht alle Kompressionstypen <del style="font-weight: bold; text-decoration: none;">"splitable"</del>, d.&nbsp;h. parallel dekomprimierbar. Dies umgehen moderne Dateiformate, wie ORC oder Parquet, indem sie die zu komprimierenden Dateien intern in Blöcke aufteilen. Dadurch ist jedes Kompressionsformat geeignet, um die Dateien parallel zu verarbeiten.</div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>Hadoop unterstützt die transparente Kompression von Dateien zur optimalen Speicher- und Ressourcen-Unterstützung. Es wird eine Vielzahl von Formaten unterstützt, darunter [[Snappy (Datenkompressionssoftware)|Snappy]] für schnelle Komprimierung, [[zlib]] für hohe Kompressionsraten und [[Bzip2]] für höchste Komprimierung. Es können beliebige weitere Formate Hadoop-Anwendungen transparent zur Verfügung gestellt werden. Kompression kann zur Verbesserung der Performance führen, da diese die notwendigen IO-Operationen signifikant reduziert. Jedoch sind nicht alle Kompressionstypen <ins style="font-weight: bold; text-decoration: none;">„splitable“</ins>, d.&nbsp;h. parallel dekomprimierbar. Dies umgehen moderne Dateiformate, wie ORC oder Parquet, indem sie die zu komprimierenden Dateien intern in Blöcke aufteilen. Dadurch ist jedes Kompressionsformat geeignet, um die Dateien parallel zu verarbeiten.</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Transparente Dateiformatunterstützung ===</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Transparente Dateiformatunterstützung ===</div></td>
</tr>
<tr>
<td colspan="2" class="diff-lineno">Zeile 87:</td>
<td colspan="2" class="diff-lineno">Zeile 87:</td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Architektur ==</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Architektur ==</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>Hadoop sollte als Ökosystem verstanden werden, in dem Hadoop mit vielen anderen Erweiterungen zusammenspielt. Deswegen muss eine geeignete Architektur gewählt werden.</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>Hadoop sollte als Ökosystem verstanden werden, in dem Hadoop mit vielen anderen Erweiterungen zusammenspielt. Deswegen muss eine geeignete Architektur gewählt werden.</div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>=== Lambda-Architektur ===<del style="font-weight: bold; text-decoration: none;"> </del></div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>=== Lambda-Architektur ===</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>Eine populäre Architektur ist hier die Lambda-Architektur. Es wird zwischen den folgenden Ebenen unterschieden:</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>Eine populäre Architektur ist hier die Lambda-Architektur. Es wird zwischen den folgenden Ebenen unterschieden:</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>* Batch-Layer: Diese Ebene verarbeitet Daten als Teil von langdauernden Batchprozessen. Dies wird häufig durch Hadoop MapReduce, Spark oder Hive in Kombination mit dem HDFS-Dateisystem abgedeckt.</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>* Batch-Layer: Diese Ebene verarbeitet Daten als Teil von langdauernden Batchprozessen. Dies wird häufig durch Hadoop MapReduce, Spark oder Hive in Kombination mit dem HDFS-Dateisystem abgedeckt.</div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>* Speed-Layer: Diese Ebene verarbeitet Datenströme (Streaming) von <del style="font-weight: bold; text-decoration: none;">"Live"</del>-Events. Es handelt sich dabei um große Datenströme von häufig mehreren Terabyte/Stunde von Geräten aus dem Internet of Things/Industrie 4.0 oder sozialen Netzwerken wie z.&nbsp;B. Twitter, Facebook usw. Oft kommen hier Online-Machine-Learning-Algorithmen zum Einsatz, da diese das Modell auf neueste Ereignisse adaptieren können. Häufig werden hier Kafka, zum Bündeln der Datenströme, und Spark Streaming, Flink Streaming oder Storm verwendet.</div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>* Speed-Layer: Diese Ebene verarbeitet Datenströme (Streaming) von <ins style="font-weight: bold; text-decoration: none;">„Live“</ins>-Events. Es handelt sich dabei um große Datenströme von häufig mehreren Terabyte/Stunde von Geräten aus dem Internet of Things/Industrie 4.0 oder sozialen Netzwerken wie z.&nbsp;B. Twitter, Facebook usw. Oft kommen hier Online-Machine-Learning-Algorithmen zum Einsatz, da diese das Modell auf neueste Ereignisse adaptieren können. Häufig werden hier Kafka, zum Bündeln der Datenströme, und Spark Streaming, Flink Streaming oder Storm verwendet.</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>* Serving-Layer: Diese Ebene stellt die Ergebnisse aus dem Batch-Layer und Speed-Layer in einfacher Form den Benutzern möglichst schnell für interaktive Analysen zur Verfügung. Dieser Bereich wird häufig durch traditionelle Datenbanken abgedeckt, aber immer öfter auch durch NoSQL-Datenbanken, da diese geeignetere Datenstrukturen anbieten, wie z.&nbsp;B. Dokumentdatenbanken (z.&nbsp;B. MongoDB), Graphdatenbanken (z.&nbsp;B. TitanDB), Spalten-orientierte Datenbanken (z.&nbsp;B. HBase) oder Key-Value-Stores (z.&nbsp;B. Redis).</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>* Serving-Layer: Diese Ebene stellt die Ergebnisse aus dem Batch-Layer und Speed-Layer in einfacher Form den Benutzern möglichst schnell für interaktive Analysen zur Verfügung. Dieser Bereich wird häufig durch traditionelle Datenbanken abgedeckt, aber immer öfter auch durch NoSQL-Datenbanken, da diese geeignetere Datenstrukturen anbieten, wie z.&nbsp;B. Dokumentdatenbanken (z.&nbsp;B. MongoDB), Graphdatenbanken (z.&nbsp;B. TitanDB), Spalten-orientierte Datenbanken (z.&nbsp;B. HBase) oder Key-Value-Stores (z.&nbsp;B. Redis).</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Kappa-Architektur ===</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Kappa-Architektur ===</div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>Bei der Kappa-Architektur wird vollständig auf den Batchlayer verzichtet. Es werden nur noch <del style="font-weight: bold; text-decoration: none;">"Live"</del>-Events betrachtet und verarbeitet, um sie im Serving-Layer den Benutzern zur Verfügung zu stellen. Dies stellt besondere Herausforderungen bzgl. Verfügbarkeit, Ausfallsicherheit und Once-and-Only-Once-Delivery.</div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>Bei der Kappa-Architektur wird vollständig auf den Batchlayer verzichtet. Es werden nur noch <ins style="font-weight: bold; text-decoration: none;">„Live“</ins>-Events betrachtet und verarbeitet, um sie im Serving-Layer den Benutzern zur Verfügung zu stellen. Dies stellt besondere Herausforderungen bzgl. Verfügbarkeit, Ausfallsicherheit und Once-and-Only-Once-Delivery.</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Auszeichnungen ==</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Auszeichnungen ==</div></td>
</tr>
<tr>
<td colspan="2" class="diff-lineno">Zeile 116:</td>
<td colspan="2" class="diff-lineno">Zeile 116:</td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Literatur ==</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Literatur ==</div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>* Ramon Wartala: ''Hadoop. Zuverlässige, verteilte und skalierbare Big-Data-Anwendungen.'' Open Source Press, München 2012<del style="font-weight: bold; text-decoration: none;">.</del> ISBN 978-3-941841-61-1</div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>* Ramon Wartala: ''Hadoop. Zuverlässige, verteilte und skalierbare Big-Data-Anwendungen.'' Open Source Press, München 2012<ins style="font-weight: bold; text-decoration: none;">,</ins> ISBN 978-3-941841-61-1</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Weblinks ==</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Weblinks ==</div></td>
</tr>
</table>
Aka
https://de.wikipedia.org/w/index.php?title=Apache_Hadoop&diff=246494322&oldid=prev
Svenchecktrechtschreibung: /* Transparente Dateiformatunterstützung */ "schemabasierend" ist ein Adjektiv und daher klein zu schreiben.
2024-07-05T15:32:16Z
<p><span class="autocomment">Transparente Dateiformatunterstützung: </span> "schemabasierend" ist ein Adjektiv und daher klein zu schreiben.</p>
<table style="background-color: #fff; color: #202122;" data-mw="interface">
<col class="diff-marker" />
<col class="diff-content" />
<col class="diff-marker" />
<col class="diff-content" />
<tr class="diff-title" lang="de">
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">← Nächstältere Version</td>
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">Version vom 5. Juli 2024, 17:32 Uhr</td>
</tr><tr>
<td colspan="2" class="diff-lineno">Zeile 46:</td>
<td colspan="2" class="diff-lineno">Zeile 46:</td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Transparente Dateiformatunterstützung ===</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Transparente Dateiformatunterstützung ===</div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>Hadoop unterstützt transparent die Verwendung unterschiedlicher Dateiformate je nach Anwendung. Unterstützt werden sowohl unstrukturierte als auch strukturierte Formate, darunter einfache Textformate wie [[CSV (Dateiformat)|CSV]], [[JSON]] aber auch hochoptimierte <del style="font-weight: bold; text-decoration: none;">Schemabasierende</del> Dateien ([[Apache Avro]]) und hochoptimierte tabulare Formate wie ORC und Parquet. Daneben können weitere Dateiformate einfach entwickelt werden. Weitere Plugins unterstützen die Analyse von CryptoLedgern.</div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>Hadoop unterstützt transparent die Verwendung unterschiedlicher Dateiformate je nach Anwendung. Unterstützt werden sowohl unstrukturierte als auch strukturierte Formate, darunter einfache Textformate wie [[CSV (Dateiformat)|CSV]], [[JSON]] aber auch hochoptimierte <ins style="font-weight: bold; text-decoration: none;">schemabasierende</ins> Dateien ([[Apache Avro]]) und hochoptimierte tabulare Formate wie ORC und Parquet. Daneben können weitere Dateiformate einfach entwickelt werden. Weitere Plugins unterstützen die Analyse von CryptoLedgern.</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>[[Extensible Markup Language|XML]] gilt im Hadoop-Ökosystem als veraltet, da es sich nicht für hochperformante Big-Data-Anwendungen eignet. Stattdessen wird empfohlen, Apache Avro als Austauschformat zu nutzen und ORC oder Parquet als Abfrageformat für hochstrukturierte Daten.</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>[[Extensible Markup Language|XML]] gilt im Hadoop-Ökosystem als veraltet, da es sich nicht für hochperformante Big-Data-Anwendungen eignet. Stattdessen wird empfohlen, Apache Avro als Austauschformat zu nutzen und ORC oder Parquet als Abfrageformat für hochstrukturierte Daten.</div></td>
</tr>
</table>
Svenchecktrechtschreibung
https://de.wikipedia.org/w/index.php?title=Apache_Hadoop&diff=244145661&oldid=prev
MultiPolitikus: Archivlink(s) geprüft
2024-04-17T17:44:00Z
<p><a href="/wiki/Kategorie:Wikipedia:Defekte_Weblinks/Ungepr%C3%BCfte_Archivlinks" title="Kategorie:Wikipedia:Defekte Weblinks/Ungeprüfte Archivlinks">Archivlink(s)</a> geprüft</p>
<table style="background-color: #fff; color: #202122;" data-mw="interface">
<col class="diff-marker" />
<col class="diff-content" />
<col class="diff-marker" />
<col class="diff-content" />
<tr class="diff-title" lang="de">
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">← Nächstältere Version</td>
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">Version vom 17. April 2024, 19:44 Uhr</td>
</tr><tr>
<td colspan="2" class="diff-lineno">Zeile 29:</td>
<td colspan="2" class="diff-lineno">Zeile 29:</td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>Sowohl Dateiblocklänge als auch [[Redundanz (Technik)|Redundanzgrad]] sind konfigurierbar.</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>Sowohl Dateiblocklänge als auch [[Redundanz (Technik)|Redundanzgrad]] sind konfigurierbar.</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>HDFS eignet sich für große Dateien. Viele kleinere Dateien sind nicht sinnvoll und sollten über Hadoop Archives (HAR) anwendungstransparent zusammengefasst werden.<ref>https://hadoop.apache.org/docs/current/hadoop-archives/HadoopArchives.html</ref> In zukünftigen Releases werden durch den Hadoop Distributed Data Store (HDDS) auch kleine Dateien ohne Umwege transparent unterstützt.<ref>{{Webarchiv|url=https://cwiki.apache.org/confluence/display/HADOOP/Hadoop+Distributed+Data+Store+and+Applications |wayback=20180527202302 |text=Archivierte Kopie |<del style="font-weight: bold; text-decoration: none;">archiv-bot</del>=<del style="font-weight: bold; text-decoration: none;">2019</del>-<del style="font-weight: bold; text-decoration: none;">08</del>-<del style="font-weight: bold; text-decoration: none;">24 13:50:20 InternetArchiveBot </del>}}</ref></div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>HDFS eignet sich für große Dateien. Viele kleinere Dateien sind nicht sinnvoll und sollten über Hadoop Archives (HAR) anwendungstransparent zusammengefasst werden.<ref>https://hadoop.apache.org/docs/current/hadoop-archives/HadoopArchives.html</ref> In zukünftigen Releases werden durch den Hadoop Distributed Data Store (HDDS) auch kleine Dateien ohne Umwege transparent unterstützt.<ref>{{Webarchiv|url=https://cwiki.apache.org/confluence/display/HADOOP/Hadoop+Distributed+Data+Store+and+Applications |wayback=20180527202302 |text=Archivierte Kopie<ins style="font-weight: bold; text-decoration: none;"> }}{{Abrufdatum</ins> |<ins style="font-weight: bold; text-decoration: none;">1</ins>=<ins style="font-weight: bold; text-decoration: none;">2024</ins>-<ins style="font-weight: bold; text-decoration: none;">04</ins>-<ins style="font-weight: bold; text-decoration: none;">17</ins>}}</ref></div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>HDFS kann durch andere verteilte Dateisysteme wie [[CassandraFS]], [[MapRFS]], [[GPFS]], S3 und [[Azure Blockstorage]] ersetzt werden.<ref>{{Webarchiv|url=https://wiki.apache.org/hadoop/HCFS |wayback=20160127080145 |text=Archivierte Kopie |<del style="font-weight: bold; text-decoration: none;">archiv-bot</del>=<del style="font-weight: bold; text-decoration: none;">2022</del>-<del style="font-weight: bold; text-decoration: none;">10</del>-<del style="font-weight: bold; text-decoration: none;">04 09:45:54 InternetArchiveBot </del>}}</ref> Mit Einschränkungen werden auch FTP-Server als Dateisystem unterstützt.<ref>http://hadoop.apache.org/docs/r2.7.1/api/org/apache/hadoop/fs/ftp/FTPFileSystem.html</ref> Hadoop-Ökosystem-Anwendungen, die fremde Dateisysteme nutzen sollen, müssen für optimale Performance die entsprechende Datenlokalität unterstützen, was durch Tests sichergestellt werden sollte.</div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>HDFS kann durch andere verteilte Dateisysteme wie [[CassandraFS]], [[MapRFS]], [[GPFS]], S3 und [[Azure Blockstorage]] ersetzt werden.<ref>{{Webarchiv|url=https://wiki.apache.org/hadoop/HCFS |wayback=20160127080145 |text=Archivierte Kopie<ins style="font-weight: bold; text-decoration: none;"> }}{{Abrufdatum</ins> |<ins style="font-weight: bold; text-decoration: none;">1</ins>=<ins style="font-weight: bold; text-decoration: none;">2024</ins>-<ins style="font-weight: bold; text-decoration: none;">04</ins>-<ins style="font-weight: bold; text-decoration: none;">17</ins>}}</ref> Mit Einschränkungen werden auch FTP-Server als Dateisystem unterstützt.<ref>http://hadoop.apache.org/docs/r2.7.1/api/org/apache/hadoop/fs/ftp/FTPFileSystem.html</ref> Hadoop-Ökosystem-Anwendungen, die fremde Dateisysteme nutzen sollen, müssen für optimale Performance die entsprechende Datenlokalität unterstützen, was durch Tests sichergestellt werden sollte.</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Yet Another Resource Negotiator (YARN) ===</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Yet Another Resource Negotiator (YARN) ===</div></td>
</tr>
<tr>
<td colspan="2" class="diff-lineno">Zeile 55:</td>
<td colspan="2" class="diff-lineno">Zeile 55:</td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Hive ===</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Hive ===</div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>Hive erweitert Hadoop um [[Data-Warehouse]]-Funktionalitäten, namentlich die Anfragesprache ''HiveQL'' und Indizes. HiveQL ist eine auf [[SQL]] basierende [[Abfragesprache]] und ermöglicht dem Entwickler somit die Verwendung einer SQL99-ähnlichen Syntax.<ref>https://cwiki.apache.org/confluence/display/Hive/Home</ref> Seit Hive 2.0 wird Hybrid Procedural SQL On Hadoop (HPL/SQL) unterstützt, welches Ausführung von [[PL/SQL]] und vielen weiteren SQL-Dialekten unterstützt. Außerdem werden durch Verwendung des ORC-Tabellenformats, durch LLAP und viele weitere Optimierungen neben Batch-Anwendung zunehmend auch komplexe interaktive Abfragen unterstützt. Diese Optimierungen entstammen der Stinger-Initiative,<ref>{{Webarchiv|url=https://de.hortonworks.com/solutions/ |wayback=20170326225843 |text=Archivierte Kopie |<del style="font-weight: bold; text-decoration: none;">archiv-bot</del>=<del style="font-weight: bold; text-decoration: none;">2023</del>-<del style="font-weight: bold; text-decoration: none;">03</del>-<del style="font-weight: bold; text-decoration: none;">07 20:35:24 InternetArchiveBot </del>}}</ref> welche auch eine Unterstützung von SQL:2011 Analytics vorsieht. Erweiterungen wie HiveMall<ref>https://github.com/myui/hivemall</ref> bieten in-database Analytics für komplexe Machine-Learning-Anwendungen.</div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>Hive erweitert Hadoop um [[Data-Warehouse]]-Funktionalitäten, namentlich die Anfragesprache ''HiveQL'' und Indizes. HiveQL ist eine auf [[SQL]] basierende [[Abfragesprache]] und ermöglicht dem Entwickler somit die Verwendung einer SQL99-ähnlichen Syntax.<ref>https://cwiki.apache.org/confluence/display/Hive/Home</ref> Seit Hive 2.0 wird Hybrid Procedural SQL On Hadoop (HPL/SQL) unterstützt, welches Ausführung von [[PL/SQL]] und vielen weiteren SQL-Dialekten unterstützt. Außerdem werden durch Verwendung des ORC-Tabellenformats, durch LLAP und viele weitere Optimierungen neben Batch-Anwendung zunehmend auch komplexe interaktive Abfragen unterstützt. Diese Optimierungen entstammen der Stinger-Initiative,<ref>{{Webarchiv|url=https://de.hortonworks.com/solutions/ |wayback=20170326225843 |text=Archivierte Kopie<ins style="font-weight: bold; text-decoration: none;"> }}{{Abrufdatum</ins> |<ins style="font-weight: bold; text-decoration: none;">1</ins>=<ins style="font-weight: bold; text-decoration: none;">2024</ins>-<ins style="font-weight: bold; text-decoration: none;">04</ins>-<ins style="font-weight: bold; text-decoration: none;">17</ins>}}</ref> welche auch eine Unterstützung von SQL:2011 Analytics vorsieht. Erweiterungen wie HiveMall<ref>https://github.com/myui/hivemall</ref> bieten in-database Analytics für komplexe Machine-Learning-Anwendungen.</div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>Transaktionalität wird ebenfalls durch das ORC-Tabellenformat unterstützt. Es gibt die Möglichkeit, traditionelle Indexe wie den B-Tree-Index und den Bitmap-Index zu definieren. Für Data-Warehouse-Szenarien wird allerdings empfohlen, nicht diese zu nutzen, sondern das ORC-Format mit Unterstützung von Komprimierung, Bloom-Filtern und Storage-Indexen.<ref>{{Webarchiv|url=https://snippetessay.wordpress.com/2015/07/25/hive-optimizations-with-indexes-bloom-filters-and-statistics/ |wayback=20160304183122 |text=Archivierte Kopie |<del style="font-weight: bold; text-decoration: none;">archiv-bot</del>=<del style="font-weight: bold; text-decoration: none;">2023</del>-<del style="font-weight: bold; text-decoration: none;">06</del>-<del style="font-weight: bold; text-decoration: none;">10 18:57:28 InternetArchiveBot </del>}}</ref> Dies ermöglicht wesentlich performantere Abfragen, sofern die Daten sortiert sind. Moderne Datenbank-Appliances wie Oracle Exadata unterstützen diese Optimierungsmöglichkeiten und empfehlen ebenfalls, auf traditionelle Indexe aus Performance-Gründen zu verzichten.</div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>Transaktionalität wird ebenfalls durch das ORC-Tabellenformat unterstützt. Es gibt die Möglichkeit, traditionelle Indexe wie den B-Tree-Index und den Bitmap-Index zu definieren. Für Data-Warehouse-Szenarien wird allerdings empfohlen, nicht diese zu nutzen, sondern das ORC-Format mit Unterstützung von Komprimierung, Bloom-Filtern und Storage-Indexen.<ref>{{Webarchiv|url=https://snippetessay.wordpress.com/2015/07/25/hive-optimizations-with-indexes-bloom-filters-and-statistics/ |wayback=20160304183122 |text=Archivierte Kopie<ins style="font-weight: bold; text-decoration: none;"> }}{{Abrufdatum</ins> |<ins style="font-weight: bold; text-decoration: none;">1</ins>=<ins style="font-weight: bold; text-decoration: none;">2024</ins>-<ins style="font-weight: bold; text-decoration: none;">04</ins>-<ins style="font-weight: bold; text-decoration: none;">17</ins>}}</ref> Dies ermöglicht wesentlich performantere Abfragen, sofern die Daten sortiert sind. Moderne Datenbank-Appliances wie Oracle Exadata unterstützen diese Optimierungsmöglichkeiten und empfehlen ebenfalls, auf traditionelle Indexe aus Performance-Gründen zu verzichten.</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>Hive unterstützt die Ausführung von Abfragesprachen durch sogenannte „Engines“. MapReduce (MR) gilt als veraltet und sollte nicht mehr verwendet werden (seit 2.0 als „deprecated“ gekennzeichnet). Stattdessen wird TEZ empfohlen. Alternativ wird Spark als Engine angeboten. Beide basieren auf Optimierungsverfahren durch gerichtete azyklische Graphen.</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>Hive unterstützt die Ausführung von Abfragesprachen durch sogenannte „Engines“. MapReduce (MR) gilt als veraltet und sollte nicht mehr verwendet werden (seit 2.0 als „deprecated“ gekennzeichnet). Stattdessen wird TEZ empfohlen. Alternativ wird Spark als Engine angeboten. Beide basieren auf Optimierungsverfahren durch gerichtete azyklische Graphen.</div></td>
</tr>
<tr>
<td colspan="2" class="diff-lineno">Zeile 62:</td>
<td colspan="2" class="diff-lineno">Zeile 62:</td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>LLAP bietet einen transparenten in-memory cache der auf interaktive Big Data Warehouse Anwendungen ausgerichtet ist.<ref>https://cwiki.apache.org/confluence/display/Hive/LLAP</ref></div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>LLAP bietet einen transparenten in-memory cache der auf interaktive Big Data Warehouse Anwendungen ausgerichtet ist.<ref>https://cwiki.apache.org/confluence/display/Hive/LLAP</ref></div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>Im Sommer 2008 stellte [[Facebook]], der ursprüngliche Entwickler von Hive, das Projekt der Open-Source-Gemeinde zur Verfügung.<ref>http://www.dbms2.com/2009/05/11/facebook-hadoop-and-hive/</ref> Der von Facebook verwendete Hadoop-Cluster gehört mit etwas mehr als 100 [[Petabyte]] (Stand: August 2012) zu den größten der Welt.<ref>{{Webarchiv|url=https://de.scribd.com/doc/103621762/Big-Data-Whiteboard-082212 |wayback=20170326225931 |text=Archivierte Kopie |<del style="font-weight: bold; text-decoration: none;">archiv-bot</del>=<del style="font-weight: bold; text-decoration: none;">2019</del>-<del style="font-weight: bold; text-decoration: none;">08</del>-<del style="font-weight: bold; text-decoration: none;">24 13:50:20 InternetArchiveBot </del>}}</ref> Das Datenvolumen wuchs bis 2014 auf 300 PByte an.<ref>https://code.facebook.com/posts/229861827208629/scaling-the-facebook-data-warehouse-to-300-pb/</ref></div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>Im Sommer 2008 stellte [[Facebook]], der ursprüngliche Entwickler von Hive, das Projekt der Open-Source-Gemeinde zur Verfügung.<ref>http://www.dbms2.com/2009/05/11/facebook-hadoop-and-hive/</ref> Der von Facebook verwendete Hadoop-Cluster gehört mit etwas mehr als 100 [[Petabyte]] (Stand: August 2012) zu den größten der Welt.<ref>{{Webarchiv|url=https://de.scribd.com/doc/103621762/Big-Data-Whiteboard-082212 |wayback=20170326225931 |text=Archivierte Kopie<ins style="font-weight: bold; text-decoration: none;"> }}{{Abrufdatum</ins> |<ins style="font-weight: bold; text-decoration: none;">1</ins>=<ins style="font-weight: bold; text-decoration: none;">2024</ins>-<ins style="font-weight: bold; text-decoration: none;">04</ins>-<ins style="font-weight: bold; text-decoration: none;">17</ins>}}</ref> Das Datenvolumen wuchs bis 2014 auf 300 PByte an.<ref>https://code.facebook.com/posts/229861827208629/scaling-the-facebook-data-warehouse-to-300-pb/</ref></div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Pig ===</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Pig ===</div></td>
</tr>
<tr>
<td colspan="2" class="diff-lineno">Zeile 113:</td>
<td colspan="2" class="diff-lineno">Zeile 113:</td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>* [[SAS Institute|SAS]] ermöglicht es, SAS-Skripte verteilt auf einem Hadoop-Cluster auszuführen.</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>* [[SAS Institute|SAS]] ermöglicht es, SAS-Skripte verteilt auf einem Hadoop-Cluster auszuführen.</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>* [[Matlab]] von Mathworks unterstützt die verteilte Ausführung von Matlab-Skripten auf einem Hadoop-Cluster.</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>* [[Matlab]] von Mathworks unterstützt die verteilte Ausführung von Matlab-Skripten auf einem Hadoop-Cluster.</div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>Daneben existieren weitere Anbieter.<ref>{{Webarchiv|url=https://wiki.apache.org/hadoop/Distributions%20and%20Commercial%20Support |wayback=20170318141219 |text=Archivierte Kopie |<del style="font-weight: bold; text-decoration: none;">archiv-bot</del>=<del style="font-weight: bold; text-decoration: none;">2022</del>-<del style="font-weight: bold; text-decoration: none;">10</del>-<del style="font-weight: bold; text-decoration: none;">04 09:45:54 InternetArchiveBot </del>}}</ref></div></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>Daneben existieren weitere Anbieter.<ref>{{Webarchiv|url=https://wiki.apache.org/hadoop/Distributions%20and%20Commercial%20Support |wayback=20170318141219 |text=Archivierte Kopie<ins style="font-weight: bold; text-decoration: none;"> }}{{Abrufdatum</ins> |<ins style="font-weight: bold; text-decoration: none;">1</ins>=<ins style="font-weight: bold; text-decoration: none;">2024</ins>-<ins style="font-weight: bold; text-decoration: none;">04</ins>-<ins style="font-weight: bold; text-decoration: none;">17</ins>}}</ref></div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Literatur ==</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Literatur ==</div></td>
</tr>
</table>
MultiPolitikus
https://de.wikipedia.org/w/index.php?title=Apache_Hadoop&diff=243431223&oldid=prev
Regi51: Änderungen von 37.39.164.136 (Diskussion) auf die letzte Version von Regi51 zurückgesetzt
2024-03-25T14:56:25Z
<p>Änderungen von <a href="/wiki/Spezial:Beitr%C3%A4ge/37.39.164.136" title="Spezial:Beiträge/37.39.164.136">37.39.164.136</a> (<a href="/w/index.php?title=Benutzer_Diskussion:37.39.164.136&action=edit&redlink=1" class="new" title="Benutzer Diskussion:37.39.164.136 (Seite nicht vorhanden)">Diskussion</a>) auf die letzte Version von <a href="/wiki/Benutzer:Regi51" title="Benutzer:Regi51">Regi51</a> zurückgesetzt</p>
<table style="background-color: #fff; color: #202122;" data-mw="interface">
<col class="diff-marker" />
<col class="diff-content" />
<col class="diff-marker" />
<col class="diff-content" />
<tr class="diff-title" lang="de">
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">← Nächstältere Version</td>
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">Version vom 25. März 2024, 16:56 Uhr</td>
</tr><tr>
<td colspan="2" class="diff-lineno">Zeile 75:</td>
<td colspan="2" class="diff-lineno">Zeile 75:</td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== ZooKeeper ===</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== ZooKeeper ===</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>ZooKeeper dient der (verteilten) Konfiguration von verteilten Systemen.</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>ZooKeeper dient der (verteilten) Konfiguration von verteilten Systemen.</div></td>
</tr>
<tr>
<td colspan="2" class="diff-empty diff-side-deleted"></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td colspan="2" class="diff-empty diff-side-deleted"></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>=== Spark ===</div></td>
</tr>
<tr>
<td colspan="2" class="diff-empty diff-side-deleted"></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>[[Apache Spark|Spark]]<ref>https://spark.apache.org/</ref> ist eine in-memory Batch Processing Engine, welche vornehmlich für Machine-Learning-Anwendungen entwickelt wurde. Es werden Graphanwendungen, Streaminganwendungen und Datei-basierte Batchjobs unterstützt. Eine Machine-Learning-Anwendung, sowie eine in-memory Batch Processing SQL Engine, welche Hive unterstützt, stehen zur Verfügung.</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Flink ===</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Flink ===</div></td>
</tr>
</table>
Regi51
https://de.wikipedia.org/w/index.php?title=Apache_Hadoop&diff=243431220&oldid=prev
37.39.164.136 am 25. März 2024 um 14:56 Uhr
2024-03-25T14:56:15Z
<p></p>
<table style="background-color: #fff; color: #202122;" data-mw="interface">
<col class="diff-marker" />
<col class="diff-content" />
<col class="diff-marker" />
<col class="diff-content" />
<tr class="diff-title" lang="de">
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">← Nächstältere Version</td>
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">Version vom 25. März 2024, 16:56 Uhr</td>
</tr><tr>
<td colspan="2" class="diff-lineno">Zeile 75:</td>
<td colspan="2" class="diff-lineno">Zeile 75:</td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== ZooKeeper ===</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== ZooKeeper ===</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>ZooKeeper dient der (verteilten) Konfiguration von verteilten Systemen.</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>ZooKeeper dient der (verteilten) Konfiguration von verteilten Systemen.</div></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td colspan="2" class="diff-empty diff-side-added"></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>=== Spark ===</div></td>
<td colspan="2" class="diff-empty diff-side-added"></td>
</tr>
<tr>
<td class="diff-marker" data-marker="−"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>[[Apache Spark|Spark]]<ref>https://spark.apache.org/</ref> ist eine in-memory Batch Processing Engine, welche vornehmlich für Machine-Learning-Anwendungen entwickelt wurde. Es werden Graphanwendungen, Streaminganwendungen und Datei-basierte Batchjobs unterstützt. Eine Machine-Learning-Anwendung, sowie eine in-memory Batch Processing SQL Engine, welche Hive unterstützt, stehen zur Verfügung.</div></td>
<td colspan="2" class="diff-empty diff-side-added"></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Flink ===</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Flink ===</div></td>
</tr>
</table>
37.39.164.136
https://de.wikipedia.org/w/index.php?title=Apache_Hadoop&diff=243431213&oldid=prev
Regi51: Änderungen von 37.39.164.136 (Diskussion) rückgängig gemacht (HG) (3.4.12)
2024-03-25T14:55:45Z
<p>Änderungen von <a href="/wiki/Spezial:Beitr%C3%A4ge/37.39.164.136" title="Spezial:Beiträge/37.39.164.136">37.39.164.136</a> (<a href="/w/index.php?title=Benutzer_Diskussion:37.39.164.136&action=edit&redlink=1" class="new" title="Benutzer Diskussion:37.39.164.136 (Seite nicht vorhanden)">Diskussion</a>) rückgängig gemacht (<a href="/wiki/Wikipedia:Huggle" title="Wikipedia:Huggle">HG</a>) (3.4.12)</p>
<table style="background-color: #fff; color: #202122;" data-mw="interface">
<col class="diff-marker" />
<col class="diff-content" />
<col class="diff-marker" />
<col class="diff-content" />
<tr class="diff-title" lang="de">
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">← Nächstältere Version</td>
<td colspan="2" style="background-color: #fff; color: #202122; text-align: center;">Version vom 25. März 2024, 16:55 Uhr</td>
</tr><tr>
<td colspan="2" class="diff-lineno">Zeile 44:</td>
<td colspan="2" class="diff-lineno">Zeile 44:</td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Transparente Kompression ===</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>=== Transparente Kompression ===</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>Hadoop unterstützt die transparente Kompression von Dateien zur optimalen Speicher- und Ressourcen-Unterstützung. Es wird eine Vielzahl von Formaten unterstützt, darunter [[Snappy (Datenkompressionssoftware)|Snappy]] für schnelle Komprimierung, [[zlib]] für hohe Kompressionsraten und [[Bzip2]] für höchste Komprimierung. Es können beliebige weitere Formate Hadoop-Anwendungen transparent zur Verfügung gestellt werden. Kompression kann zur Verbesserung der Performance führen, da diese die notwendigen IO-Operationen signifikant reduziert. Jedoch sind nicht alle Kompressionstypen "splitable", d.&nbsp;h. parallel dekomprimierbar. Dies umgehen moderne Dateiformate, wie ORC oder Parquet, indem sie die zu komprimierenden Dateien intern in Blöcke aufteilen. Dadurch ist jedes Kompressionsformat geeignet, um die Dateien parallel zu verarbeiten.</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>Hadoop unterstützt die transparente Kompression von Dateien zur optimalen Speicher- und Ressourcen-Unterstützung. Es wird eine Vielzahl von Formaten unterstützt, darunter [[Snappy (Datenkompressionssoftware)|Snappy]] für schnelle Komprimierung, [[zlib]] für hohe Kompressionsraten und [[Bzip2]] für höchste Komprimierung. Es können beliebige weitere Formate Hadoop-Anwendungen transparent zur Verfügung gestellt werden. Kompression kann zur Verbesserung der Performance führen, da diese die notwendigen IO-Operationen signifikant reduziert. Jedoch sind nicht alle Kompressionstypen "splitable", d.&nbsp;h. parallel dekomprimierbar. Dies umgehen moderne Dateiformate, wie ORC oder Parquet, indem sie die zu komprimierenden Dateien intern in Blöcke aufteilen. Dadurch ist jedes Kompressionsformat geeignet, um die Dateien parallel zu verarbeiten.</div></td>
</tr>
<tr>
<td colspan="2" class="diff-empty diff-side-deleted"></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td colspan="2" class="diff-empty diff-side-deleted"></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>=== Transparente Dateiformatunterstützung ===</div></td>
</tr>
<tr>
<td colspan="2" class="diff-empty diff-side-deleted"></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>Hadoop unterstützt transparent die Verwendung unterschiedlicher Dateiformate je nach Anwendung. Unterstützt werden sowohl unstrukturierte als auch strukturierte Formate, darunter einfache Textformate wie [[CSV (Dateiformat)|CSV]], [[JSON]] aber auch hochoptimierte Schemabasierende Dateien ([[Apache Avro]]) und hochoptimierte tabulare Formate wie ORC und Parquet. Daneben können weitere Dateiformate einfach entwickelt werden. Weitere Plugins unterstützen die Analyse von CryptoLedgern.</div></td>
</tr>
<tr>
<td colspan="2" class="diff-empty diff-side-deleted"></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td colspan="2" class="diff-empty diff-side-deleted"></td>
<td class="diff-marker" data-marker="+"></td>
<td style="color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>[[Extensible Markup Language|XML]] gilt im Hadoop-Ökosystem als veraltet, da es sich nicht für hochperformante Big-Data-Anwendungen eignet. Stattdessen wird empfohlen, Apache Avro als Austauschformat zu nutzen und ORC oder Parquet als Abfrageformat für hochstrukturierte Daten.</div></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><br /></td>
</tr>
<tr>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Erweiterungen ==</div></td>
<td class="diff-marker"></td>
<td style="background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;"><div>== Erweiterungen ==</div></td>
</tr>
</table>
Regi51