DeepSeek
Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.
| |
---|---|
![]() | |
Rechtsform | Limited Company |
Gründung | März 2023 |
Sitz | Hangzhou,![]() |
Leitung | Liang Wenfeng (CEO) |
Branche | Informationstechnik Künstliche Intelligenz |
Website | www.deepseek.com |
Stand: |
DeepSeek ist ein chinesisches Startup, das sich auf die Entwicklung fortschrittlicher Sprachmodelle und künstlicher Intelligenz spezialisiert hat. Das Unternehmen gewann internationale Aufmerksamkeit mit der Veröffentlichung seines im Januar 2025 vorgestellten Modells DeepSeek R1, das mit etablierten KI-Systemen wie ChatGPT von OpenAI und Claude von Anthropic konkurriert. Das Unternehmen wird ausschließlich vom chinesischen Hedgefonds High-Flyer finanziert. Beide Unternehmen haben ihren Sitz in Hangzhou, Zhejiang.
High-Flyer und Gründung
Im Jahr 2015 wurde der Hedgefonds High-Flyer von drei Ingenieuren der Universität Zhejiang gegründet, die während der Weltfinanzkrise 2007–2008 als Studenten erste Erfahrungen im Aktienhandel gesammelt hatten.[1] High-Flyer etablierte sich schnell als innovativer Akteur im Finanzsektor, indem die Firma maschinelles Lernen zur Optimierung von Handelsstrategien einsetzte und ein KI-gestütztes Modell für den Hochfrequenzhandel entwickelte. Im Jahr 2021 startete Liang Wenfeng, einer der drei High-Flyer-Gründer, eine Forschungsgruppe für Grundlagenforschung in künstlicher Intelligenz, die als Nebenprojekt von High-Flyer finanziert wurde.[2][3]
Im April 2023 gab einer der Gründer, Liang Wenfeng, die Ausgründung der Forschungsinitiative als unabhängiges Unternehmens für künstliche Intelligenz namens DeepSeek bekannt. Ziel dieses Unternehmens ist die Entwicklung und Vermarktung einer universellen künstlichen Intelligenz basierend auf einem umfangreichen, eigens entwickelten Sprachmodell.[4]
DeepSeek verfolgt das strategische Ziel, eine leistungsfähige und wettbewerbsfähige Alternative zu westlichen KI-Lösungen bereitzustellen und gleichzeitig die technologische Souveränität Chinas zu stärken. Bereits in der frühen Phase seiner Existenz konnte das Unternehmen erhebliche finanzielle Unterstützung aus der chinesischen Technologiebranche sowie aus staatlich geförderten Innovationsprogrammen gewinnen. Laut Wenfeng werden die Forschungsergebnisse und Modelle des Unternehmens immer unter Open-Source-Lizenzen veröffentlicht, dies sei Teil der Unternehmenskultur und man habe nicht die Absicht, dies in Zukunft zu ändern.[5]
Vor dem Hintergrund der von den Vereinigten Staaten verhängten Exportbeschränkungen gegen China, die die Einfuhr leistungsfähiger Beschleuniger für das Training künstlicher Intelligenz begrenzten, wurden Anreize geschaffen, vor allem effiziente KI-Modelle zu entwickeln.[6]
Technologie
Am 20. Januar 2025[7] präsentierte DeepSeek das Large Language Model DeepSeek-R1, das auf maschinellen Lerntechnologien basiert und eine Architektur verwendet, die konzeptionell mit den gängigen Transformer-Modellen vergleichbar ist.
DeepSeek-R1 wurde unter der MIT-Lizenz veröffentlicht, die uneingeschränkten Open Access fördert und sowohl kommerzielle als auch akademische Nutzungen ohne Einschränkungen erlaubt. Damit setzt das Unternehmen bewusst einen Kontrast zu zahlreichen proprietären KI-Systemen, die durch restriktive Lizenzen gekennzeichnet sind.
Das Modell ist kostenfrei für reguläre Nutzer zugänglich und richtet sich an eine breite Anwenderschaft, um den offenen Zugang zu modernster KI-Technologie zu fördern.[8]
DeepSeek habe seine KI-Modelle so optimiert, dass der Energieverbrauch im Vergleich zu traditionellen, energieintensiveren KI-Modellen um bis zu 70 % gesenkt werden kann, was durch effizientere Algorithmen und spezialisierte Hardware ermöglicht wird.[9] Allerdings gibt es Zweifel daran, ob DeepSeek die Modelle vollständig selbst trainiert hat, oder ein bereits fertig trainiertes ChatGPT als Hilfemittel nutzte, um die Trainingszeit zu verkürzen.[10]
Mit Janus-Pro hat DeepSeek am 27. Januar 2025 ein neues multimodales KI-Modell veröffentlicht, das unter der MIT-Lizenz als Open Source verfügbar ist. Das Modell kombiniert Fähigkeiten, die sowohl DALL-E als auch Stable Diffusion ähneln, und kann Bilder erzeugen sowie analysieren. Es wurde mit Fokus auf präzise Interpretationsfähigkeiten, effiziente Architektur und optimierte Ressourcenverwendung entwickelt.[11]
Zensur und Kritik


Es wurde beobachtet, dass die offizielle API-Version von R1 bei sensiblen Themen, insbesondere solchen, die in China als politisch heikel gelten, Zensurmechanismen anwendet. So verweigert das Modell etwa Antworten auf Fragen zum Massaker auf dem Tian’anmen-Platz 1989, zur Unterdrückung der Uiguren oder Menschenrechten in China.[12] Mitunter generiert die KI eine Antwort, ersetzt diese jedoch kurz darauf durch eine Mitteilung wie: „Tut mir leid, das liegt außerhalb meines aktuellen Aufgabenbereichs. Lass uns über etwas anderes sprechen.“[13][14] Die internen Zensurmechanismen und Einschränkungen lassen sich in der quelloffenen und modifizierbaren Open-Source-Version des R1-Modells nur aufwändig entfernen. Sobald von chinesischen Internet-Regulierungsbehörden definierte „sozialistische Grundwerte“ tangiert oder die Taiwan-Frage thematisiert wird, werden Diskussionen beendet.[15] Nutzer haben beobachtet, wie DeepSeek in Echtzeit Inhalte zensiert, indem das Modell erst beginnt auf sensible Themen wie die Menschenrechte in der Volksrepublik China einzugehen, dann jedoch die generierten Antworten unmittelbar löscht und sie im nächsten Schritt durch allgemeine Mitteilungen ersetzt. R1 könne laut The Guardian aber auch ohne diese pro-chinesischen Einschränkungen heruntergeladen werden.[16]
Diese Einschränkungen sind jedoch nicht überraschend, da jedes chinesische Unternehmen, das seine Dienste in China anbietet, die Anforderungen der Regierung erfüllen muss. China hatte 2023 eine KI-Regulierung eingeführt, die den Einsatz von KI-Chatbots überhaupt erst erlaubt.[17][18]
Dem Gründer von DeepSeek, Liang Wenfeng, werden enge Verbindungen zur Kommunistischen Partei zugeschrieben. Kritiker äußern Bedenken, dass das KI-System potenziell für ausländische Einflussnahme, Desinformation, Überwachung und zur Entwicklung von Cyberwaffen, wie beispielsweise neuen Hacking-Tools für den chinesischen Geheimdienst, verwendet werden könnte. Zudem warnen Datenschützer (ähnlich wie bei TikTok), dass die App persönliche Daten nach China übermittelt.[19][20]
Reaktionen der Märkte
Nachdem die Medien die Leistungsfähigkeit des DeepSeek-KI-Modells bei vergleichsweise niedrigen Investitionen bekannt gemacht hatten, kam es Ende Januar 2025 zu einem Rückgang vieler westlicher Technologieaktien, die um 5 bis 17 Prozent fielen. Besonders betroffen war Nvidia, dessen Marktkapitalisierung am 27. Januar 2025 um 593 Milliarden US-Dollar sank – der bisher größte Tagesverlust eines Unternehmens am New Yorker Börsenplatz. Auch der Kurs des Chipherstellers Broadcom Inc. sank um 17,4 %.[21]
In den Vereinigten Staaten überholte die App von DeepSeek ChatGPT und belegte Ende Januar 2025 den ersten Platz in der Liste der am meisten heruntergeladenen iPhone-Apps.[22]
Rezeption
Bridgewater Associates prognostiziert kurzfristige Rückschläge bei Tech-Aktien durch den Wettbewerb mit DeepSeek, dessen Modell kostengünstiger und ressourcenschonender als bestehende US-Technologien sei und zur meistgeladenen KI-App im Apple App Store wurde, was die Frage aufwerfe, ob die umfangreichen Investitionen westlicher Unternehmen in KI gerechtfertigt sind. Langfristig erwartet Bridgewater jedoch, dass DeepSeeks Fortschritte die KI-Adoption weltweit beschleunigen und die Branche nachhaltig verändern werden.[23]
Weblinks
Einzelnachweise
- ↑ Billions Going to China’s Quants Takes Fight to Global Funds. Bloomberg 31. Mai 2020.
- ↑ How small Chinese AI start-up DeepSeek shocked Silicon Valley. Abgerufen am 29. Januar 2025 (britisches Englisch).
- ↑ Was du über DeepSeek wissen musst: Chinas Open-Source-KI erschreckt das Silicon Valley. 28. Januar 2025, abgerufen am 29. Januar 2025.
- ↑ Lily Ottinger: Deepseek: From Hedge Fund to Frontier Model Maker. In: chinatalk.media vom 9. Dezember 2024.
- ↑ Interview with Deepseek Founder: We're Done Following. It's Time to Lead. 26. Januar 2025, abgerufen am 29. Januar 2025 (amerikanisches Englisch).
- ↑ Warum DeepSeek die KI-Welt schockt – DW – 28.01.2025. Abgerufen am 28. Januar 2025.
- ↑ DeepSeek-R1 Release | DeepSeek API Docs. Abgerufen am 28. Januar 2025 (englisch).
- ↑ Hasan Chowdhury: Dieses chinesische KI-Startup macht OpenAI jetzt Konkurrenz – was Experten davon halten. In: Business Insider vom 25. Januar 2025.
- ↑ DeepSeek-Durchbruch revolutioniert Energieeffizienz von KI – Was bedeutet das für die globale Energiewende? cleanthinking.de. 27. Januar 2025.
- ↑ heise online: Deepseek greift nun auch noch KI-Bildgeneratoren an. 28. Januar 2025, abgerufen am 28. Januar 2025.
- ↑ https://www.heise.de/news/Deepseek-veroeffentlicht-multimodales-Modell-Janus-Pro-10258490.html Deepseek greift nun auch noch KI-Bildgeneratoren an.; DeepSeek says its Janus Pro AI model beats rivals in image generation. reuters.com. 27. Januar 2025.
- ↑ Matthew Field, James Titcomb: Chinese AI has sparked a $1 trillion panic – and it doesn’t care about free speech. In: The Telegraph. 27. Januar 2025, ISSN 0307-1235 (telegraph.co.uk [abgerufen am 28. Januar 2025]).
- ↑ Jakob Steinschaden: DeepSeek: So sieht Live-Zensur beim chinesischen AI-Chatbot aus. 27. Januar 2025, abgerufen am 27. Januar 2025.
- ↑ Jakob Steinschaden: DeepSeek: This is what live censorship looks like in the Chinese AI chatbot. 27. Januar 2025.
- ↑ The Guardian view on a global AI race: geopolitics, innovation and the rise of chaos. theguardian.com. 26. Januar 2025.
- ↑ „Chinese AI chatbot DeepSeek censors itself in realtime, users report.“ theguardian.com.
- ↑ Eike Kühl: DeepSeek: Knall mit Ansage. In: Die Zeit. 28. Januar 2025, ISSN 0044-2070 (zeit.de [abgerufen am 28. Januar 2025]).
- ↑ Silke Hahn: KI-Regulierung in China: KI-generierte Inhalte müssen wahrheitsgetreu sein. In: heise online. 18. April 2023, abgerufen am 28. Januar 2025.
- ↑ China’s DeepSeek AI poses formidable cyber, data privacy threats. In: Biometric Update. 26. Januar 2025, abgerufen am 27. Januar 2025 (amerikanisches Englisch).
- ↑ Matt Burgess: DeepSeek’s Popular AI App Is Explicitly Sending US Data to China. In: Wired. ISSN 1059-1028 (wired.com [abgerufen am 28. Januar 2025]).
- ↑ Sinéad Carew, Amanda Cooper, Ankur Banerjee: DeepSeek sparks AI stock selloff; Nvidia posts record market-cap loss. In: Reuters. 28. Januar 2025, abgerufen am 28. Januar 2025.
- ↑ kko/mak: DeepSeek versus Nvidia: Hype um chinesischen KI-Anbieter belastet Tech-Aktien. In: Spiegel Online. 28. Januar 2025, abgerufen am 28. Januar 2025.
- ↑ Carolina Mandl: Bridgewater sees short-term correction for tech stocks but bullish on DeepSeek impact. reuters.com.