DeepSeek und ChatGPT – Sputnik Momente für Bildung und Wirtschaft?
Was ist da im Januar 2025 passiert? Was ist ein Sputnik Moment? Vor zwei Jahren hätte man «gegoogelt», heute fragen wir KI-Modelle.
Von Stephan Jüngling und Peter Bachmann.
Wir befragen zuerst ChatGPT und dann DeepSeek, um die Antworten der beiden KI-Modelle vergleichen zu können.
In wenigen Sekunden ist der Begriff Sputnik Moment erklärt, der sich auf einen plötzlichen und dramatischen technologischen Durchbruch bezieht, der eine Nation dazu zwingt, ihre wissenschaftlichen und technologischen Anstrengungen zu intensivieren. Danach wird der Einfluss auf Wirtschaft und Bildungswesen in der für ChatGPT typischen Aufzählungsart strukturiert und kurz beschrieben:
Wirtschaft:
- China: DeepSeek hat die Effizienz in verschiedenen Industrien gesteigert, indem es präzise Datenanalysen und Vorhersagen ermöglicht. Dies hat zu einer beschleunigten technologischen Entwicklung und einer stärkeren globalen Wettbewerbsfähigkeit geführt.
- Westliche Welt: In den westlichen Ländern hat DeepSeek die Innovationskraft in Unternehmen erhöht, indem es neue Geschäftsmodelle und Marktstrategien unterstützt. Dies hat zu einem verstärkten Fokus auf Forschung und Entwicklung geführt, um mit den Fortschritten in China Schritt zu halten.
Bildungswesen:
- China: DeepSeek hat das Bildungssystem revolutioniert, indem es personalisierte Lernpläne und maßgeschneiderte Bildungsinhalte bereitstellt. Dies hat die Lernmotivation und -effizienz der Studierenden erheblich verbessert.
- Westliche Welt: In westlichen Universitäten hat DeepSeek die Art und Weise verändert, wie Wissen vermittelt und erworben wird. Es hat die Rolle der Lehrkräfte neu definiert und den Fokus auf die Entwicklung kritischer Denkfähigkeiten und kreativer Problemlösungen gelegt.
Danach schliesst der Chat mit einer Abschluss-Bemerkung: «Insgesamt hat DeepSeek einen globalen Wettlauf um technologische Vorherrschaft ausgelöst, der sowohl Chancen als auch Herausforderungen für die beteiligten Nationen mit sich bringt».
Danach folgen drei Referenzen auf weiterführende Artikel, von welchem der erste Link auf unesdoc.unesco.org verweist, und einen HTTP-Status code 404 Error retourniert, weil er nicht vorhanden ist. Der zweite verweist auf einen wertvollen Artikel von Idris et. al (2024) mit dem Titel: «Revolutionizing Higher Education: Unleashing the Potential of Large Language Models for Strategic Transformation» - Passt! Die dritte Referenz zeigt auf einen News-Artikel in der *.cn Domäne in Chinesischer Sprache, der mindestens teilweise mit Hilfe von Browser Plugins ins Englische übersetzt werden kann (Ji et. al, 2023).
Der Artikel beschreibt die Ergebnisse eines Tests von fünf chinesischen grossen KI-Modellen in Hochschulen. Die Modelle wurden in verschiedenen Szenarien wie Lernunterstützung, Schreibhilfe, Chat-Begleitung und Arbeitsunterstützung getestet. Die Autoren stellten fest, dass die chinesischen Modelle in bestimmten Bereichen vorsichtiger und genauer sind als ChatGPT. Der Artikel betont die Bedeutung der Entwicklung und Anwendung von KI-Modellen in China und die Herausforderungen, die damit verbunden sind. Obwohl der Artikel auf Chinesisch ist, wird die Referenzangabe sowie die kurze Zusammenfassung von Copilot ins Deutsche übersetzt. Praktisch!
Was meint nun aber DeepSeek zu dieser Frage? Spannend ist die Tatsache, dass das Thinking von DeepSeek auf Englisch, die nachfolgende Antwort aber ebenfalls in gutem Deutsch formuliert wird. Das Modell «denkt» während 11 Sekunden und weist auf den Start der Sputinik im Jahr 1957, welche in den USA einen Innovationsschub und Wettbewerb im Bereich der Raumfahrt auslöste. Es zieht aber auch Aspekte bei, die nebst dem Innovationsschub in beiden Ländern auch ethische Bedenken oder eine mögliche Technologiekluft zwischen den Ländern in den Kontext des LLMs einbezieht. Die finale Antwort enthält unter anderem: «… In China treibt DeepSeek die Wirtschaft durch automatisierte Lösungen für Industrie, Finanzwesen und Logistik voran, während sein Einsatz im Bildungswesen – etwa durch adaptive Lernplattformen und datengestützte Lehransätze – die Qualifikation zukünftiger Arbeitskräfte revolutioniert. Gleichzeitig löst die rasante Entwicklung in China im Westen Debatten über Wettbewerbsfähigkeit aus: Staaten wie die USA oder EU-Länder sehen sich gezwungen, Bil-dungsinitiativen zu KI-Ethik und technischer Ausbildung auszubauen, um nicht den Anschluss zu verlieren. Doch jenseits des Wettlaufs entstehen auch Kooperationsmöglichkeiten – etwa bei globalen KI-Standards oder Bildungsaustauschprogrammen –, die zeigen, dass dieser "Sputnik Moment" nicht nur Konkurrenz, sondern auch geteilten Fortschritt fördern könnte.». Referenzen wie bei Copilot werden keine angegeben.
Wie immer muss man im Umgang mit KI-generieten Inhalten diese hinterfragen. Wie im ersten Beispiel schön anhand der Referenzen nachgewiesen werden kann, bekommt man sehr viele nützliche Antworten, aber auch total falsche! Es ist also immer Vorsicht angebracht, und daher sehr wichtig, die Stärken aber auch Schwächen der einzelnen Sprachmodelle zu kennen.
Es gibt eine Unmenge an Tests und Benchmarks, welche die einzelnen Modelle und deren Eignung für unterschiedliche Anfragen wie beispielsweise GLUE (General Language Understanding Evaluation) zur Bewertung der natürlich sprachlichen Fähigkeiten, HellaSwag (Harder Endings, Longer contexts, and Low-shot Activities for Situations With Adversarial Generations) für die Fähigkeit eines Modells, logische und konsistente Fortsetzungen von Texten zu generieren, oder MMLU (Massive Multitask Language Understanding), welcher die Fähigkeit von Modellen prüft, eine Vielzahl von Aufgaben aus verschiedenen Domänen zu lösen und die Lösungen bewertet.
ChatGPT und Deepseek sind wahrscheinlich die bekanntesten von vielen hunderten fortschrittlichen KI-Modellen, die komplexe Texte generieren und menschenähnliche Interaktionen ermöglichen.
Ein Stärke von ChatGPT liegt in seiner breiten Wissensbasis und der Vielseitigkeit, die es für eine Vielzahl von Anwendungen prädestiniert. Es ist besonders effektiv in Szenarien, die eine flüssige Kommunikation erfordern und wird oft als Chatbot für den Kundenservice, zur Erstellung prägnanter Geschäftsberichte, oder dem Verfassen von Marketingmaterialien verwendet, da insbesondere die Integration als Copilot im Edge Browser oder der Office 365 Suite hervorragend sind. Darüber hinaus kann ChatGPT kreative Inhalte generieren, wie beispielsweise brandrelevante Geschichten oder ansprechende Social-Media-Posts, die zur Markenstärkung beitragen können.
Im Gegensatz eignet sich Deepseek gut für Programmierung und wissenschaftliche Texte. DeepSeek basiert auf der MoE (Mixture of Experts) Architektur, was es effizienter macht als andere Modelle, da die Tokens an verschiedene domänenspezifische Expert:innen weitergeleitet werden, aus denen die Antwort anschliessend zusammengezogen wird. DeepSeek schneidet besonders gut in MINT-Fächern (Mathematik, Informatik, Naturwissenschaften, Technik) ab.
Die grosse Sensation von Deepseek ist, dass es ein Open Source und Open Weight Modell ist. Das heisst, es kann heruntergeladen und innerhalb der eigenen Organisation (on-premise) betrieben werden kann. Weiter benötigt DeepSeek-R1 weniger Rechenleistung, verbraucht daher weniger Strom und bricht mit dem bisherigen Credo, dass «immer grössere» Modelle «immer bessere» Leistung aufweisen. Zudem hat das Startup DeepSeek ein neues Trainingsverfahren, das als «Distillation» bezeichnet wird, und grosse kontroverse Diskussionen im Silicon Valley ausgelöst hat, da es nicht wie OpenAI das Modell aufgrund der Informationen aus dem Internet trainiert, sondern wesentlich weniger Trainingsdaten benötigt, da das Modell durch Anfragen an ein bestehendes LLM, also ChatGPT, trainiert werden kann und so die Trainingskosten um ca. 90% reduziert werden konnten. Aber auch die Betriebskosten können durch kleinere Modelle wesentlich gesenkt werden können und dadurch AI auch für kleinere Unternehmen erschwinglich und kann zu einer Demokratisierung von KI führen.
ChatGPT ist zurzeit nur begrenzt unentgeltlich verfügbar. Die monatliche Gebühr beträgt stolze 20 Franken, während Deepseek gratis benützt werden kann. ChatGPT wird oft aus Datenschutzgründen nicht eingesetzt, da sämtliche Informationen an die Server von OpenAI übermittelt werden.
Auf der anderen Seite scheint bei DeepSeek für einige die Herkunft eine Rolle zu spielen. DeepSeek ist ein junges Startup Unternehmen, das 2023 in Hangzhou von Liang Wenfeng gegründet wurde. Die rund 5.6 Millionen Dollar, die gemäss Liang nötig waren um Deepseek zum Laufen zu bringen, wurden von seinem Hedge Fonds High-Flyer finanziert.
Deepseek ist wohl das bekannteste KI-Modell aus China. Doch es gibt noch andere Modelle, welche im Land selbst und rund um den Globus für Aufsehen gesorgt haben, und wohl noch werden (siehe Info Box).
Während generelle Anfragen und Arbeiten mit DeepSeek gute Resultate liefern können, sind andere Aufgaben mit Vorsicht zu geniessen. Anfragen welche in irgendeiner Weise mit der Volksrepublik China, chinesischen Firmen, der politischen Führung, seiner Geschichte, oder Welt- oder Wertansichten zu tun haben, werden sofort politisch gefärbt wiedergegeben, oder gar nicht beantwortet. Anfragen über Personen, welche China kritisch gegenüberstehen, werden verunglimpft oder das Modell gibt dazu keine Antwort. Dieser Nachbearbeitungsschritt ist allerdings bei allen LLMs implementiert, nur eben unterschiedlich.
Spannend ist nun der Umgang mit diesen generativen KI-Modellen. Wie gehen die Studierenden und Dozierenden an Universitäten mit diesen neuen Werkzeugen um? Dieser Frage gingen Studierende der FHNW und der South China University of Technology im Rahmen eines ToBIT Seminars (Topics in Business Information Systems) im Herbst 2024 nach. Dabei haben sie die Unterschiede und Gemeinsamkeiten in der Anwendung von neuen Technologien in der Westlichen Welt und in China untersucht und ihre Resultate in einem virtuellen gemeinsamen Klassenzimmer präsentiert und diskutiert.
Ein wesentlicher Unterschied liegt in der Verfügbarkeit und den Präferenzen der genutzten LLMs. In Festlandchina ist der direkte Zugriff auf ChatGPT zwar toleriert, aber illegal und daher nur über VPNs (Virtuell Private Networks) möglich. Trotzdem haben im Herbst 2024 mehr als 30 Prozent der 120 befragten chinesischen Studierenden angegeben, dass sie die ausländischen Modelle wie Chat GPT bevorzugen. Andererseits nutzten aber 60 Prozent der Studierenden die chinesischen Modelle häufiger. Genutzt werden also beide, und zwar hauptsächlich für die Unterstützung beim Lernen, zur Klärung von Aufgabenstellungen und zum Erstellen von Lösungsentwürfen und sehr häufig zur Sprachübersetzung (80 Prozent). Seltener werden sie auch für Fragen zu sozialen Problemen oder emotionalen Aspekten genutzt. Die Reaktion auf die LLM-Nutzung und die Entwicklung entsprechender Richtlinien erfolgte in westlichen Universitäten tendenziell früher und expliziter als in chinesischen.
Chinesische Universitäten erlauben die Nutzung eher stillschweigend, legen aber strenge Vorschriften insbesondere zur Nutzung für Bachelorarbeiten fest, in dem der zulässige Anteil an KI-generierten Inhalten stark begrenzt wird. Die Mehrheit der chinesischen Studierenden (86 Prozent) ist der Ansicht, dass KI-Werkzeuge ihre Lerneffizienz steigern. Tatsächlich hat die chinesische Regierung bereits 2017 mit dem «New Generation Artificial Intelligence Development Plan» eine strategische Richtung für die KI-Entwicklung und KI-Anwendung vorgegeben und bis 2020 eine Angleichung an globale KI-Technologien und deren Nutzung, bis 2025 die Erreichung bedeutender Durchbrüche in KI-Theorien und Technologien und bis 2030 ein weltweit führendes Zentrum für KI-Innovationen zu werden (Webster et. al, 2017).
Die im 2024 durchgeführte Umfrage mit Bezug zur Nutzung von ChatGPT dürfte sich aufgrund der Qualität und kostenlosen Verfügbarkeit von DeepSeek drastisch geändert haben.