EP_037 Multimodale KI-Modelle KI-gestützte Softwareentwicklung 24 min

Gemini 3: Besser als GPT-5? Ein Betriebssystem in einer Nacht coden

Erschienen 03. Dezember 2025

// Hören auf YouTube ↗ Spotify ↗ Apple ↗

// TeilenX LinkedIn WhatsApp Telegram E-Mail

// Lieber nur Audio? Bei Spotify hören

// KI-Zusammenfassung

Googles Gemini 3 Modell wird als das neue State of the Art KI-Modell vorgestellt, das Chat GPT in seinen Fähigkeiten übertrifft. Die Folge beleuchtet Googles Comeback als Pionier der LLMs, die multimodalen Fähigkeiten von Gemini 3, seine beeindruckenden Coding-Fähigkeiten und den strategischen Vorteil durch Googles umfassendes Ökosystem. Sie richtet sich an alle, die sich für die aktuelle Entwicklung im KI-Wettbewerb interessieren.

Kapitel

01
0:00
Intro: Google schlägt zurück (Gemini 3 Release)
02
1:05
Das Comeback: Transformer-Paper & DeepMind
03
4:03
Multimodalität & Coding: Das "Jens OS" Experiment
04
6:47
Agenten & Reasoning: Reiseplanung mit KI (Manus AI?)
05
9:32
Der ARC-AGI Benchmark: Ist das schon AGI?
06
11:22
Der unfaire Vorteil: Googles Ökosystem (Android, Workspace)
07
12:33
150 Mrd. Cashflow: Google vs. OpenAI (und der Oracle Crash)
08
13:50
Der Apple-Deal: Rettung für Siri?
09
19:10
Die "Kill Zone": Haben Startups noch eine Chance?

Shownotes

Willkommen zu Episode 37 von Co-Intelligence!

Google ist zurück – und wie. Mit Gemini 3 legt der Tech-Gigant ein beeindruckendes Comeback hin. Benjamin Wüstenhagen und Moritz Heiniger (mit Kamerahund Nala) analysieren die Lage: Warum das legendäre "Attention is all you need"-Paper (2017) den Grundstein legte und wie Google jetzt seine Muskeln spielen lässt.

Wir testen die neuen Fähigkeiten: Ein KI-Modell, das in einer Nacht ein Betriebssystem ("Jens OS") codet, Videos und Code multimodal versteht und im ARC-AGI Benchmark neue Maßstäbe setzt.

Doch es geht nicht nur um Technik: Wir beleuchten Googles unfairen Vorteil – 150 Milliarden Dollar Free Cash Flow (vs. OpenAI, die Funding brauchen) und das gigantische Ökosystem. Dazu: Der Mega-Deal mit Apple (Siri x Gemini?) und der Oracle-Crash, der zeigt, wie abhängig die Konkurrenz ist.

Ist das die "Kill Zone" für Startups?

⏱ TIMESTAMPS

↗ ERWÄHNUNGEN & LINKS

Erkenntnisse

1:04
Google's Gemini 3 ist das aktuelle State of the Art KI-Modell und übertrifft in seinen Fähigkeiten andere Modelle wie Chat GPT.
2:08
Google-Wissenschaftler legten 2017 mit dem Paper "Attention is all you need" die Grundlage für das Transformer Modell und damit für Large Language Modelle.
5:30
Gemini 3 arbeitet nativ multimodal, kann also Text, Bilder, Videos und Audio verarbeiten und generieren, und besitzt verbesserte Reasoning- und Planning-Fähigkeiten für agentische Tätigkeiten.
6:33
Die Coding-Fähigkeiten von Gemini 3 sind so weit fortgeschritten, dass ein Nicht-Entwickler ein sprachgesteuertes Betriebssystem inklusive Anwendungen in einer Nacht erstellen konnte.
12:19
Googles umfassendes Ökosystem (Suche, Workspace, Maps, YouTube, Android) bietet einen strategischen Vorteil für die KI-Adoption und Datensammlung, was ein entscheidender Faktor im Wettbewerb ist.

Zitate

„Tot gesagte leben länger. Google ist zurück, der Erfinder der LLMs, der ein bisschen gebraucht hat,"

0:00
„Google hat gestern Abend und wir konnten schon ein bisschen rumspielen und haben schon tolle Sachen ausprobieren, das neueste Modell rausgebracht und das hat alle, ich habe nicht überrascht, aber zumindest sehr begeistert in den Fähigkeiten."

0:49
„Die Grundlage gelegt für das für das Transformer Modell. Und zwar in dem Paper, was viele wahrscheinlich schon mal gehört haben, Attention is all you need"

2:08
„Wenn jemand, der nicht entwickeln kann, ein kleines Betriebssystem bauen kann, ist ja schon irgendwie spannend."

7:27
„Hypothese. Aber ich meine Google hat eine Sache, die Open AI nicht hat und das ist ein 150 Milliarden Free Cashflow jedes Jahr, ne?"

13:26

Zahlen

12 oder 14 %

Google verdiente im letzten Quartalsbericht mehr Geld mit Google Ads trotz KI-Suche.

4:00
60 %

Gemini 3 erfüllt die Arc AGI 2 Tests, während andere Modelle nur einen Bruchteil erreichen.

10:38
150 Milliarden

Google hat einen jährlichen Free Cashflow.

13:26
20 Milliarden

Apple erhält von Google einen zweistelligen Milliardenbetrag für die Voreinstellung von Google als Standardsuche auf iPhones.

14:41

Häufige Fragen

Was macht Google Gemini 3 zum aktuellen State of the Art KI-Modell? ▾

Gemini 3 übertrifft andere Modelle wie Chat GPT in seinen Fähigkeiten und wurde von Google als das neueste und leistungsstärkste Modell vorgestellt. Es begeistert durch seine multimodalen Fähigkeiten und verbesserte Reasoning- und Planning-Skills, die es besonders für komplexe agentische Aufgaben qualifizieren.

Welche Rolle spielte Google bei der Entwicklung von Large Language Modellen (LLMs)? ▾

Google-Wissenschaftler waren Pioniere in der LLM-Entwicklung. Sie legten 2017 mit dem Paper "Attention is all you need" die entscheidende Grundlage für das Transformer Modell, welches die Basis für heutige Large Language Modelle wie Chat GPT bildet.

Wie demonstriert Gemini 3 seine fortgeschrittenen Coding-Fähigkeiten? ▾

Ein Nicht-Entwickler konnte mit Gemini 3 ein sprachgesteuertes Betriebssystem namens "Jens OS" in weniger als einer Nacht entwickeln. Dieses System enthielt Anwendungen wie Notepad, Terminal und einen App Builder, und konnte komplett per Voice gesteuert werden, was die Demokratisierung der Softwareentwicklung zeigt.

Welchen strategischen Vorteil hat Google im KI-Wettbewerb? ▾

Google profitiert von seinem riesigen Ökosystem, das Google Suche, Workspace, Maps, YouTube und Android umfasst. Diese breite Distribution und die Integration von Gemini in diese Dienste ermöglichen eine massive Datensammlung und Adoption, was als entscheidender Flaschenhals für den Erfolg von KI-Modellen gilt.

Warum ist Googles Free Cashflow relevant für den KI-Wettbewerb? ▾

Google verfügt über einen jährlichen Free Cashflow von 150 Milliarden Dollar, den es in Modelle und Infrastruktur investieren kann. Dieser finanzielle Vorteil ermöglicht es Google, massive Investitionen zu tätigen und Verträge zu erfüllen, was Konkurrenten wie OpenAI, die auf externe Finanzierung angewiesen sind, schwerfällt.

Wie beeinflusst die Integration von Gemini in Apple-Produkte den Markt? ▾

Google hat einen Vertrag mit Apple abgeschlossen, um Gemini als Hauptmodell für die Powering von Siri und anderen Apple-Systemen zu nutzen. Dies erweitert Googles Reichweite erheblich, da es nun nicht nur auf Android-Geräten, sondern auch auf iPhones als Standard-KI-System fungiert, was die Adoption weiter vorantreibt.

Anleitungen

So entwickelst du Software mit Gemini 3

Gemini 3 ermöglicht es dir, komplexe Software wie ein sprachgesteuertes Betriebssystem mit integrierten Anwendungen zu erstellen, selbst wenn du kein erfahrener Coder bist.

01

Nutze die Coding-Fähigkeiten von Gemini 3

Das Modell kann aus einfachen Prompts heraus ein komplettes Betriebssystem mit Anwendungen wie einem Notepad, Terminal oder App Builder entwickeln.

6:01
02

Steuere Anwendungen per Voice

Du kannst das erstellte System vollständig per Sprachbefehl steuern, um Hintergründe zu ändern oder integrierte Apps zu öffnen.

6:50
03

Erstelle Apps innerhalb des Systems

Innerhalb des von Gemini 3 generierten Betriebssystems kannst du weitere Apps, wie ein Snake-Spiel, entwickeln und direkt nutzen.

6:50

Weitere Fragen

Warum sollten Unternehmen überlegen, von ChatGPT zu Gemini zu wechseln? ▾

Wenn dein Unternehmen bereits Google Workspace nutzt, ist Gemini dort oft schon integriert. Es lohnt sich finanziell kaum, zusätzlich für ChatGPT-Lizenzen zu zahlen, wenn das native System ähnliche Ergebnisse liefert.

„Warum sollst du dann noch mal ein paar tausend Euro, wenn du es das ganze Jahr rechnest für alle Mitarbeiter an Chat GPT überweisen, wenn du am Ende das gleiche Ergebnis hast." · 18:33

Was macht Gemini 3 technisch besonders im Vergleich zu älteren Modellen? ▾

Gemini 3 arbeitet nativ multimodal und kann selbstständig zwischen Text, Bild, Video und Audio entscheiden. Zudem sind die Coding-Fähigkeiten so stark, dass selbst Nicht-Entwickler in kürzester Zeit komplexe Anwendungen bauen können.

„Sondern vor allen Dingen so schreibt es The Verge auch nativ multimodal arbeitet, also von sich aus sozusagen entscheidet, nimmt es jetzt oder hat es ein Sound Output, hat es ein Bild Output, hat es ein Video Output" · 5:30

Eignet sich Gemini 3 für agentische Aufgaben und komplexe Workflows? ▾

Ja, Google hat bei Gemini 3 gezielt die Reasoning- und Planungsfähigkeiten ausgebaut. Das Modell kann mehrstufig vorgehen und Aufgaben selbstständig planen, ohne dass du zwingend zusätzliche Software benötigst.

„Dass sie vor allen Dingen Reasoning Fähigkeiten ausgebaut haben, also alles was Schlussfolger angeht, und auch so Planning Fähigkeiten, sprich mehrstufiges Vorgehen und deswegen soll dieses Modell Gemini 3 jetzt besonders gut sein bei agentischen Tätigkeiten" · 7:45

Welchen strategischen Vorteil hat Google gegenüber Konkurrenten wie OpenAI? ▾

Google profitiert von einem massiven Ökosystem aus Android, Workspace und YouTube, was eine schnelle Verbreitung der KI ermöglicht. Zudem finanziert Google seine Infrastruktur aus einem enormen jährlichen Cashflow, während andere auf externe Investoren angewiesen sind.

„Und die kann man wirklich 150 Milliarden Cashflow jedes Jahr aus dem bestehenden Geschäft investieren und das ist halt schon ja, fast ein unfairer Wettbewerbsvorteil gegenüber den" · 14:11

Was bedeutet die Dominanz von Google und Microsoft für kleinere KI-Startups? ▾

Große Player integrieren Standardfunktionen wie Meeting-Zusammenfassungen zunehmend nativ in ihre Tools. Startups haben nur dann eine Chance, wenn sie spezielle Benutzeroberflächen für Nischen-Workflows bauen oder exklusiven Zugriff auf proprietäre B2B-Daten haben.

„Und das zweite sind halt, wenn du ein Startup in irgendeiner Branche oder Nische bist, wo du halt Zugriff auf irgendwelche Daten hast, auf die halt die großen keinen Zugriff haben" · 20:51