// Wissen

Modelle

KI-Modelle wie GPT-4, Claude, Gemini.

Diese Kategorie beleuchtet aktuelle KI-Modelle, darunter führende Large Language Models wie GPT-5, Google Gemini und Claude Opus. Sie umfasst eine Bandbreite von multimodalen Systemen wie Sora und DALL-E bis zu effizienten On-Device-Modellen wie Phi-3-mini und Gemini Nano. Der Schwerpunkt liegt auf fortgeschrittenem Reasoning, Coding und der Verarbeitung verschiedener Datenformate, ergänzt durch Open-Weights-Alternativen wie Llama 4.

// 33 Modelle · Seite 1/2

// Aktualisiert: 12. Mai 2026

Google Gemini

Modelle · 14 Erwähnungen

↗

Google Gemini ist eine Familie multimodaler KI-Modelle von Google, die Text, Code, Bilder, Audio und Video verarbeiten kann. Operator:innen nutzen es, um komplexe Daten zu analysieren, Code zu generieren oder agentische Anwendungen über die API zu entwickeln. Es zeichnet sich durch native Multimodalität und lange Kontextfenster aus, die eine tiefgreifende Analyse großer Datensätze ermöglichen.
GPT-5

Modelle · 14 Erwähnungen

↗

GPT-5 ist das aktuelle Flaggschiff-Sprachmodell von OpenAI. Es deckt Reasoning, multimodale Eingabe und Tool-Use ab und laeuft als Backend hinter ChatGPT-Pro-Features.
Reasoning Modelle

Modelle · 5 Erwähnungen

↗

Reasoning Modelle sind eine Kategorie von Large Language Models (LLMs), die darauf trainiert sind, komplexe Probleme in logische Schritte zu zerlegen und Schlussfolgerungen zu ziehen. Du setzt sie ein, um Aufgaben in Bereichen wie Mathematik, Coding oder strategischer Entscheidungsfindung zu lösen, die ein strukturiertes, schrittweises Vorgehen erfordern. Sie zeichnen sich dadurch aus, dass sie durch die Generierung von Zwischenschritten („Chain-of-Thought“) eine „Denkzeit“ einlegen, um präzisere und fundiertere Antworten zu liefern.
DeepSeek

Modelle · 3 Erwähnungen

↗

DeepSeek ist eine Familie von Large Language Models (LLMs) des chinesischen KI-Unternehmens DeepSeek AI. Du kannst sie für allgemeine KI-Anwendungen, komplexe Reasoning-Aufgaben, Coding oder multimodales Verständnis nutzen. Ihre Open-Source-Verfügbarkeit und effiziente MoE-Architektur heben sie vom Wettbewerb ab.
Gemini 2.5

Modelle · 3 Erwähnungen

↗

Gemini 2.5 ist eine Familie multimodaler KI-Modelle von Google DeepMind, die für komplexe Aufgaben entwickelt wurde. Du nutzt sie für erweiterte Code-Analyse, tiefgehende Datenverarbeitung und multimodales Verständnis, unterstützt durch ein langes Kontextfenster von bis zu 1 Million Tokens. Die Varianten wie Gemini 2.5 Pro und Flash bieten dir hohe Qualität oder Effizienz für anspruchsvolle Unternehmensanwendungen.
Veo

Modelle · 2 Erwähnungen

↗

Veo ist ein fortschrittliches Video-Generierungsmodell von Google DeepMind. Du kannst damit aus Textbeschreibungen oder Bildern realistische Videos mit hoher Detailtreue, konsistenten Charakteren und passendem Audio erstellen. Es bietet erweiterte kreative Kontrolle, unterstützt 4K-Auflösung und generiert nativ synchronisierten Ton.
Nano Banana

Modelle · 2 Erwähnungen

↗

Nano Banana ist ein KI-Bildmodell von Google, das auf der Gemini-Familie basiert und fortschrittliche Bildgenerierung und -bearbeitung ermöglicht. Du kannst damit detaillierte, hochwertige Bilder erstellen und bearbeiten, von Marketing-Mockups bis zu komplexen Szenen. Es zeichnet sich durch schnelles Rendering, konsistente Charakterdarstellung und tiefes Prompt-Verständnis aus.
Gemini Modelle

Modelle · 2 Erwähnungen

↗

Gemini Modelle sind eine Familie multimodaler KI-Modelle von Google, die Text, Code, Bilder, Audio und Video verarbeiten und generieren können. Du nutzt sie für komplexe Schlussfolgerungen, die Entwicklung von AI-Agenten und die Automatisierung anspruchsvoller Workflows. Ihre Stärke liegt in der Verarbeitung großer Kontextfenster, um umfangreiche Datensätze wie Codebasen oder lange Videos zu analysieren.
Sora

Modelle · 2 Erwähnungen

↗

Sora ist ein Text-zu-Video-Modell von OpenAI, das realistische und fantasievolle Videoszenen aus Textanweisungen oder Bildern generiert. Es ermöglicht Operator:innen, schnell visuelle Inhalte zu erstellen und zu bearbeiten. Beachte jedoch, dass OpenAI die Einstellung der Sora-App und API für April bzw. September 2026 angekündigt hat.
GPT-4.5

Modelle · 2 Erwähnungen

↗

GPT-4.5 ist ein großes Sprachmodell von OpenAI, das am 27. Februar 2025 als Forschungs-Preview veröffentlicht wurde. Es wurde entwickelt, um durch skaliertes unüberwachtes Lernen natürlichere Konversationen zu ermöglichen, Muster besser zu erkennen und kreative Einblicke zu generieren. Obwohl es eine breitere Wissensbasis und weniger Halluzinationen bietet, war es nicht primär für komplexe logische Schlussfolgerungen oder als "Frontier Model" konzipiert.
OpenAI o3

Modelle · 1 Erwähnung

↗

OpenAI o3 ist ein fortschrittliches Reasoning-Modell von OpenAI, das für komplexe Aufgaben in Logik, Programmierung, Mathematik und wissenschaftlicher Analyse entwickelt wurde. Es löst Probleme durch mehrstufiges logisches Denken und widmet sich der Analyse mit erhöhter Rechenzeit. Damit bietet es Operator:innen eine höhere Genauigkeit bei schwierigen Herausforderungen im Vergleich zu schnelleren, aber weniger tiefgründigen Modellen.
GPT-1

Modelle · 1 Erwähnung

↗

GPT-1 ist das erste Generative Pre-trained Transformer (GPT) Sprachmodell von OpenAI. Es wurde 2018 veröffentlicht und nutzte einen Transformer-Decoder, um durch unüberwachtes Vortraining und anschließendes Fine-Tuning verschiedene NLP-Aufgaben zu lösen. Es legte den Grundstein für die Entwicklung nachfolgender, größerer GPT-Modelle und zeigte das Potenzial von Transfer Learning in der NLP auf.
Phi-3-mini

Modelle · 1 Erwähnung

↗

Phi-3-mini ist ein Small Language Model (SLM) von Microsoft, das trotz seiner geringen Größe eine hohe Leistungsfähigkeit bietet. Du kannst es für effiziente KI-Anwendungen in ressourcenbeschränkten Umgebungen oder auf Edge-Geräten einsetzen, etwa für Textgenerierung oder Chatbots. Es übertrifft in Benchmarks oft Modelle, die doppelt so groß sind, und ist für die lokale Ausführung optimiert.
Gemini Nano

Modelle · 1 Erwähnung

↗

Gemini Nano ist ein effizientes, auf Geräten laufendes KI-Modell von Google. Es ermöglicht Entwickler:innen, generative KI-Erlebnisse direkt auf Android-Geräten zu realisieren, ohne Cloud-Anbindung oder Datenversand. Dies fördert Datenschutz und Offline-Funktionalität, wobei die Inferenzgeschwindigkeit von der Gerätehardware abhängt.
Claude Opus

Modelle · 1 Erwähnung

↗

Claude Opus ist ein fortschrittliches großes Sprachmodell von Anthropic, das als das leistungsfähigste Modell der Claude-Reihe gilt. Du setzt es für anspruchsvolle Aufgaben wie komplexes Software-Engineering, agentische Workflows und die Analyse hochauflösender Bilder ein. Es überzeugt durch verbesserte Fähigkeiten in der Code-Generierung, präziserer Befolgung komplexer Anweisungen und der Selbstverifizierung von Ausgaben.
GPT-4.1

Modelle · 1 Erwähnung

↗

GPT-4.1 ist ein großes Sprachmodell von OpenAI, das im April 2025 veröffentlicht wurde. Es bietet Entwickler:innen verbesserte Coding-Fähigkeiten, präzisere Befolgung von Anweisungen und ein Kontextfenster von bis zu einer Million Token für komplexe Aufgaben und Datenanalysen.
Mistral Medium 3.5

Modelle · 1 Erwähnung

↗

Mistral Medium 3.5 ist ein fortschrittliches, multimodales Sprachmodell von Mistral AI. Es wurde für anspruchsvolle Unternehmensanwendungen wie agentische Workflows, Coding und komplexe, mehrstufige Schlussfolgerungen entwickelt. Das Modell zeichnet sich durch eine hohe Leistung bei gleichzeitig optimierter Kosteneffizienz und Flexibilität für lokale Bereitstellungen aus.
Claude Sonnet

Modelle · 1 Erwähnung

↗

Claude Sonnet ist das Workhorse-Modell von Anthropic — schneller und guenstiger als Opus, staerker als Haiku. Deckt den Grossteil produktiver Anwendungsfaelle ab, von Content bis Code.
DALL-E

Modelle · 1 Erwähnung

↗

DALL-E ist ein Text-zu-Bild-Modell von OpenAI, das digitale Bilder aus natürlichen Sprachbeschreibungen generiert. Operator:innen nutzen es, um schnell visuelle Konzepte, Designelemente oder Marketingmaterialien zu erstellen. Es zeichnet sich durch die Fähigkeit aus, komplexe Prompts zu verstehen und detailreiche Bilder, inklusive lesbarem Text, zu erzeugen.
Gemini 1.0

Modelle · 1 Erwähnung

↗

Gemini 1 ist die erste Generation der multimodalen Large Language Models (LLMs) von Google DeepMind. Es wurde entwickelt, um Text, Code, Audio, Bilder und Video zu verarbeiten und dient als Grundlage für diverse KI-Anwendungen und Produkte von Google. Die Modelle der Gemini 1.0-Familie sind für unterschiedliche Aufgaben und Geräte optimiert, von komplexen Aufgaben bis hin zu On-Device-Anwendungen.
Large Language Models (LLMs)

Modelle · 1 Erwähnung

↗

Large Language Models (LLMs) sind eine Kategorie von Deep-Learning-Modellen, die auf riesigen Textdatenmengen trainiert werden, um natürliche Sprache zu verstehen und zu generieren. Du nutzt sie für vielfältige Aufgaben wie Textzusammenfassungen, Content-Erstellung, Code-Generierung oder zur Automatisierung von Kundenservice-Interaktionen. Sie bilden die Basis vieler generativer KI-Anwendungen, können aber auch ungenaue Informationen (Halluzinationen) liefern.
Veo 3

Modelle · 1 Erwähnung

↗

Veo 3 ist ein Text-zu-Video-Modell von Google DeepMind, das hochauflösende Videos generiert. Du kannst damit aus Textbeschreibungen realistische Videos mit synchronisiertem Audio erstellen, ideal für Marketing, Content-Produktion oder schnelle Prototypen. Es zeichnet sich durch verbesserte Realismus, physikalische Korrektheit und die Fähigkeit aus, auch Dialoge und Soundeffekte nativ zu erzeugen.
GPT-4

Modelle · 1 Erwähnung

↗

GPT-4 ist ein großes multimodales Modell von OpenAI, das sowohl Text- als auch Bildeingaben verarbeiten und Textausgaben generieren kann. Du nutzt es für anspruchsvolle Aufgaben wie Content-Erstellung, Code-Assistenz oder komplexe Datenanalyse, da es menschenähnliche Leistungen bei vielen professionellen Benchmarks zeigt. Es übertrifft seine Vorgänger in Zuverlässigkeit, Kreativität und der Fähigkeit, komplexe Anweisungen zu verarbeiten.
Marco MT

Modelle · 1 Erwähnung

↗

Marco MT ist ein großes Sprachmodell (LLM) der Alibaba International Digital Commerce Group, das für präzise Übersetzungen in grenzüberschreitenden E-Commerce-Szenarien und alltäglicher Kommunikation entwickelt wurde. Es hilft dir, Produktbeschreibungen und Kundenservice zu lokalisieren, indem es kulturelle Nuancen und idiomatische Ausdrücke besser erfasst als viele bestehende Tools und 15 Sprachen unterstützt.
Gemini 2.5 Pro

Modelle

↗

Gemini 2.5 Pro ist das Flaggschiff-Modell von Google fuer komplexe Tasks — Reasoning, Multi-Step-Planung, Coding. Bietet eines der groessten Context-Windows am Markt.
Perplexity Sonar

Modelle

↗

Sonar ist Perplexitys eigenes Sprachmodell, das direkt auf Web-Suche spezialisiert ist. Liefert Antworten mit Quellen und nutzt Real-Time-Retrieval statt nur Training-Data.
Gemini Flash

Modelle

↗

Gemini Flash ist Googles latenz-optimiertes Modell fuer High-Volume-Anwendungen. Eingesetzt wenn Kosten und Response-Time wichtiger sind als maximale Tiefe.
Grok 4

Modelle

↗

Grok 4 ist das aktuelle Modell von xAI (Elon Musks KI-Firma), integriert in X/Twitter. Fokus auf Echtzeit-Web-Zugriff und direkter Persoenlichkeit.
GPT-3

Modelle

↗

GPT-3 ist ein großes Sprachmodell von OpenAI, das auf einer riesigen Datenmenge trainiert wurde. Du kannst es über die API nutzen, um menschenähnliche Texte zu generieren, zu übersetzen, zusammenzufassen oder Fragen zu beantworten. Es zeichnete sich durch seine 175 Milliarden Parameter und die Fähigkeit zum Zero- und Few-Shot-Learning aus.
Llama 4

Modelle

↗

Llama 4 ist die aktuelle Generation von Metas offener Modellfamilie. Open-Weights-Modelle, die selbstgehostet werden koennen — relevante Alternative zu proprietaeren APIs fuer Firmen mit Daten-Sensibilitaet.

Modelle

Google Gemini

GPT-5

Reasoning Modelle

DeepSeek

Gemini 2.5

Veo

Nano Banana

Gemini Modelle

Sora

GPT-4.5

OpenAI o3

GPT-1

Phi-3-mini

Gemini Nano

Claude Opus

GPT-4.1

Mistral Medium 3.5

Claude Sonnet

DALL-E

Gemini 1.0

Large Language Models (LLMs)

Veo 3

GPT-4

Marco MT

Gemini 2.5 Pro

Perplexity Sonar

Gemini Flash

Grok 4

GPT-3

Llama 4