Zurück zur Übersicht
Episode #1524. Juni 202456 Min.

#15 Claude 3.5 Sonnet: Neuer Benchmark-König & Artifacts Feature

Anthropic überrascht mit Claude 3.5 Sonnet – schneller und besser als Claude 3 Opus, zu einem Bruchteil der Kosten. Plus: Das neue Artifacts-Feature macht Claude zum interaktiven Coding-Partner. Wir testen und analysieren.

Zusammenfassung

Anthropic hat alle überrascht: Claude 3.5 Sonnet schlägt nicht nur GPT-4o in vielen Benchmarks, sondern auch das eigene Flaggschiff Claude 3 Opus – bei doppelter Geschwindigkeit und einem Fünftel der Kosten. Dazu kommt Artifacts: Ein Feature, das Code und Dokumente live im Chat erstellt und ausführt.

Themen & Highlights

  • 00:00 Intro: Anthropic überrascht die AI-Welt
  • 06:00 Benchmarks: Claude 3.5 Sonnet vs GPT-4o vs Claude 3 Opus – der Vergleich.
  • 20:00 Artifacts: Live-Demo des neuen interaktiven Features.
  • 35:00 Praxis-Test: Coding, Analyse, kreatives Schreiben im Vergleich.
  • 48:00 Für Entwickler: API-Preise, Migration von GPT-4, Best Practices.

Deep Dive: Claude 3.5 Sonnet, Artifacts & der neue AI-Benchmark

Das AI-Rennen nimmt eine unerwartete Wendung: Nicht das größte Modell gewinnt, sondern das effizienteste. Claude 3.5 Sonnet zeigt, dass "kleiner und schneller" auch "besser" bedeuten kann.

Die Benchmark-Überraschung

Claude 3.5 Sonnet ist das mittlere Modell der Claude 3.5 Familie – und trotzdem übertrifft es alle Konkurrenten:

  • Coding (HumanEval): 92% vs GPT-4o 90.2% vs Claude 3 Opus 84.9%
  • Reasoning (GPQA): 59.4% vs GPT-4o 53.6%
  • Math (MATH): 71.1% vs GPT-4o 76.6% (einer der wenigen Bereiche, wo GPT-4o vorne liegt)
  • Multilingual (MGSM): 91.6% vs GPT-4o 90.5%

Das Verrückte: Claude 3.5 Sonnet ist doppelt so schnell wie Claude 3 Opus und kostet nur $3/$15 pro Million Tokens (vs $15/$75 für Opus).

Artifacts: Der Game-Changer

Das wirklich Neue ist Artifacts – ein Feature, das Claude zum interaktiven Workspace macht:

  • Live Code: Generierter Code wird direkt im Browser ausgeführt
  • React Components: UI-Elemente werden live gerendert
  • SVG & Diagramme: Visualisierungen erscheinen sofort
  • Dokumente: Markdown, HTML werden formatiert angezeigt
  • Iterativ: Änderungen werden in Echtzeit aktualisiert

In der Praxis heißt das: Du fragst nach einer React-Komponente, und sie erscheint live neben dem Chat. Du kannst sie testen, Feedback geben, und Claude passt sie an – ohne Copy-Paste, ohne IDE-Wechsel.

"Artifacts verändert, wie wir mit AI coden. Es ist nicht mehr 'AI generiert, ich kopiere' – es ist ein echtes Pair Programming, wo beide Seiten in Echtzeit sehen, was passiert."

Unser Praxis-Test

Wir haben Claude 3.5 Sonnet gegen GPT-4o in realen Aufgaben getestet:

Coding (React Dashboard):

  • • Claude: Sauberer Code, bessere Komponenten-Struktur, weniger Bugs
  • • GPT-4o: Funktioniert, aber mehr Boilerplate, gelegentliche Fehler
  • Gewinner: Claude 3.5 Sonnet

Analyse (Jahresbericht):

  • • Claude: Strukturierte Zusammenfassung, gute Key-Points
  • • GPT-4o: Ähnliche Qualität, etwas ausführlicher
  • Gewinner: Unentschieden

Kreatives Schreiben (Blog-Artikel):

  • • Claude: Natürlicher Ton, weniger "AI-artig"
  • • GPT-4o: Gut, aber erkennbare Muster
  • Gewinner: Claude 3.5 Sonnet

Für Entwickler: Migration & API

Solltest du von GPT-4 zu Claude wechseln? Unsere Einschätzung:

  • Für Coding-Tasks: Ja, Claude 3.5 Sonnet ist besser und günstiger
  • Für Chat-Anwendungen: Beide gut, Präferenz-abhängig
  • Für Vision: GPT-4o hat noch leichte Vorteile
  • Für große Kontexte: Claude (200K) > GPT-4o (128K)

Die API ist fast identisch aufgebaut – Migration ist relativ einfach. Die Kosten-Ersparnis allein kann ein Grund sein, zu wechseln.

Was kommt noch?

Anthropic hat angeteasert:

  • Claude 3.5 Haiku: Noch schnelleres, günstigeres Modell
  • Claude 3.5 Opus: Das kommende Flaggschiff (Q3/Q4 2024?)
  • Memory: Claude wird sich an vorherige Gespräche erinnern
  • Tool Use: Erweiterte Fähigkeiten für Agents

Fazit

Claude 3.5 Sonnet ist der neue Sweet Spot: Besser als die teuren Flaggschiffe, schneller als die Konkurrenz, günstiger als fast alles andere. Mit Artifacts zeigt Anthropic zudem, dass Innovation nicht nur in Modellen steckt, sondern auch in der Art, wie wir sie nutzen. Für uns bei Bananapie ist Claude 3.5 Sonnet jetzt das Standard-Modell für Coding-Aufgaben.

Bereit für Dein
nächstes Projekt?

Ob neue App, Plattform-Optimierung oder KI-Integration – wir unterstützen Dich in jeder Phase. Kostenloses Erstgespräch für Gründer und Tech-Teams.

© 2026 Bananapie GmbH. All rights reserved.