Warum Prompt-Writing für Kling 3.0 so wichtig ist
Kling 3.0 stellt einen bedeutenden Sprung in der KI-Videogenerierung dar, aber die Qualität Ihrer Ergebnisse hängt stark davon ab, wie Sie Ihre Prompts formulieren. Im Gegensatz zu früheren Modellen, die Prompts als einfache Beschreibungen behandelten, versteht Kling 3.0 filmische Absichten – es liest Ihren Prompt so, wie ein Regisseur ein Drehbuch liest.
Ein gut strukturierter Prompt mit 200 Wörtern liefert konsistent bessere Ergebnisse als ein vager mit 20 Wörtern. Der Unterschied zwischen amateurhaft wirkenden KI-Videos und professionellem Filmmaterial liegt oft in einer einzigen Sache: wie Sie Ihren Kling 3.0 Prompt schreiben.
Dieser Leitfaden erläutert die bewährten Prompt-Techniken, die das volle Potenzial von Kling 3.0 ausschöpfen – von der grundlegenden Struktur bis hin zu komplexen Multi-Shot-Sequenzen mit nativem Audio.
Die 5-Ebenen-Struktur für Prompts
Die effektivsten Kling 3.0 Prompts folgen einer konsistenten Fünf-Ebenen-Struktur. Betrachten Sie jede Ebene als Aufbau auf der vorherigen, um eine vollständige Szenenregie zu erstellen.
Ebene 1: Szenendefinition
Beginnen Sie damit, das Modell in einer klaren Umgebung zu verankern. Dies gibt Kling 3.0 einen räumlichen und beleuchtungstechnischen Kontext, bevor sich etwas bewegt.
- Ort: Seien Sie spezifisch – "ein sonnendurchflutetes Dachcafé in Barcelona" funktioniert besser als "ein Café"
- Tageszeit: Morgenlicht, die "Goldene Stunde" und Mitternacht erzeugen jeweils dramatisch unterschiedliche Ergebnisse
- Atmosphäre: Wetter, Stimmung, Umgebungsdetails
Ebene 2: Charakterspezifikation
Definieren Sie Ihre Subjekte klar und konsistent. Vermeiden Sie vage Begriffe wie "jemand" oder "eine Person".
- Verwenden Sie klare Identifikatoren: "eine Frau in einem roten Wollmantel" oder "ein großer Mann mit silberner Brille"
- Halten Sie Charakterbeschreibungen konsistent, wenn sie in mehreren Aufnahmen erscheinen
- Erwähnen Sie markante Merkmale, an denen sich das Modell orientieren kann
Ebene 3: Aktions-Zeitplan
Beschreiben Sie, was in aufeinanderfolgenden Schritten passiert. Unterteilen Sie die Aktion bei längeren Videos (bis zu 15 Sekunden) in zeitlich festgelegte Segmente.
- Gut: "Sie hebt ihre Kaffeetasse, hält inne, um aus dem Fenster zu schauen, dreht sich dann um und lächelt"
- Schwach: "Sie trinkt Kaffee und lächelt"
Ebene 4: Kameraregie
Hier scheitern viele Ersteller. Kameraanweisungen sind bei Kling 3.0 nicht mehr optional. Ohne explizite Kameraregie greift das Modell standardmäßig auf eine statische Einstellung zurück.
Geben Sie Folgendes an:
- Einstellungsgröße: Totale, Halbtotale, Nahaufnahme, extreme Nahaufnahme
- Bewegung: Schwenk, Kamerafahrt, Zoom-in, Zoom-out, Orbit
- Timing: "Die Kamera fährt in den ersten 5 Sekunden langsam heran und hält dann an"
Ebene 5: Audio und Stil
Kling 3.0 unterstützt native Audioausgabe, einschließlich Dialogen, Umgebungsgeräuschen und Kontrolle über die Stimmlage.
- Beschreiben Sie Umgebungsgeräusche: "leiser Jazz im Hintergrund, entferntes Verkehrslärm"
- Spezifizieren Sie den visuellen Stil: "warmes Color Grading, geringe Schärfentiefe, 35mm Filmkorn"
KI-Videos mit Kling 3.0 erstellen
Testen Sie die 5-Ebenen-Struktur mit Kling 3.0 auf Nano Banana 2 — kein Download erforderlich.
Kamerasteuerung: Der Schlüssel zu professionellen Ergebnissen
Die Kameraregie unterscheidet Anfänger-Prompts von professionellen. Hier sind die effektivsten Kameraanweisungen für Kling 3.0:
| Kamerabewegung | Wann zu verwenden | Beispiel-Prompt-Fragment |
|---|---|---|
| Kamerafahrt (Tracking) | Einem bewegten Subjekt folgen | "Die Kamera folgt ihr seitlich, während sie über den Markt geht" |
| Push-in (Zoom-in) | Spannung aufbauen oder Fokus setzen | "Langsamer Push-in von der Halbtotalen zur Nahaufnahme seines Gesichts" |
| Orbit | Ein Subjekt aus allen Winkeln zeigen | "Die Kamera umkreist die Skulptur um 180 Grad" |
| Statische Totale | Eine Szene etablieren | "Totale, statisch, zeigt das gesamte Stadtbild in der Dämmerung" |
| POV | Immersive Ego-Perspektive | "POV-Aufnahme beim Gehen durch die regennasse Gasse" |
| Schuss-Gegenschuss | Dialog zwischen Charakteren | "Schnitt zwischen Nahaufnahmen der jeweiligen Sprecher während des Gesprächs" |
Tipps zum Kamera-Timing
Planen Sie bei 15-sekündigen Videos Ihre Kamerabewegung über die gesamte Dauer:
- 0–5s: Etablieren Sie die Szene mit einer Totalen oder Halbtotalen
- 5–10s: Übergang zu einer engeren Einstellung, während die Aktion zunimmt
- 10–15s: Halten Sie den Schlüsselmoment fest oder fahren Sie für die Auflösung zurück
Dialoge und Audio-Prompts schreiben
Eines der herausragenden Merkmale von Kling 3.0 ist die native Audiogenerierung mit realistischer Sprache, Lippensynchronisation und Umgebungsgeräuschen. So prompten Sie effektiv dafür.
Sprecher markieren
Markieren Sie immer explizit, wer spricht. Dies hilft der Engine, die Lippensynchronisation korrekt dem richtigen Charakter zuzuordnen.
[Sprecher: Frau im roten Mantel, warme und selbstbewusste Stimme]: "Ich habe auf diesen Moment gewartet."
[Sprecher: Mann mit Brille, nervöser Tonfall]: "Bist du dir sicher?"Tipps für Dialoge mit mehreren Charakteren
- Verwenden Sie im gesamten Prompt eindeutige, konsistente Charakterbezeichnungen
- Weisen Sie jedem Sprecher einen spezifischen Tonfall und Emotionen zu
- Verknüpfen Sie Dialoge mit visuellen Aktionen: Beschreiben Sie zuerst die Bewegung, dann das Gesprochene
- Verwenden Sie Übergangswörter wie "Sofort", "Dann", "Nach einer Pause" zur Sequenzsteuerung
Umgebungsgeräusche
Vergessen Sie nicht den Umgebungston. Das Hinzufügen von "das Geräusch von Regen, der gegen das Fenster schlägt" oder "entfernte Kirchenglocken" erzeugt ein wesentlich reichhaltigeres finales Video.
Multi-Shot Prompting-Techniken
Kling 3.0 Multi Shot unterstützt Storyboards von bis zu sechs Aufnahmen in einer einzigen Generierung. Hier glänzt das Modell bei narrativen Inhalten besonders.
So strukturieren Sie Multi-Shot Prompts
Beschriften Sie jede Aufnahme explizit und beschreiben Sie deren Einstellungsgröße, Subjekt und Bewegung unabhängig voneinander:
Shot 1 (0-3s): Totale einer Küstenklippe zur Goldenen Stunde.
Eine Frau steht am Rand, ihr weißes Kleid weht im Wind.
Die Kamera fährt langsam heran.
Shot 2 (3-6s): Nahaufnahme ihres Gesichts im Profil, Augen geschlossen,
Sonnenlicht in ihrem Haar. Statische Kamera.
Shot 3 (6-10s): Über-die-Schulter-Aufnahme mit Blick auf den Ozean.
Die Kamera neigt sich nach unten, um die brechenden Wellen zu enthüllen.
Shot 4 (10-15s): Halbtotale von unten, während sie ihre Augen öffnet
und sich zur Kamera dreht. Langsamer Tilt nach oben.Best Practices für Multi-Shot
- Halten Sie Charakterbeschreibungen über alle Aufnahmen hinweg konsistent
- Variieren Sie Ihre Einstellungsgrößen für visuelles Interesse (Total → Nah → Halb)
- Beschreiben Sie Übergänge zwischen den Aufnahmen, wenn relevant
- Verwenden Sie Zeitmarkierungen, um das Pacing zu steuern
Multi-Shot-Videoerstellung meistern
Kombinieren Sie Prompt-Techniken mit der Multi-Shot-Funktion von Kling 3.0 für filmische Sequenzen.
Sofort einsatzbereite Prompt-Vorlagen
Hier sind bewährte Prompt-Vorlagen, die Sie für Ihre eigenen Projekte anpassen können.
Vorlage 1: Filmische Charakterszene
Eine Frau in einem dunkelgrünen Trenchcoat steht nachts am Rand eines regennassen Daches in der Innenstadt von Tokio. Neonreklamen spiegeln sich in Pfützen um ihre Füße. Sie dreht sich langsam zur Kamera, streicht sich nasses Haar aus dem Gesicht, ihr Ausdruck ist entschlossen. Die Kamera beginnt mit einer etablierenden Totalen und fährt dann über 10 Sekunden in eine mittlere Nahaufnahme. Es regnet sanft, das Geräusch von Verkehr steigt von unten auf. Warme Wolfram-Highlights gegen kühle blaue Schatten. Gedreht mit anamorphotischem Objektiv, geringe Schärfentiefe.
Vorlage 2: Produktpräsentation mit Text
Eine elegante schwarze Kaffeemaschine steht auf einer Marmor-Küchenarbeitsplatte im sanften Morgenlicht. Dampf steigt aus einer frisch gebrühten Tasse daneben auf. "Brew Calm" ist in sauberer serifenloser Schrift auf der Frontplatte der Maschine eingraviert. Die Kamera umkreist die Maschine langsam von links nach rechts über 12 Sekunden und hält kurz beim Markennamen inne. Eine warme männliche Stimme aus dem Off sagt: "Starten Sie jeden Morgen mit Ruhe." Umgebungsgeräusch von Vögeln vor einem offenen Fenster.
Vorlage 3: Dialog mit mehreren Charakteren
Ein modernes Großraumbüro, nachmittägliches Licht fällt durch raumhohe Fenster. Eine selbstbewusste Frau in einem marineblauen Blazer geht mit einem Tablet den Flur entlang. [Sprecher: Frau, stetige autoritäre Stimme]: "Wir starten morgen – keine Verzögerungen." Ein junger Assistent beeilt sich, ihr Tempo zu halten, leicht außer Atem. [Sprecher: Assistent, nervöse Stimme]: "Aber das Deck ist noch nicht fertig." Sie bleibt stehen, dreht sich um und sucht direkten Augenkontakt. [Sprecher: Frau]: "Dann mach es fertig." Verfolgen Sie das Paar aus einem seitlichen Winkel, während sie gehen, und wechseln Sie zu einer frontalen Nahaufnahme, wenn sie stehen bleibt.
Vorlage 4: Natur und Landschaft
Ein nebliges Bergtal im Morgengrauen, Nebelschichten ziehen zwischen kiefernbewachsenen Bergrücken hindurch. Eine einzelne Figur in einer roten Jacke steht auf einem Felsvorsprung und blickt auf das Panorama. Vögel rufen in der Ferne. Die Kamera beginnt mit einer extremen Totalen und fährt über 15 Sekunden langsam heran, bis die Figur die Bildmitte ausfüllt. Goldenes Morgenlicht bricht durch die Wolken. Das Geräusch von Wind und raschelnden Bäumen. Filmisches Color Grading mit tiefen Grüntönen und warmen Highlights.
Häufige Fehler bei Prompts vermeiden
| Fehler | Warum er scheitert | Besserer Ansatz |
|---|---|---|
| "Eine schöne filmische Szene" | Zu vage, keine handlungsorientierte Regie | Beschreiben Sie spezifische Beleuchtung, Komposition, Bewegung |
| Pronomen über Aufnahmen hinweg verwenden | Modell verliert Charakter-Tracking | Charakterbeschreibungen konsistent wiederholen |
| Keine Kameraregie | Standardmäßig statische, langweilige Einstellung | Immer Einstellungsgröße und Bewegung spezifizieren |
| Alle Aktionen in einen Satz pressen | Modell kann komplexe Sequenzen nicht parsen | In aufeinanderfolgende Schritte mit Timing unterteilen |
| Audio ignorieren | Verschenkt die Hälfte der Möglichkeiten von Kling 3.0 | Dialog-Tags, Umgebungsgeräusche, Musik-Cues hinzufügen |
Prompts mit Bewegungssteuerung kombinieren
Für noch präzisere Ergebnisse kombinieren Sie Ihre Prompts mit der Kling 3.0 Bewegungssteuerung. Die Bewegungssteuerung ermöglicht es Ihnen, ein Referenzvideo zu verwenden, um spezifische Bewegungen auf KI-generierte Charaktere zu übertragen – und Ihr Text-Prompt steuert weiterhin die Szene, die Charaktere und den Stil.
Diese Kombination ist besonders leistungsstark für:
- Tanzsequenzen: Referenzvideo liefert die Choreografie, Prompt definiert Charakter und Setting
- Produktdemos: Referenzvideo steuert Handbewegungen, Prompt setzt Branding und Umgebung
- Actionszenen: Referenzvideo treibt die physische Bewegung an, Prompt übernimmt Kameraführung und Audio
Erste Schritte mit Kling 3.0 Prompts
Das Schreiben großartiger Kling 3.0 Prompts ist eine Fähigkeit, die mit Übung besser wird. Beginnen Sie mit der 5-Ebenen-Struktur, experimentieren Sie mit Kameraanweisungen und fügen Sie nach und nach Dialoge und Multi-Shot-Techniken hinzu, sobald Sie sich sicher fühlen.
Die wichtigsten Prinzipien, die Sie sich merken sollten:
- Denken Sie wie ein Regisseur, nicht wie ein Beschreiber
- Seien Sie spezifisch bei Szene, Charakter, Aktion, Kamera und Audio
- Verwenden Sie Zeitmarkierungen für längere Videos
- Markieren Sie Sprecher explizit für Dialogszenen
- Halten Sie Charakterbeschreibungen konsistent über alle Aufnahmen hinweg
Bereit, diese Techniken in die Tat umzusetzen? Nano Banana 2 bietet Ihnen sofortigen Zugriff auf Kling 3.0 sowie Dutzende weiterer KI-Modelle für die Bild- und Videogenerierung.
Starten Sie heute mit der Erstellung mit Kling 3.0
Wenden Sie diese Prompt-Techniken an und generieren Sie in Minuten atemberaubende KI-Videos.


