Por qué la escritura de prompts es clave para Kling 3.0
Kling 3.0 representa un gran salto en la generación de videos con IA, pero la calidad de tus resultados depende en gran medida de cómo redactes tus prompts. A diferencia de modelos anteriores que trataban los prompts como simples descripciones, Kling 3.0 entiende la intención cinematográfica: lee tu prompt como un director lee un guion.
Un prompt bien estructurado de 200 palabras superará constantemente a uno vago de 20 palabras. La diferencia entre un video IA de aspecto amateur y uno de calidad profesional a menudo se reduce a una sola cosa: cómo escribes tu prompt para Kling 3.0.
Esta guía desglosa las técnicas de prompt probadas que desbloquean todo el potencial de Kling 3.0, desde la estructura básica hasta secuencias avanzadas de múltiples tomas con audio nativo.
La estructura de 5 capas para prompts
Los prompts más efectivos para Kling 3.0 siguen una estructura consistente de cinco capas. Piensa en cada capa como un paso que se construye sobre el anterior para crear una dirección de escena completa.
Capa 1: Definición de la escena
Comienza situando al modelo en un entorno claro. Esto le da a Kling 3.0 contexto espacial y de iluminación antes de que ocurra cualquier movimiento.
- Ubicación: Sé específico: "una cafetería en una azotea iluminada por el sol en Barcelona" funciona mejor que "una cafetería"
- Momento del día: La luz de la mañana, la hora dorada y la medianoche producen resultados drásticamente diferentes
- Atmósfera: Clima, estado de ánimo, detalles ambientales
Capa 2: Especificación de personajes
Define a tus sujetos de forma clara y consistente. Evita referencias vagas como "alguien" o "una persona".
- Usa identificadores claros: "una mujer con un abrigo de lana rojo" o "un hombre alto con gafas de montura plateada"
- Mantén las descripciones de los personajes consistentes si aparecen en varias tomas
- Menciona rasgos distintivos en los que el modelo pueda fijarse
Capa 3: Línea de tiempo de acción
Describe lo que sucede en pasos secuenciales. Para videos más largos (hasta 15 segundos), divide la acción en segmentos cronometrados.
- Bien: "Ella levanta su taza de café, hace una pausa para mirar por la ventana, luego se gira y sonríe"
- Débil: "Ella bebe café y sonríe"
Capa 4: Dirección de cámara
Aquí es donde muchos creadores fallan. Las instrucciones de cámara ya no son opcionales en Kling 3.0. Sin una dirección de cámara explícita, el modelo utiliza un encuadre estático por defecto.
Especifica:
- Tipo de toma: Gran plano general, plano medio, primer plano, primerísimo primer plano
- Movimiento: Panorámica, seguimiento, acercamiento (push-in), alejamiento (pull-back), órbita
- Tiempo: "La cámara se acerca lentamente durante los primeros 5 segundos, luego se mantiene"
Capa 5: Audio y estilo
Kling 3.0 admite salida de audio nativa, incluyendo diálogos, sonido ambiental y control del tono de voz.
- Describe sonidos ambientales: "jazz suave sonando de fondo, ruido de tráfico lejano"
- Especifica el estilo visual: "corrección de color cálida, poca profundidad de campo, grano de película de 35mm"
Crea Videos con IA usando Kling 3.0
Prueba la estructura de 5 capas con Kling 3.0 en Nano Banana 2 — sin descargas necesarias.
Control de cámara: La clave para resultados profesionales
La dirección de cámara separa los prompts de principiante de los profesionales. Aquí tienes las instrucciones de cámara más efectivas para Kling 3.0:
| Movimiento de cámara | Cuándo usarlo | Ejemplo de fragmento de prompt |
|---|---|---|
| Tracking shot | Siguiendo a un sujeto en movimiento | "La cámara sigue a su lado mientras camina por el mercado" |
| Push-in | Generando tensión o enfoque | "Acercamiento lento de plano medio a primer plano en su rostro" |
| Órbita | Mostrando un sujeto desde todos los ángulos | "La cámara orbita 180 grados alrededor de la escultura" |
| Static wide | Estableciendo una escena | "Plano general, fijo, mostrando el paisaje urbano completo al atardecer" |
| POV | Vista inmersiva en primera persona | "Toma POV caminando por el callejón empapado por la lluvia" |
| Shot-reverse-shot | Diálogo entre personajes | "Corte entre primeros planos de cada hablante durante la conversación" |
Consejos de tiempo para la cámara
Para videos de 15 segundos, planifica el movimiento de tu cámara durante toda la duración:
- 0–5s: Establece la escena con un plano general o medio
- 5–10s: Transición a un encuadre más cerrado a medida que aumenta la acción
- 10–15s: Mantén el momento clave o aléjate para la revelación
Escribir diálogos y prompts de audio
Una de las características destacadas de Kling 3.0 es la generación de audio nativo con voz realista, sincronización labial y sonido ambiental. Aquí te explicamos cómo pedirlo de manera efectiva.
Etiquetado de hablantes
Etiqueta siempre explícitamente quién está hablando. Esto ayuda al motor a asignar la sincronización labial correctamente al personaje adecuado.
[Speaker: Mujer con abrigo rojo, voz cálida y segura]: "He estado esperando este momento."
[Speaker: Hombre con gafas, tono nervioso]: "¿Estás segura de esto?"Consejos para diálogos con varios personajes
- Usa etiquetas de personaje únicas y consistentes en todo el prompt
- Asigna un tono y emoción específicos a cada hablante
- Vincula el diálogo a acciones visuales: describe primero el movimiento, luego el habla
- Usa palabras de transición como "Inmediatamente", "Luego", "Después de una pausa" para controlar la secuencia
Sonido ambiental
No olvides el audio ambiental. Añadir "el sonido de la lluvia golpeando la ventana" o "campanas de iglesia lejanas" crea un video final mucho más rico.
Técnicas de prompt para múltiples tomas
Kling 3.0 Multi Shot admite guiones gráficos de hasta seis tomas en una sola generación. Aquí es donde el modelo realmente brilla para contenido narrativo.
Cómo estructurar prompts de múltiples tomas
Etiqueta cada toma explícitamente y describe su encuadre, sujeto y movimiento de forma independiente:
Toma 1 (0-3s): Plano general de un acantilado costero en la hora dorada.
Una mujer está de pie en el borde, su vestido blanco ondeando con el viento.
La cámara se acerca lentamente.
Toma 2 (3-6s): Primer plano de su rostro de perfil, ojos cerrados,
la luz del sol atrapando su cabello. Cámara estática.
Toma 3 (6-10s): Toma sobre el hombro mirando hacia el océano.
La cámara se inclina hacia abajo para revelar las olas rompiendo debajo.
Toma 4 (10-15s): Plano medio desde abajo mientras ella abre los ojos
y se gira hacia la cámara. Inclinación lenta hacia arriba.Mejores prácticas para múltiples tomas
- Mantén las descripciones de los personajes consistentes en todas las tomas
- Varía tus tipos de toma para mayor interés visual (general → cerrado → medio)
- Describe las transiciones entre tomas cuando sea relevante
- Usa marcadores de tiempo para controlar el ritmo
Domina la creación de videos con múltiples tomas
Combina técnicas de prompt con la función multi-toma de Kling 3.0 para crear secuencias cinematográficas.
Plantillas de prompts listas para usar
Aquí tienes plantillas de prompts probadas que puedes adaptar para tus propios proyectos.
Plantilla 1: Escena de personaje cinematográfica
Una mujer con una gabardina verde oscuro está de pie en el borde de una azotea empapada por la lluvia en el centro de Tokio por la noche. Los letreros de neón se reflejan en los charcos alrededor de sus pies. Ella se gira lentamente hacia la cámara, apartando el cabello mojado de su rostro, con expresión decidida. La cámara comienza con un plano general de establecimiento, luego sigue hacia adelante hasta un primer plano medio durante 10 segundos. La lluvia cae suavemente, el sonido del tráfico sube desde abajo. Reflejos de tungsteno cálidos contra sombras azules frías. Grabado con lente anamórfica, poca profundidad de campo.
Plantilla 2: Exhibición de producto con texto
Una elegante cafetera negra se encuentra sobre una encimera de cocina de mármol bajo la suave luz de la mañana. El vapor sale de una taza recién hecha a su lado. "Brew Calm" está grabado en el panel frontal de la máquina en letras sans-serif limpias. La cámara orbita lentamente la máquina de izquierda a derecha durante 12 segundos, haciendo una pausa breve en el nombre de la marca. Una voz masculina cálida dice: "Empieza cada mañana con calma". Sonido ambiental de pájaros fuera de una ventana abierta.
Plantilla 3: Diálogo entre varios personajes
Una oficina moderna de planta abierta, luz de media tarde entrando a través de ventanas de piso a techo. Una mujer segura de sí misma con un blazer azul marino camina por el pasillo llevando una tableta. [Speaker: Mujer, voz firme y autoritaria]: "Lanzamos mañana, sin retrasos". Un asistente joven se apresura a seguir su ritmo, ligeramente sin aliento. [Speaker: Asistente, voz nerviosa]: "Pero la presentación aún no está terminada". Ella se detiene, se gira y hace contacto visual directo. [Speaker: Mujer]: "Entonces termínala". Sigue a la pareja desde un ángulo lateral mientras caminan, luego cambia a un primer plano frontal cuando ella se detiene.
Plantilla 4: Naturaleza y paisaje
Un valle montañoso brumoso al amanecer, capas de niebla rodando entre crestas cubiertas de pinos. Una figura solitaria con una chaqueta roja está de pie en un afloramiento rocoso, mirando hacia la vista. Los pájaros llaman a lo lejos. La cámara comienza en un gran plano general, acercándose lentamente durante 15 segundos hasta que la figura llena el centro del encuadre. La luz dorada de la mañana se abre paso entre las nubes. El sonido del viento y el crujir de los árboles. Corrección de color cinematográfica con verdes profundos y reflejos cálidos.
Errores comunes de prompt a evitar
| Error | Por qué falla | Mejor enfoque |
|---|---|---|
| "Una hermosa escena cinematográfica" | Demasiado vago, sin dirección accionable | Describe iluminación, composición y movimiento específicos |
| Usar pronombres entre tomas | El modelo pierde el seguimiento del personaje | Repite las descripciones de los personajes consistentemente |
| Sin dirección de cámara | Se vuelve estático, encuadre aburrido | Especifica siempre el tipo de toma y el movimiento |
| Comprimir toda la acción en una frase | El modelo no puede analizar secuencias complejas | Divide en pasos secuenciales con tiempo |
| Ignorar el audio | Pierde la mitad de la capacidad de Kling 3.0 | Añade etiquetas de diálogo, sonidos ambientales y pistas musicales |
Combinando prompts con control de movimiento
Para obtener resultados aún más precisos, combina tus prompts con Kling 3.0 Motion Control. El control de movimiento te permite usar un video de referencia para transferir movimientos específicos a personajes generados por IA, y tu prompt de texto sigue guiando la escena, los personajes y el estilo.
Esta combinación es especialmente poderosa para:
- Secuencias de baile: El video de referencia proporciona la coreografía, el prompt define el personaje y el entorno
- Demos de productos: El video de referencia controla los movimientos de las manos, el prompt establece la marca y el entorno
- Escenas de acción: El video de referencia impulsa el movimiento físico, el prompt maneja la cinematografía y el audio
Empezando con los prompts de Kling 3.0
Escribir excelentes prompts para Kling 3.0 es una habilidad que mejora con la práctica. Comienza con la estructura de 5 capas, experimenta con las direcciones de cámara y añade gradualmente diálogos y técnicas de múltiples tomas a medida que te sientas cómodo.
Los principios clave a recordar:
- Piensa como un director, no como un descriptor
- Sé específico sobre la escena, el personaje, la acción, la cámara y el audio
- Usa marcadores de tiempo para videos más largos
- Etiqueta a los hablantes explícitamente para escenas de diálogo
- Mantén las descripciones de los personajes consistentes entre tomas
¿Listo para poner estas técnicas en acción? Nano Banana 2 te da acceso instantáneo a Kling 3.0 junto con docenas de otros modelos de IA tanto para imágenes como para generación de video.
Empieza a crear con Kling 3.0 hoy
Aplica estas técnicas de prompt y genera impresionantes videos con IA en minutos.


