G
视频生成
8 分钟阅读更新于 2026-05-25

视频 Prompt 基础:动作、镜头与时长

系统讲解 AI 视频生成中动作描述、镜头语言和时长控制的实战技巧与案例
视频生成
Prompt工程
镜头语言
AI创作
视频制作

# 视频 Prompt 基础:动作、镜头与时长

在 AI 视频生成领域,掌握 Prompt 的核心要素是创作高质量内容的关键。无论你使用 Runway、Pika、Kling 还是其他视频生成工具,理解如何精确描述动作、镜头语言和时长控制,都能让你的创意更准确地转化为视觉作品。本文将系统讲解视频 Prompt 的三大基础维度,并提供大量实战案例。

动作描述:让画面动起来的核心

动作是视频与静态图像的本质区别。在 AI 视频生成中,动作描述的精确度直接决定生成结果的可控性。

主体动作的描述层次

基础动作词汇

最简单的动作描述使用单一动词:

  • A woman walking in the park (女性在公园行走)
  • A cat jumping onto the table (猫跳上桌子)
  • Rain falling on the window (雨滴落在窗户上)
  • 这类描述适合简单场景,但往往缺乏细节控制。

    复合动作描述

    通过组合多个动作词,可以创造更丰富的运动效果:

    ``

    A dancer spinning gracefully, then leaping into the air,

    arms extended, landing softly on one foot

    (舞者优雅旋转,然后跃入空中,双臂展开,单脚轻柔落地)

    `

    动作强度与速度

    添加修饰词来控制动作的质感:

  • 速度: slowly walking (缓慢行走), rapidly spinning (快速旋转), dashing forward (猛冲向前)
  • 力度: gently touching (轻柔触碰), forcefully pushing (用力推动), delicately picking up (小心拾起)
  • 节奏: rhythmically swaying (有节奏地摇摆), stuttering steps (踉跄的步伐)
  • 环境动态元素

    除了主体动作,环境的动态描述同样重要:

    `

    A lone figure walking through a wheat field,

    golden stalks swaying in the wind,

    clouds drifting slowly across the sky,

    sunlight filtering through moving leaves

    (孤独的身影穿过麦田,金色麦秆随风摇曳,

    云朵缓慢飘过天空,阳光透过移动的树叶洒落)

    `

    这种多层次的动作描述能创造更有深度的视觉体验。

    动作的起止状态

    明确动作的开始和结束状态,可以提高生成的连贯性:

    `

    A paper airplane starting flat on a desk,

    then being picked up by a hand,

    launched into the air, gliding smoothly,

    finally landing on a windowsill

    (纸飞机从桌面平放开始,被手拿起,

    发射到空中,平稳滑翔,最终降落在窗台上)

    `

    镜头语言:用摄影思维构建视角

    镜头控制是专业视频创作的标志。AI 视频工具已经能够理解基本的摄影术语,合理运用可以大幅提升作品质感。

    镜头距离与景别

    特写 (Close-up / Extreme Close-up)

    `

    Extreme close-up of a human eye,

    iris details visible, reflection of city lights in the pupil

    (人眼的极端特写,虹膜细节可见,瞳孔中映出城市灯光)

    `

    适用场景:情绪表达、细节展示、产品特写

    中景 (Medium Shot)

    `

    Medium shot of a chef cooking in a kitchen,

    hands chopping vegetables on a wooden board,

    steam rising from a pot in the background

    (厨师在厨房烹饪的中景,手在木板上切菜,

    背景中锅里升起蒸汽)

    `

    适用场景:人物互动、工作场景、日常活动

    全景 (Wide Shot / Establishing Shot)

    `

    Wide aerial shot of a coastal city at sunset,

    buildings casting long shadows,

    waves crashing against the shore

    (海滨城市日落时的广角航拍,建筑投下长长的影子,

    海浪拍打海岸)

    `

    适用场景:环境建立、场景转换、宏大叙事

    镜头运动方式

    推拉镜头 (Dolly In/Out)

    `

    Camera slowly dollying in on a vintage typewriter,

    starting from a wide shot of a writer's desk,

    ending in a close-up of keys being pressed

    (镜头缓慢推进复古打字机,从作家书桌的全景开始,

    结束于按键特写)

    `

    环绕镜头 (Orbit / 360-degree)

    `

    Camera orbiting around a sports car in a showroom,

    smooth circular motion, reflections on polished surface,

    dramatic lighting from above

    (镜头环绕展厅中的跑车,流畅的圆周运动,

    抛光表面的反射,来自上方的戏剧性照明)

    `

    跟随镜头 (Tracking Shot)

    `

    Camera tracking alongside a cyclist riding through

    autumn forest, matching speed, leaves falling around,

    dappled sunlight through trees

    (镜头跟随骑行者穿过秋季森林,速度同步,

    落叶飘落周围,树间斑驳阳光)

    `

    升降镜头 (Crane Up/Down)

    `

    Camera craning up from street level to reveal

    a massive skyscraper, starting at pedestrians' feet,

    ending with a view of the building top against clouds

    (镜头从街道水平升起展现巨大摩天楼,

    从行人脚部开始,结束于建筑顶部与云层的画面)

    `

    镜头角度与视角

    俯视 (Bird's Eye View / Top-down)

    `

    Top-down view of a busy intersection,

    cars and pedestrians moving in organized chaos,

    traffic lights changing colors

    (繁忙十字路口的俯视图,汽车和行人在有序的混乱中移动,

    交通灯变换颜色)

    `

    仰视 (Low Angle)

    `

    Low angle shot looking up at a basketball player

    about to dunk, dramatic perspective,

    arena lights creating a halo effect

    (仰视篮球运动员即将扣篮,戏剧性透视,

    场馆灯光形成光晕效果)

    `

    第一人称视角 (POV / First-person)

    `

    First-person POV walking through a haunted mansion,

    hand holding a flickering candle,

    shadows dancing on peeling wallpaper

    (第一人称视角穿过闹鬼豪宅,手持摇曳的蜡烛,

    影子在剥落的壁纸上舞动)

    `

    时长控制:节奏与叙事的平衡

    不同 AI 视频工具对时长的支持各异,但理解时长与内容密度的关系是通用技能。

    短时长场景 (2-4秒)

    适合单一动作或快速转场:

    `

    [2s] Lightning strike illuminating a dark sky,

    brief flash revealing storm clouds

    ([2秒] 闪电照亮黑暗天空,短暂闪光显现风暴云)

    `

    最佳实践:

  • 聚焦单一视觉冲击
  • 避免复杂动作序列
  • 适合循环播放的内容
  • 中等时长 (4-8秒)

    标准叙事单元,可以包含完整动作:

    `

    [6s] A barista pouring latte art,

    milk flowing into espresso,

    forming a heart pattern,

    cup placed on saucer

    ([6秒] 咖啡师制作拉花,牛奶注入浓缩咖啡,

    形成心形图案,杯子放在碟子上)

    `

    最佳实践:

  • 包含起承转合
  • 2-3个关键动作节点
  • 主流商业视频的标准长度
  • 长时长场景 (8秒以上)

    需要更精细的节奏控制:

    `

    [10s] Time-lapse of a flower blooming,

    starting as a tight bud at dawn,

    petals slowly unfurling as sunlight increases,

    bees arriving to pollinate,

    full bloom at midday with vibrant colors

    ([10秒] 花朵绽放的延时摄影,从黎明时的紧闭花苞开始,

    随着阳光增强花瓣缓慢展开,蜜蜂到来授粉,

    正午时完全绽放,色彩鲜艳)

    `

    最佳实践:

  • 分段描述时间节点
  • 使用 "starting... then... finally" 结构
  • 考虑视觉疲劳,保持画面变化
  • 时长与镜头运动的匹配

    不同镜头运动需要不同的时长支持:

    | 镜头类型 | 建议时长 | 原因 |

    |---------|---------|------|

    | 快速切换特写 | 2-3秒 | 避免视觉疲劳 |

    | 环绕镜头 | 6-8秒 | 完成完整圆周运动 |

    | 延时摄影 | 8-10秒 | 展现时间流逝 |

    | 跟随镜头 | 5-7秒 | 建立空间关系 |

    综合实战案例

    案例1:产品展示视频

    需求: 展示智能手表的设计细节

    Prompt:

    `

    [8s] Camera slowly orbiting around a sleek smartwatch

    on a minimalist white pedestal, starting from the side view,

    watch face lighting up to show time and notifications,

    reflections on the metallic band, smooth 360-degree rotation,

    ending back at the starting position,

    studio lighting with soft shadows

    `

    中文翻译:

    `

    [8秒] 镜头缓慢环绕极简白色底座上的时尚智能手表,

    从侧面视角开始,表盘亮起显示时间和通知,

    金属表带上的反射,流畅的360度旋转,

    回到起始位置结束,工作室照明带柔和阴影

    `

    关键要素分析:

  • 时长:8秒适合完整环绕
  • 动作:环绕旋转 + 屏幕亮起
  • 镜头:Orbit shot
  • 细节:材质反射、照明描述
  • 案例2:情感叙事短片

    需求: 表现孤独感的氛围片段

    Prompt:

    `

    [6s] Wide shot of a solitary figure standing

    at the edge of a misty pier at dawn,

    back to camera, gentle waves lapping below,

    seagulls flying in the distance,

    figure's coat fluttering in the breeze,

    camera slowly pushing in,

    cold blue color grading

    `

    中文翻译:

    `

    [6秒] 黎明时分雾气弥漫的码头边缘,

    孤独身影的广角镜头,背对镜头,

    下方轻柔的波浪拍打,远处海鸥飞翔,

    人物外套在微风中飘动,镜头缓慢推进,

    冷蓝色调色

    `

    关键要素分析:

  • 情绪:通过环境和色调营造
  • 镜头:Wide shot + Dolly in
  • 动作层次:主体静止,环境动态(波浪、海鸥、衣物)
  • 视觉风格:色调描述增强氛围
  • 案例3:动态教程演示

    需求: 展示手机应用操作流程

    Prompt:

    `

    [10s] Over-the-shoulder shot of hands holding a smartphone,

    starting with the home screen,

    finger swiping to open an app,

    navigating through menu options with smooth taps,

    typing a message with keyboard appearing,

    hitting send button,

    success animation playing,

    shallow depth of field with blurred background

    `

    中文翻译:

    `

    [10秒] 手持智能手机的过肩镜头,

    从主屏幕开始,手指滑动打开应用,

    流畅点击浏览菜单选项,键盘出现并输入消息,

    点击发送按钮,成功动画播放,

    浅景深模糊背景

    `

    关键要素分析:

  • 时长:10秒容纳完整操作流程
  • 动作序列:6个连续步骤
  • 镜头:Over-the-shoulder保持视角一致
  • 技术细节:景深描述增强专业感
  • 进阶技巧与注意事项

    避免常见错误

    1. 动作过载: 在短时长内塞入过多动作会导致生成混乱

    - ❌ [4s] A person running, jumping, spinning, and waving

    - ✅ [4s] A person running and leaping over a puddle

    2. 镜头冲突: 同时使用矛盾的镜头描述

    - ❌ Close-up wide shot of a landscape

    - ✅ Wide establishing shot of a mountain landscape

    3. 时长不匹配: 复杂动作配短时长

    - ❌ [2s] Complete sunrise time-lapse from night to day

    - ✅ [10s] Sunrise time-lapse from pre-dawn to golden hour`

    工具特定优化

    不同平台对 Prompt 的理解有差异:

    Runway Gen-3:

  • 擅长自然运动和物理模拟
  • 镜头运动描述响应准确
  • 建议使用电影术语
  • Pika 2.0:

  • 对动作强度词敏感
  • 支持参数化控制(motion strength)
  • 适合风格化内容
  • Kling 1.5:

  • 中文 Prompt 支持良好
  • 长时长生成稳定性高
  • 适合叙事性内容
  • 迭代优化流程

    1. 基础版本: 先用简单描述测试

    2. 添加细节: 逐步增加动作和镜头描述

    3. 调整时长: 根据实际生成效果调整

    4. 风格统一: 确保多个片段的视觉连贯性

    总结

    掌握视频 Prompt 的动作、镜头和时长三要素,是从 AI 视频工具中获得高质量输出的基础。记住这些核心原则:

  • 动作描述要分层: 主体动作 + 环境动态 + 细节修饰
  • 镜头语言要专业: 使用标准摄影术语,明确距离、运动和角度
  • 时长控制要合理: 内容密度与时长匹配,避免过载或空洞

随着 AI 视频技术的快速发展,这些基础技能将帮助你更快适应新工具,创作出更具专业水准的视频内容。持续实践,建立自己的 Prompt 模板库,你会发现创意表达的边界正在不断拓展。