# 视频 Prompt 基础:动作、镜头与时长
在 AI 视频生成领域,掌握 Prompt 的核心要素是创作高质量内容的关键。无论你使用 Runway、Pika、Kling 还是其他视频生成工具,理解如何精确描述动作、镜头语言和时长控制,都能让你的创意更准确地转化为视觉作品。本文将系统讲解视频 Prompt 的三大基础维度,并提供大量实战案例。
动作描述:让画面动起来的核心
动作是视频与静态图像的本质区别。在 AI 视频生成中,动作描述的精确度直接决定生成结果的可控性。
主体动作的描述层次
基础动作词汇
最简单的动作描述使用单一动词:
A woman walking in the park(女性在公园行走)A cat jumping onto the table(猫跳上桌子)Rain falling on the window(雨滴落在窗户上)- 速度: slowly walking
(缓慢行走),rapidly spinning(快速旋转),dashing forward(猛冲向前) - 力度: gently touching
(轻柔触碰),forcefully pushing(用力推动),delicately picking up(小心拾起) - 节奏: rhythmically swaying
(有节奏地摇摆),stuttering steps(踉跄的步伐) - 聚焦单一视觉冲击
- 避免复杂动作序列
- 适合循环播放的内容
- 包含起承转合
- 2-3个关键动作节点
- 主流商业视频的标准长度
- 分段描述时间节点
- 使用 "starting... then... finally" 结构
- 考虑视觉疲劳,保持画面变化
- 时长:8秒适合完整环绕
- 动作:环绕旋转 + 屏幕亮起
- 镜头:Orbit shot
- 细节:材质反射、照明描述
- 情绪:通过环境和色调营造
- 镜头:Wide shot + Dolly in
- 动作层次:主体静止,环境动态(波浪、海鸥、衣物)
- 视觉风格:色调描述增强氛围
- 时长:10秒容纳完整操作流程
- 动作序列:6个连续步骤
- 镜头:Over-the-shoulder保持视角一致
- 技术细节:景深描述增强专业感
- 擅长自然运动和物理模拟
- 镜头运动描述响应准确
- 建议使用电影术语
- 对动作强度词敏感
- 支持参数化控制(motion strength)
- 适合风格化内容
- 中文 Prompt 支持良好
- 长时长生成稳定性高
- 适合叙事性内容
- 动作描述要分层: 主体动作 + 环境动态 + 细节修饰
- 镜头语言要专业: 使用标准摄影术语,明确距离、运动和角度
- 时长控制要合理: 内容密度与时长匹配,避免过载或空洞
这类描述适合简单场景,但往往缺乏细节控制。
复合动作描述
通过组合多个动作词,可以创造更丰富的运动效果:
`` A dancer spinning gracefully, then leaping into the air, arms extended, landing softly on one foot (舞者优雅旋转,然后跃入空中,双臂展开,单脚轻柔落地)
`
动作强度与速度
添加修饰词来控制动作的质感:
环境动态元素
除了主体动作,环境的动态描述同样重要:
` A lone figure walking through a wheat field, golden stalks swaying in the wind, clouds drifting slowly across the sky, sunlight filtering through moving leaves (孤独的身影穿过麦田,金色麦秆随风摇曳, 云朵缓慢飘过天空,阳光透过移动的树叶洒落)
`
这种多层次的动作描述能创造更有深度的视觉体验。
动作的起止状态
明确动作的开始和结束状态,可以提高生成的连贯性:
` A paper airplane starting flat on a desk, then being picked up by a hand, launched into the air, gliding smoothly, finally landing on a windowsill (纸飞机从桌面平放开始,被手拿起, 发射到空中,平稳滑翔,最终降落在窗台上)
`
镜头语言:用摄影思维构建视角
镜头控制是专业视频创作的标志。AI 视频工具已经能够理解基本的摄影术语,合理运用可以大幅提升作品质感。
镜头距离与景别
特写 (Close-up / Extreme Close-up)
` Extreme close-up of a human eye, iris details visible, reflection of city lights in the pupil (人眼的极端特写,虹膜细节可见,瞳孔中映出城市灯光)
`
适用场景:情绪表达、细节展示、产品特写
中景 (Medium Shot)
` Medium shot of a chef cooking in a kitchen, hands chopping vegetables on a wooden board, steam rising from a pot in the background (厨师在厨房烹饪的中景,手在木板上切菜, 背景中锅里升起蒸汽)
`
适用场景:人物互动、工作场景、日常活动
全景 (Wide Shot / Establishing Shot)
` Wide aerial shot of a coastal city at sunset, buildings casting long shadows, waves crashing against the shore (海滨城市日落时的广角航拍,建筑投下长长的影子, 海浪拍打海岸)
`
适用场景:环境建立、场景转换、宏大叙事
镜头运动方式
推拉镜头 (Dolly In/Out)
` Camera slowly dollying in on a vintage typewriter, starting from a wide shot of a writer's desk, ending in a close-up of keys being pressed (镜头缓慢推进复古打字机,从作家书桌的全景开始, 结束于按键特写)
`
环绕镜头 (Orbit / 360-degree)
` Camera orbiting around a sports car in a showroom, smooth circular motion, reflections on polished surface, dramatic lighting from above (镜头环绕展厅中的跑车,流畅的圆周运动, 抛光表面的反射,来自上方的戏剧性照明)
`
跟随镜头 (Tracking Shot)
` Camera tracking alongside a cyclist riding through autumn forest, matching speed, leaves falling around, dappled sunlight through trees (镜头跟随骑行者穿过秋季森林,速度同步, 落叶飘落周围,树间斑驳阳光)
`
升降镜头 (Crane Up/Down)
` Camera craning up from street level to reveal a massive skyscraper, starting at pedestrians' feet, ending with a view of the building top against clouds (镜头从街道水平升起展现巨大摩天楼, 从行人脚部开始,结束于建筑顶部与云层的画面)
`
镜头角度与视角
俯视 (Bird's Eye View / Top-down)
` Top-down view of a busy intersection, cars and pedestrians moving in organized chaos, traffic lights changing colors (繁忙十字路口的俯视图,汽车和行人在有序的混乱中移动, 交通灯变换颜色)
`
仰视 (Low Angle)
` Low angle shot looking up at a basketball player about to dunk, dramatic perspective, arena lights creating a halo effect (仰视篮球运动员即将扣篮,戏剧性透视, 场馆灯光形成光晕效果)
`
第一人称视角 (POV / First-person)
` First-person POV walking through a haunted mansion, hand holding a flickering candle, shadows dancing on peeling wallpaper (第一人称视角穿过闹鬼豪宅,手持摇曳的蜡烛, 影子在剥落的壁纸上舞动)
`
时长控制:节奏与叙事的平衡
不同 AI 视频工具对时长的支持各异,但理解时长与内容密度的关系是通用技能。
短时长场景 (2-4秒)
适合单一动作或快速转场:
` [2s] Lightning strike illuminating a dark sky, brief flash revealing storm clouds ([2秒] 闪电照亮黑暗天空,短暂闪光显现风暴云)
`
最佳实践:
中等时长 (4-8秒)
标准叙事单元,可以包含完整动作:
` [6s] A barista pouring latte art, milk flowing into espresso, forming a heart pattern, cup placed on saucer ([6秒] 咖啡师制作拉花,牛奶注入浓缩咖啡, 形成心形图案,杯子放在碟子上)
`
最佳实践:
长时长场景 (8秒以上)
需要更精细的节奏控制:
` [10s] Time-lapse of a flower blooming, starting as a tight bud at dawn, petals slowly unfurling as sunlight increases, bees arriving to pollinate, full bloom at midday with vibrant colors ([10秒] 花朵绽放的延时摄影,从黎明时的紧闭花苞开始, 随着阳光增强花瓣缓慢展开,蜜蜂到来授粉, 正午时完全绽放,色彩鲜艳)
`
最佳实践:
时长与镜头运动的匹配
不同镜头运动需要不同的时长支持:
| 镜头类型 | 建议时长 | 原因 |
|---------|---------|------|
| 快速切换特写 | 2-3秒 | 避免视觉疲劳 |
| 环绕镜头 | 6-8秒 | 完成完整圆周运动 |
| 延时摄影 | 8-10秒 | 展现时间流逝 |
| 跟随镜头 | 5-7秒 | 建立空间关系 |
综合实战案例
案例1:产品展示视频
需求: 展示智能手表的设计细节
Prompt:
` [8s] Camera slowly orbiting around a sleek smartwatch on a minimalist white pedestal, starting from the side view, watch face lighting up to show time and notifications, reflections on the metallic band, smooth 360-degree rotation, ending back at the starting position, studio lighting with soft shadows
`
中文翻译:
` [8秒] 镜头缓慢环绕极简白色底座上的时尚智能手表, 从侧面视角开始,表盘亮起显示时间和通知, 金属表带上的反射,流畅的360度旋转, 回到起始位置结束,工作室照明带柔和阴影
`
关键要素分析:
案例2:情感叙事短片
需求: 表现孤独感的氛围片段
Prompt:
` [6s] Wide shot of a solitary figure standing at the edge of a misty pier at dawn, back to camera, gentle waves lapping below, seagulls flying in the distance, figure's coat fluttering in the breeze, camera slowly pushing in, cold blue color grading
`
中文翻译:
` [6秒] 黎明时分雾气弥漫的码头边缘, 孤独身影的广角镜头,背对镜头, 下方轻柔的波浪拍打,远处海鸥飞翔, 人物外套在微风中飘动,镜头缓慢推进, 冷蓝色调色
`
关键要素分析:
案例3:动态教程演示
需求: 展示手机应用操作流程
Prompt:
` [10s] Over-the-shoulder shot of hands holding a smartphone, starting with the home screen, finger swiping to open an app, navigating through menu options with smooth taps, typing a message with keyboard appearing, hitting send button, success animation playing, shallow depth of field with blurred background
`
中文翻译:
` [10秒] 手持智能手机的过肩镜头, 从主屏幕开始,手指滑动打开应用, 流畅点击浏览菜单选项,键盘出现并输入消息, 点击发送按钮,成功动画播放, 浅景深模糊背景
`
关键要素分析:
进阶技巧与注意事项
避免常见错误
1. 动作过载: 在短时长内塞入过多动作会导致生成混乱
- ❌ [4s] A person running, jumping, spinning, and waving - ✅
[4s] A person running and leaping over a puddle
2. 镜头冲突: 同时使用矛盾的镜头描述
- ❌ Close-up wide shot of a landscape - ✅
Wide establishing shot of a mountain landscape
3. 时长不匹配: 复杂动作配短时长
- ❌ [2s] Complete sunrise time-lapse from night to day - ✅
[10s] Sunrise time-lapse from pre-dawn to golden hour`
工具特定优化
不同平台对 Prompt 的理解有差异:
Runway Gen-3:
Pika 2.0:
Kling 1.5:
迭代优化流程
1. 基础版本: 先用简单描述测试
2. 添加细节: 逐步增加动作和镜头描述
3. 调整时长: 根据实际生成效果调整
4. 风格统一: 确保多个片段的视觉连贯性
总结
掌握视频 Prompt 的动作、镜头和时长三要素,是从 AI 视频工具中获得高质量输出的基础。记住这些核心原则:
随着 AI 视频技术的快速发展,这些基础技能将帮助你更快适应新工具,创作出更具专业水准的视频内容。持续实践,建立自己的 Prompt 模板库,你会发现创意表达的边界正在不断拓展。