
Veo 3.1 Lite 圖片轉影片:一分鐘內將產品照片轉為影片片段
如何使用 Veo 3.1 Lite 的 image-to-video 模式,從靜態照片製作產品展示、社群媒體內容與品牌影片——本文提供真實範例與工作流程技巧
你將會學習
- ✅ image-to-video 在 Veo 3.1 Lite 中的運作方式,與純文字生成的比較
- ✅ 哪種產品照片效果最好(哪種不好)
- ✅ 控制動態的首尾幀技術
- ✅ 適用於產品展示、時尚、美食與社群吸睛短影音的 Prompt 範本
- ✅ 完整工作流程:照片 → 影片 → 準備發布
為什麼圖像轉影片改變了工作流程
初次接觸 Veo 3.1 Lite?請先閱讀 模型概覽,瞭解定價、規格,以及它如何融入 Google 的影片模型陣容。
文字轉影片雖然強大,但它屬於機率性生成——你描述想要的內容,由模型來詮釋。圖像轉影片則不同:你提供精確的視覺起點,模型再從那裡開始生成動畫。
對於產品製作來說,這一點至關重要。你的產品有特定的造型、顏色、材質和品牌標識,文字 prompt 無法保證還原這些細節,圖像卻可以。
Veo 3.1 Lite 支援 image-to-video 輸出 720p 和 1080p 解析度,同時支援 16:9 和 9:16 格式,可生成 4 秒、6 秒或 8 秒長度的影片。在 NanoBanana 上生成 8 秒影片只需 20 積分,成本相當低廉,你可以為單一產品照片生成 5 到 10 種變體,再挑選出最佳效果。
Veo 3.1 Lite 中的圖像轉影片運作方式
你需要提供:
- 一張參考圖片 — 做為影片的第一個畫面
- 一段文字 prompt — 描述動態、鏡頭與音訊
- 長度與長寬比 — 4 秒/6 秒/8 秒,16:9 或 9:16
模型會生成從你提供的圖片出發、向外延伸動態的影片。圖片設定視覺基礎,prompt 引導後續發生的內容。
核心關鍵是:圖片負責「它看起來是什麼樣子」,prompt 負責「它要做什麼動作」。 用這種方式分工,你就能得到一致、符合導向的輸出。

什麼樣的輸入圖片才是好圖片
並不是所有產品照片的效果都一樣好。以下說明哪些是模型能穩定處理、哪些容易出問題:
| 圖片類型 | 適合使用 | 應避免 |
|---|---|---|
| 純淨/簡單背景上的乾淨產品照 | ✅ | |
| 單一主力產品置中 | ✅ | |
| 高對比、邊緣清晰 | ✅ | |
| 單一畫面包含多個 SKU | ❌ 混淆動態焦點 | |
| 產品上有大量文字/浮水印 | ❌ 動態中會出現文字瑕疵 | |
| 低解析度或高度壓縮的圖片 | ❌ 輸出模糊 | |
| 極端廣角、產品佔比很小 | ❌ 產品流失細節 |
最佳做法: 使用你最乾淨的產品照——就是你會用在電商商品頁的那一種。如果可以,移除背景。輸入越乾淨,你對輸出的掌控度就越高。
首尾幀技術
Veo 3.1 Lite 支援只設定第一個畫面(開場就是你的產品圖)。如果想要控制轉場——讓影片從 A 點開始、在 B 點結束——你也可以設定最後一個畫面。
使用案例:
- 開箱展示: 第一幀 = 關閉的盒子,最後一幀 = 打開的盒子,產品清晰可見。
- 前後對比: 第一幀 = 問題狀態,最後一幀 = 解決後的狀態。
- 旋轉定位: 第一幀 = 特定角度的產品,最後一幀 = 正面朝向的主力展示位置。
這項技術不需要複雜的 prompt 就能提供電影等級的控制,模型會在你設定的兩個錨點之間插補出流暢動態。
依使用場景分類的 Prompt 範本
這些 prompt 是專為 image-to-video 設計的。若要深入瞭解 Veo 3.1 Lite 的完整 prompt 語言——包含畫面類型、鏡頭移動、鏡頭控制——請參閱 Veo 3.1 Lite Prompt 指南。
這些 prompt 是專為 image-to-video 設計的。圖像提供視覺基準,prompt 引導動態與氛圍。
產品:帶鏡頭移動的主力展示照
The camera slowly dollies in toward the product.
Soft studio lighting, clean background.
No movement except the camera push.
SFX: silence.
Duration: 6 seconds.The product rotates slowly 45 degrees clockwise, revealing its side profile.
Tabletop surface, warm side lighting catching texture details.
Camera static, 85mm lens.
SFX: subtle ambient studio hum.產品:生活風格 / 實際使用
A hand reaches in from the right and picks up the product naturally.
Kitchen counter environment, warm afternoon light through a window.
Handheld camera feel, slight movement.
SFX: ambient kitchen sounds, soft handling noise.The product is poured/opened/used in the natural way it's intended.
Close-up, 85mm. Soft natural light.
Focus shifts to the key moment of use.
SFX: the sound of the product being used.時尚 / 服飾
Vertical 9:16 format.
The garment moves gently as if in a light breeze.
Model is still; only fabric has motion.
Outdoor natural light, overcast sky for diffused shadows.
SFX: wind, distant ambient sound.Vertical 9:16 format.
A close-up of the fabric texture. Camera pulls back slowly to reveal the full garment.
Shallow depth of field, 85mm.
SFX: silence.食品飲料
Steam rises gently from the dish/drink.
Overhead camera, static.
Warm practical lighting, dark background for contrast.
SFX: ambient café or kitchen sound, very low.Close-up. The liquid pours slowly into frame from above, filling the glass.
Camera static, 85mm. Black background, single side light.
SFX: the sound of liquid pouring, ice clinking.社群吸睛短影音(直式,0–4 秒)
Vertical 9:16. Close-up.
The product spins once and comes to a stop facing the camera.
Bright, clean background. Quick, energetic motion.
SFX: a short whoosh sound as it spins, then stops.
Duration: 4 seconds.Vertical 9:16. Medium shot.
The product drops into frame from above and lands with a satisfying impact.
High-contrast background. Slight slow-motion on the impact.
SFX: a clean thud as it lands.
Duration: 4 seconds.完整工作流程:從照片到發布影片
準備你的圖片
使用背景乾淨的高解析度產品照片。理想規格為:短邊長度 1000 像素以上的 PNG 或 JPG,也就是你們電商首圖使用的標準格式。
選擇你的格式
適用 Instagram/TikTok/Shorts:9:16 直式,6 秒。適用網站嵌入或 YouTube:16:9,8 秒。適用短影音社交吸睛開場:9:16,4 秒。
上傳至生成工具
前往 Veo 3.1 Lite on NanoBanana,切換到圖片轉影片模式,上傳你的產品照片。
加入你的 prompt
複製上方其中一個範本,或是自行撰寫。請記住:圖片已經決定外觀——你的 prompt 只需要指定動態、鏡頭和音訊即可。
生成並比較
使用同一張圖片,但稍微調整 prompt 內容,生成 2 到 3 種不同變體(例如推鏡 vs 靜態加上旋轉)。8 秒長的片段每次生成耗費 20 點額度,3 種變體總共是 60 點額度。
下載並發布
發布到社交平台不需要後製。如果要用於產品頁或廣告,你可以在基礎影片編輯軟體中裁剪或是設定循環播放。
常見問題與解決方法
經過 1 至 2 秒後產品產生變形
這是模型過度動畫化導致。請縮減 prompt 中的動量:加入 camera static 或 minimal movement, only [specific element] moves。
背景無預期變更
你的背景細節太多,導致模型重新解讀它。請重新拍攝,使用更簡單的背景,或是在 prompt 中加入 background unchanged, only product moves。
影片看起來像投影片,不是流暢動態
Prompt 請標註連續動態:smooth continuous camera move 或 fluid 360 rotation。避免撰寫有啟動停止的動作描述。
直式圖片在 9:16 輸出中出現黑邊 上傳前請將輸入圖片裁切或補邊調整成 9:16 比例。長寬比不吻合會導致模型自動加上黑邊。
做產品內容時,Veo 3.1 Lite 無法做到的事
- 沒有 4K —— 最大解析度為 1080p。用於網站和社群已足夠;不適合大尺寸印刷或數位看板。
- 不支援延伸長度 —— Lite 方案無法將生成的片段延長超過 8 秒。
- 不支援多產品比較 —— 讓兩個產品互動的動畫效果不穩定。請分別生成後再剪輯在一起。
- 不支援文字覆蓋 —— 不要依賴模型生成可讀的文字、價格或標註。這些請在後製階段加入。
親自試試:第一次生成免費
NanoBanana 的 Veo 3.1 Lite 生成工具支援 image-to-video,並使用相同的 prompt 介面。上傳你的產品照片,貼上上方的 prompt,選擇格式後就能生成。
8 秒長度只需 20 點額度,價格是 Veo 3.1 的一半。
常見問答
揭露
影片範例使用來自 Veo 3.1 模型家族的素材。工作流程建議是基於 image-to-video 生成的實際測試而來。成果會依輸入圖片品質和 prompt 的明確程度而有所不同。
更多文章

PixVerse V6 對比 V5.6:攝影機控制、音訊與多鏡引擎
PixVerse V6 已於 2026 年 3 月 30 日上線。相較於 V5.6,它新增了 20 多項電影等級攝影機控制、原生音訊、多鏡引擎,並將 1080p 解析度的影片長度上限提升至 15 秒。以下是直接的功能差異解析。

AI Image Agent:一次生成一張或上百張圖片,無需切換工具
NanoBanana 的 AI Image Agent 可在單一對話中處理從單一概念圖到批次樣式轉換的所有任務,不需要 prompt 工程技術

Veo 3.1 Lite Prompt 指南:20多個適用於電影級AI影片的現成Prompt
完整學習如何運用prompt Veo 3.1 Lite 打造電影級成果,內容涵蓋鏡頭類型、相機移動、音訊,以及跨各種風格的20多個可直接複製貼上的prompt——沒有多餘廢話