Tự động hoá sản xuất video Youtube Shorts bằng AI Agents và n8n
Hãy tưởng tượng một hệ thống nơi bạn chỉ cần nhập một ý tưởng về Anime, và các “nhân viên AI” sẽ tự động viết kịch bản phân cảnh, vẽ nhân vật, tạo chuyển động video, lồng tiếng và tự động đăng tải lên YouTube Shorts/TikTok cho bạn.
Đây không phải là lý thuyết. Trong bài viết này, mình sẽ phân tích workflow “Anime Video Shorts Automator“ chạy trên n8n – một “cỗ máy” nội dung thực sự giúp bạn sản xuất hàng loạt video hoạt hình ngắn mà không cần động tay vào edit.
Workflow này hoạt động nào?
Khác với các quy trình automation đơn giản, workflow này sử dụng kiến trúc Multi-Agent (Đa tác nhân) trên n8n. Thay vì một lệnh đơn lẻ, chúng ta có một “bộ não” trung tâm điều phối 3 Agent chuyên biệt:
- Idea Agent: Đạo diễn cốt truyện và phân cảnh.
- Video Agent: Chỉ đạo nghệ thuật và prompt hình ảnh.
- Narration Agent: Biên kịch lời thoại/bình luận.
Dưới đây là hướng dẫn chi tiết cách xây dựng cỗ máy này.
Các công cụ và mô hình AI cần thiết
Để workflow vận hành trơn tru, bạn cần chuẩn bị API Key cho các dịch vụ sau (được cấu hình trực tiếp trong các node HTTP Request):
- n8n: Nền tảng điều phối (Orchestrator).
- Airtable: “Bộ não” lưu trữ ý tưởng và quản lý trạng thái sản xuất.
- OpenRouter: Cung cấp LLM để vận hành các AI Agents.
- Kie.ai (Key.ai): Sức mạnh xử lý hình ảnh và video chính.
- Model hình ảnh:
google/nano-banana-edit(Vẽ nhân vật Anime). - Model video:
bytedance/v1-lite-image-to-video(Tạo chuyển động từ ảnh).
- Model hình ảnh:
- Fal.ai: Xử lý âm thanh và hậu kỳ video.
- TTS: ElevenLabs Turbo v2.5 (Tạo giọng đọc).
- Utility: FFmpeg API (Ghép video) và Auto-subtitle (Tạo phụ đề tự động).
- Blotato: Nền tảng trung gian để upload và lên lịch đăng bài lên YouTube. Nếu bạn muốn self-hosting nền tảng có chức năng tương tự và miến phì thì có thể tham khảo bài này: Postiz – Công cụ quản lý tài khoản mạng xã hội mã nguồn mở
Bước 1: Thiết lập cơ sở dữ liệu Airtable
Workflow này được thiết kế để tương tác với 2 bảng chính trên Airtable:
- Dashboard (Anime Video DashB): Nơi bạn nhập ý tưởng (ID, Status “Todo”).
- Production (tbl…QD): Nơi chứa các tài sản media (Image URL, Video URL, Voice URL) cho từng phân cảnh.
Lưu ý: Bạn cần tạo Personal Access Token trong Airtable và cấp quyền đọc/ghi để n8n có thể tự động lấy ý tưởng và cập nhật link video sau khi render xong.
Bước 2: “Bộ não” AI Agents (The Brain)
Đây là phần thông minh nhất của workflow. Ngay sau khi lấy ý tưởng từ Airtable, n8n kích hoạt node “Brain” (sử dụng OpenRouter) để điều khiển 3 Agent con:
1. Idea Agent
Nhận đầu vào là ý tưởng Anime, Agent này sẽ tư duy và tách nội dung thành danh sách các phân cảnh (Scenes). Nó xác định:
- Câu chuyện (Story)
- Phong cách hình ảnh (Visual Style) & Màu sắc (Colors)
- Mô tả cảnh quay (Caption/Script)
2. Video Agent
Dựa trên output của Idea Agent, Video Agent sẽ viết các Prompt tối ưu cho việc tạo ảnh và xác định tỷ lệ khung hình (Aspect Ratio), đảm bảo hình ảnh đầu ra nhất quán với mô tả.
3. Narration Agent
Agent này đóng vai trò người kể chuyện, tạo ra các câu bình luận ngắn (dưới 15 từ) cho mỗi cảnh, sử dụng văn phong đời thường, dí dỏm để thu hút người xem.
Bước 3: Quy trình sản xuất Media (Media Generation)
Sau khi có kịch bản chi tiết, n8n sẽ thực thi song song các tác vụ nặng thông qua node Split Out và Merge Fields:
Tạo hình ảnh Anime (Kie.ai)
Workflow gửi request đến Kie.ai sử dụng model google/nano-banana-edit.
- Đầu vào: Prompt từ Video Agent + Hình ảnh tham chiếu (nếu có).
- Đầu ra: Một file ảnh PNG theo phong cách Anime.
Biến ảnh thành Video (Kie.ai)
Ngay sau khi có ảnh, hệ thống tiếp tục gọi Kie.ai với model bytedance/v1-lite-image-to-video. Bước này biến bức ảnh tĩnh thành một video clip dài 5 giây có chuyển động, tạo nên “linh hồn” cho Anime Shorts.
Tạo giọng đọc (Fal.ai + ElevenLabs)
Node “Create Voice” gửi văn bản đến Fal.ai (cổng kết nối tới ElevenLabs Turbo v2.5).
- Voice ID: Rachel (hoặc giọng bạn tùy chọn).
- Cấu hình: Stability 0.5, Similarity Boost 0.75 để giọng đọc tự nhiên nhất.
Bước 4: Hậu kỳ và Ghép nối (FFmpeg & Subtitles)
Thay vì dùng CapCut, workflow xử lý hậu kỳ hoàn toàn trên đám mây:
- Merge Video (Fal.ai FFmpeg): Node này thu thập tất cả video clips và audio clips, ghép chúng lại theo đúng thứ tự thời gian (Timestamp).
- Auto Subtitle (Fal.ai): Sau khi video được ghép, một node chuyên dụng sẽ tự động tạo phụ đề (Subtitles) với font chữ Montserrat, màu trắng, viền đen, có animation – chuẩn phong cách Shorts hiện nay.
Bước 5: Upload và Lên lịch (Blotato)
Bước cuối cùng để quy trình hoàn toàn tự động:
- Upload to Blotato: Video hoàn chỉnh (kèm phụ đề) được đẩy lên kho media của Blotato.
- Schedule on YouTube: Node này lấy Title và Description đã được AI viết sẵn, cùng với file video, để lên lịch đăng bài lên kênh YouTube của bạn.
- Cập nhật Airtable: Trạng thái video được chuyển sang “Done” và link video cuối cùng được lưu lại để bạn kiểm tra.
Workflow Anime Video Shorts Automator này là minh chứng cho việc bạn không cần phải là một video editor chuyên nghiệp để xây dựng kênh YouTube. Bằng cách kết hợp Kie.ai (hình ảnh/video), Fal.ai (âm thanh/hậu kỳ) và sự điều phối thông minh của n8n Agents, bạn có thể tạo ra hàng trăm video Anime chất lượng cao mỗi tháng.
Thực hiện ngay:
- Tải file JSON workflow: https://romhub.io/n8n/Anime_Video_Shorts_Automator
- Điền API Key của Kie.ai, Fal.ai, OpenRouter và Blotato.
- Tạo bảng Airtable theo template này: https://vnrom.me/edss5fq
- Nhấn “Activate” và bắt đầu đế chế nội dung của bạn!








