AI & AUTOMATION

MoneyPrinterTurbo: Tạo video ngắn chuẩn TikTok và YouTube Shorts bằng AI chỉ với keyword

Tóm tắt nhanh:

  • MoneyPrinterTurbo là dự án mã nguồn mở do harry0703 phát triển, cho phép tạo video ngắn HD hoàn chỉnh từ chỉ một chủ đề hoặc keyword duy nhất.
  • Pipeline tự động hoá toàn bộ: AI viết kịch bản → tìm video stock → ghép cảnh → thêm TTS voice → tạo phụ đề → ghép nhạc nền → render xuất file.
  • Hỗ trợ cả 9:16 (1080×1920) cho TikTok/Shorts/Reels và 16:9 (1920×1080) cho YouTube truyền thống.
  • Tích hợp nhiều LLM provider: OpenAI GPT, Moonshot, Azure, Google Gemini, DeepSeek, Ollama (local), MiniMax, ModelScope, Pollinations, gpt4free, one-api.
  • Có cả WebUI (Streamlit) và REST API – phù hợp cả cho người dùng cuối và tích hợp tự động hoá vào workflow lớn.
  • Hai cách deploy: Docker Compose (đơn giản nhất, đa nền tảng) hoặc chạy native qua uv/pip trên Windows, macOS, Linux.
  • Yêu cầu phần cứng nhẹ: CPU 4 core, RAM 4GB tối thiểu là chạy được; GPU không bắt buộc.
  • License MIT, được cộng đồng Trung Quốc và quốc tế đóng góp tích cực.

Trong vài năm gần đây, các kênh “faceless” trên TikTok, YouTube Shorts và Instagram Reels đã trở thành một mô hình kiếm tiền đáng kể – người sáng tạo không bao giờ xuất hiện trên camera, video toàn là stock footage ghép với voice-over AI và phụ đề bắt mắt. Vấn đề: làm thủ công một video như vậy tốn 2-4 tiếng cho mỗi clip 30 giây.

MoneyPrinterTurbo ra đời để giải bài toán đó. Bạn nhập chủ đề (“5 mẹo tăng năng suất”, “lịch sử bí ẩn của Pyramid”), chọn 9:16 hoặc 16:9, ấn Generate – hệ thống tự động làm phần còn lại. Trong 3-5 phút, bạn có một file MP4 hoàn chỉnh, có voice-over, có phụ đề đồng bộ, có nhạc nền, sẵn sàng upload.

Repository hiện đã thu hút hàng chục nghìn star trên GitHub và là một trong những dự án AI video generation phổ biến nhất trong cộng đồng Trung Quốc lẫn quốc tế.

Các tính năng nổi bật

Pipeline end-to-end hoàn toàn tự động

Đây là điểm khác biệt cốt lõi so với các tool chỉ làm một phần (như chỉ TTS, chỉ ghép video). MoneyPrinterTurbo thực hiện toàn bộ workflow:

  1. Sinh kịch bản – LLM nhận chủ đề và viết script ngắn 30-60 giây phù hợp với platform.
  2. Trích xuất keyword – phân tích script để xác định các từ khoá visual cần search.
  3. Tải video stock – kéo footage từ Pexels (miễn phí, chỉ cần API key free) theo từng keyword.
  4. Tạo voice-over – dùng Microsoft Edge TTS (mặc định, miễn phí) hoặc các provider khác.
  5. Tạo phụ đề – hai chế độ: edge (lấy từ TTS, nhanh) hoặc whisper (chính xác hơn, cần tải model 3GB).
  6. Ghép cảnh – cắt video stock theo độ dài voice, áp transition.
  7. Thêm nhạc nền – chọn từ thư mục resource/songs hoặc tự thêm.
  8. Render output – xuất MP4 cuối cùng qua FFmpeg và MoviePy.

Hỗ trợ đa dạng LLM provider

Đây là điểm mạnh khiến project phù hợp với cả người dùng tiết kiệm chi phí và người dùng enterprise. Danh sách provider hỗ trợ:

  • OpenAI GPT-3.5/4 (cần API key)
  • Google Gemini (free tier rộng)
  • DeepSeek – rẻ và rất mạnh cho tiếng Trung
  • Moonshot (Kimi)
  • Azure OpenAI
  • Ollama – chạy LLM hoàn toàn local, miễn phí, không gửi data ra ngoài
  • MiniMax, ModelScope, Pollinations
  • gpt4free, one-api – các gateway proxy

Lưu ý: với DeepSeekMoonshot, người dùng ngoài Trung Quốc có thể cần VPN để gọi API.

Lưu ý: với DeepSeekMoonshot, người dùng ngoài Trung Quốc có thể cần VPN để gọi API.

Linh hoạt input/output

  • Tỷ lệ khung: 9:16 (Portrait, 1080×1920) cho TikTok/Shorts/Reels, 16:9 (Landscape, 1920×1080) cho YouTube standard.
  • Độ dài clip: tuỳ chỉnh, mặc định khoảng 30-60 giây.
  • Số segment: chỉnh số đoạn ghép, độ dài mỗi đoạn.
  • Font phụ đề: thay font tuỳ ý qua thư mục resource/fonts – hỗ trợ font tiếng Việt nếu bạn copy file .ttf vào.

Hướng dẫn cài đặt MoneyPrinterTurbo

Có ba con đường để chạy MoneyPrinterTurbo. Chọn theo trình độ và môi trường của bạn.

Cách 1: Docker Compose – đơn giản và tin cậy nhất

Yêu cầu: cài Docker Desktop (Windows/macOS) hoặc Docker Engine + Docker Compose (Linux). Trên Windows nên bật WSL2 để hiệu năng tốt hơn.

git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
docker-compose up

Sau khi container chạy:

  • WebUI: http://localhost:8501
  • API docs: http://localhost:8080/docs

Lưu ý nếu bạn dùng phiên bản Docker mới: lệnh là docker compose up (không dấu gạch).

Cách 2: Cài đặt Windows one-click (cho người ngại terminal)

Tác giả cung cấp gói cài đặt portable có sẵn cho Windows. Tải v1.2.6 từ Google Drive hoặc Baidu Pan (link trong README). Sau đó:

  1. Giải nén ra thư mục bất kỳ.
  2. Chạy update.bat để cập nhật code mới nhất.
  3. Chạy start.bat để khởi động WebUI.

Nên dùng Chrome hoặc Edge để mở WebUI. Đối với một số provider LLM (DeepSeek, Moonshot từ ngoài Trung Quốc), cần VPN.

Cách 3: Cài native qua uv hoặc pip

Khuyến nghị Python 3.11. Dùng uv (do astral phát triển) sẽ nhanh hơn rất nhiều so với pip truyền thống.

git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
uv python install 3.11
uv sync --frozen

Hoặc nếu thích venv + pip cổ điển:

python3.11 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt

Cài thêm ImageMagick (bắt buộc cho rendering text)

  • Windows: tải ImageMagick-7.1.1-32-Q16-x64-static.exe, cài và set đường dẫn vào imagemagick_path trong config.toml.
  • macOS: brew install imagemagick
  • Ubuntu: sudo apt-get install imagemagick
  • CentOS: sudo yum install ImageMagick

Cài FFmpeg

FFmpeg là bắt buộc cho video encoding. Nếu thiếu sẽ báo RuntimeError: No ffmpeg exe could be found. Trên Windows, tải build từ gyan.dev rồi set ffmpeg_path trong config.toml. macOS/Linux thường đã có sẵn hoặc cài qua brew/apt.

Cấu hình ban đầu

Bước 1: Tạo config.toml

Copy config.example.toml thành config.toml. File này chứa toàn bộ thiết lập của hệ thống.

Bước 2: Đăng ký Pexels API key

Pexels là nguồn video stock chính, hoàn toàn miễn phí. Đăng ký tại pexels.com/api, lấy key, paste vào pexels_api_keys trong config.toml. Bạn có thể thêm nhiều key để rotate khi gặp rate limit:

pexels_api_keys = ["key_1", "key_2"]

Bước 3: Cấu hình LLM provider

Trong config.toml, đặt llm_provider và điền API key tương ứng. Ví dụ với DeepSeek:

llm_provider = "deepseek"
deepseek_api_key = "sk-xxxxxx"
deepseek_model_name = "deepseek-chat"
deepseek_base_url = "https://api.deepseek.com"

Với Ollama local (không cần API key, không tốn tiền):

llm_provider = "ollama"
ollama_model_name = "qwen2.5:7b"
ollama_base_url = "http://localhost:11434/v1"

Bước 4: Chọn subtitle provider

Trong config.toml:

subtitle_provider = "edge"   # nhanh, từ TTS
# hoặc
subtitle_provider = "whisper"   # chính xác cao, cần tải model

Nếu chọn whisper, tải whisper-large-v3 (~3GB) từ HuggingFace hoặc Baidu Pan, giải nén vào ./models/whisper-large-v3/.

Sử dụng MoneyPrinterTurbo: Workflow điển hình

Khởi động WebUI

uv run streamlit run ./webui/Main.py --browser.gatherUsageStats=False

Trên Windows có script tiện ích: webui.bat. Linux/macOS: sh webui.sh. Mở browser tại http://localhost:8501.

Tạo video đầu tiên

  1. Nhập chủ đề: ví dụ “10 mẹo tăng tập trung khi làm việc remote”.
  2. Chọn ngôn ngữ: tiếng Việt, Anh, Trung… đều được.
  3. Chọn tỷ lệ: 9:16 cho TikTok/Shorts.
  4. Chọn voice TTS: Edge TTS có hàng chục giọng tiếng Việt nam/nữ chất lượng cao.
  5. Chọn nhạc nền: tự upload vào resource/songs hoặc dùng track mặc định.
  6. Generate: chờ 3-5 phút tuỳ độ dài.

File output nằm trong thư mục storage/tasks/{task_id}/. Đó là MP4 sẵn sàng upload.

Dùng API cho automation

Khởi động API server:

uv run python main.py

Truy cập docs tại http://localhost:8080/docs. Từ đây bạn có thể POST request tạo video qua HTTP – phù hợp khi tích hợp vào n8n, Zapier, hay workflow scheduler để tạo content hàng ngày tự động.

Một số mẹo và lưu ý quan trọng

Nếu bạn không có GPU và muốn tiết kiệm tài nguyên, dùng edge cho subtitle và Edge TTS cho voice – cả hai đều chạy mượt trên CPU 4 core. Whisper local chỉ thực sự cần nếu bạn quan tâm độ chính xác phụ đề cho ngôn ngữ phức tạp.

Khi gặp OSError: [Errno 24] Too many open files trên Linux, tăng giới hạn file handle:

ulimit -n 10240

Trên Ubuntu/Debian nếu gặp lỗi ImageMagick@/tmp/..., hãy sửa policy.xml/etc/ImageMagick-X/ – đổi rights="none" thành rights="read|write" cho pattern @.

Để chất lượng nội dung tốt hơn, hãy thử các model mạnh như DeepSeek V4 hoặc GPT-5 thay vì model nhỏ. Chi phí với DeepSeek cực rẻ – một video 60 giây thường tốn chưa tới 0.01 USD token.


MoneyPrinterTurbo là một ví dụ điển hình về việc AI automation hạ thấp đáng kể rào cản tạo content video. Cho dù bạn đang xây kênh faceless trên TikTok, làm tutorial nội bộ cho công ty, hay đơn giản muốn test ý tưởng creative nhanh – dự án này đáng được thử nghiệm.

Duy Nghiện
Hãy làm khán giả, đừng làm nhân vật chính :)

You may also like

Nhận thông báo qua email
Nhận thông báo cho
guest

0 Bình luận
Mới nhất
Cũ nhất Nhiều like nhất
Phản hồi nội tuyến
Xem tất cả bình luận