MoneyPrinterTurbo: Tạo video ngắn chuẩn TikTok và YouTube Shorts bằng AI chỉ với keyword
Tóm tắt nhanh:
- MoneyPrinterTurbo là dự án mã nguồn mở do harry0703 phát triển, cho phép tạo video ngắn HD hoàn chỉnh từ chỉ một chủ đề hoặc keyword duy nhất.
- Pipeline tự động hoá toàn bộ: AI viết kịch bản → tìm video stock → ghép cảnh → thêm TTS voice → tạo phụ đề → ghép nhạc nền → render xuất file.
- Hỗ trợ cả 9:16 (1080×1920) cho TikTok/Shorts/Reels và 16:9 (1920×1080) cho YouTube truyền thống.
- Tích hợp nhiều LLM provider: OpenAI GPT, Moonshot, Azure, Google Gemini, DeepSeek, Ollama (local), MiniMax, ModelScope, Pollinations, gpt4free, one-api.
- Có cả WebUI (Streamlit) và REST API – phù hợp cả cho người dùng cuối và tích hợp tự động hoá vào workflow lớn.
- Hai cách deploy: Docker Compose (đơn giản nhất, đa nền tảng) hoặc chạy native qua
uv/piptrên Windows, macOS, Linux.- Yêu cầu phần cứng nhẹ: CPU 4 core, RAM 4GB tối thiểu là chạy được; GPU không bắt buộc.
- License MIT, được cộng đồng Trung Quốc và quốc tế đóng góp tích cực.
Trong vài năm gần đây, các kênh “faceless” trên TikTok, YouTube Shorts và Instagram Reels đã trở thành một mô hình kiếm tiền đáng kể – người sáng tạo không bao giờ xuất hiện trên camera, video toàn là stock footage ghép với voice-over AI và phụ đề bắt mắt. Vấn đề: làm thủ công một video như vậy tốn 2-4 tiếng cho mỗi clip 30 giây.
MoneyPrinterTurbo ra đời để giải bài toán đó. Bạn nhập chủ đề (“5 mẹo tăng năng suất”, “lịch sử bí ẩn của Pyramid”), chọn 9:16 hoặc 16:9, ấn Generate – hệ thống tự động làm phần còn lại. Trong 3-5 phút, bạn có một file MP4 hoàn chỉnh, có voice-over, có phụ đề đồng bộ, có nhạc nền, sẵn sàng upload.
Repository hiện đã thu hút hàng chục nghìn star trên GitHub và là một trong những dự án AI video generation phổ biến nhất trong cộng đồng Trung Quốc lẫn quốc tế.

Các tính năng nổi bật
Pipeline end-to-end hoàn toàn tự động
Đây là điểm khác biệt cốt lõi so với các tool chỉ làm một phần (như chỉ TTS, chỉ ghép video). MoneyPrinterTurbo thực hiện toàn bộ workflow:
- Sinh kịch bản – LLM nhận chủ đề và viết script ngắn 30-60 giây phù hợp với platform.
- Trích xuất keyword – phân tích script để xác định các từ khoá visual cần search.
- Tải video stock – kéo footage từ Pexels (miễn phí, chỉ cần API key free) theo từng keyword.
- Tạo voice-over – dùng Microsoft Edge TTS (mặc định, miễn phí) hoặc các provider khác.
- Tạo phụ đề – hai chế độ:
edge(lấy từ TTS, nhanh) hoặcwhisper(chính xác hơn, cần tải model 3GB). - Ghép cảnh – cắt video stock theo độ dài voice, áp transition.
- Thêm nhạc nền – chọn từ thư mục
resource/songshoặc tự thêm. - Render output – xuất MP4 cuối cùng qua FFmpeg và MoviePy.
Hỗ trợ đa dạng LLM provider
Đây là điểm mạnh khiến project phù hợp với cả người dùng tiết kiệm chi phí và người dùng enterprise. Danh sách provider hỗ trợ:
- OpenAI GPT-3.5/4 (cần API key)
- Google Gemini (free tier rộng)
- DeepSeek – rẻ và rất mạnh cho tiếng Trung
- Moonshot (Kimi)
- Azure OpenAI
- Ollama – chạy LLM hoàn toàn local, miễn phí, không gửi data ra ngoài
- MiniMax, ModelScope, Pollinations
- gpt4free, one-api – các gateway proxy
Lưu ý: với DeepSeek và Moonshot, người dùng ngoài Trung Quốc có thể cần VPN để gọi API.
Lưu ý: với DeepSeek và Moonshot, người dùng ngoài Trung Quốc có thể cần VPN để gọi API.
Linh hoạt input/output
- Tỷ lệ khung: 9:16 (Portrait, 1080×1920) cho TikTok/Shorts/Reels, 16:9 (Landscape, 1920×1080) cho YouTube standard.
- Độ dài clip: tuỳ chỉnh, mặc định khoảng 30-60 giây.
- Số segment: chỉnh số đoạn ghép, độ dài mỗi đoạn.
- Font phụ đề: thay font tuỳ ý qua thư mục
resource/fonts– hỗ trợ font tiếng Việt nếu bạn copy file.ttfvào.
Hướng dẫn cài đặt MoneyPrinterTurbo
Có ba con đường để chạy MoneyPrinterTurbo. Chọn theo trình độ và môi trường của bạn.
Cách 1: Docker Compose – đơn giản và tin cậy nhất
Yêu cầu: cài Docker Desktop (Windows/macOS) hoặc Docker Engine + Docker Compose (Linux). Trên Windows nên bật WSL2 để hiệu năng tốt hơn.
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
docker-compose upSau khi container chạy:
- WebUI:
http://localhost:8501 - API docs:
http://localhost:8080/docs
Lưu ý nếu bạn dùng phiên bản Docker mới: lệnh là docker compose up (không dấu gạch).
Cách 2: Cài đặt Windows one-click (cho người ngại terminal)
Tác giả cung cấp gói cài đặt portable có sẵn cho Windows. Tải v1.2.6 từ Google Drive hoặc Baidu Pan (link trong README). Sau đó:
- Giải nén ra thư mục bất kỳ.
- Chạy
update.batđể cập nhật code mới nhất. - Chạy
start.batđể khởi động WebUI.
Nên dùng Chrome hoặc Edge để mở WebUI. Đối với một số provider LLM (DeepSeek, Moonshot từ ngoài Trung Quốc), cần VPN.
Cách 3: Cài native qua uv hoặc pip
Khuyến nghị Python 3.11. Dùng uv (do astral phát triển) sẽ nhanh hơn rất nhiều so với pip truyền thống.
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
uv python install 3.11
uv sync --frozenHoặc nếu thích venv + pip cổ điển:
python3.11 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txtCài thêm ImageMagick (bắt buộc cho rendering text)
- Windows: tải
ImageMagick-7.1.1-32-Q16-x64-static.exe, cài và set đường dẫn vàoimagemagick_pathtrongconfig.toml. - macOS:
brew install imagemagick - Ubuntu:
sudo apt-get install imagemagick - CentOS:
sudo yum install ImageMagick
Cài FFmpeg
FFmpeg là bắt buộc cho video encoding. Nếu thiếu sẽ báo RuntimeError: No ffmpeg exe could be found. Trên Windows, tải build từ gyan.dev rồi set ffmpeg_path trong config.toml. macOS/Linux thường đã có sẵn hoặc cài qua brew/apt.
Cấu hình ban đầu
Bước 1: Tạo config.toml
Copy config.example.toml thành config.toml. File này chứa toàn bộ thiết lập của hệ thống.
Bước 2: Đăng ký Pexels API key
Pexels là nguồn video stock chính, hoàn toàn miễn phí. Đăng ký tại pexels.com/api, lấy key, paste vào pexels_api_keys trong config.toml. Bạn có thể thêm nhiều key để rotate khi gặp rate limit:
pexels_api_keys = ["key_1", "key_2"]Bước 3: Cấu hình LLM provider
Trong config.toml, đặt llm_provider và điền API key tương ứng. Ví dụ với DeepSeek:
llm_provider = "deepseek"
deepseek_api_key = "sk-xxxxxx"
deepseek_model_name = "deepseek-chat"
deepseek_base_url = "https://api.deepseek.com"Với Ollama local (không cần API key, không tốn tiền):
llm_provider = "ollama"
ollama_model_name = "qwen2.5:7b"
ollama_base_url = "http://localhost:11434/v1"Bước 4: Chọn subtitle provider
Trong config.toml:
subtitle_provider = "edge" # nhanh, từ TTS
# hoặc
subtitle_provider = "whisper" # chính xác cao, cần tải modelNếu chọn whisper, tải whisper-large-v3 (~3GB) từ HuggingFace hoặc Baidu Pan, giải nén vào ./models/whisper-large-v3/.
Sử dụng MoneyPrinterTurbo: Workflow điển hình
Khởi động WebUI
uv run streamlit run ./webui/Main.py --browser.gatherUsageStats=FalseTrên Windows có script tiện ích: webui.bat. Linux/macOS: sh webui.sh. Mở browser tại http://localhost:8501.
Tạo video đầu tiên
- Nhập chủ đề: ví dụ “10 mẹo tăng tập trung khi làm việc remote”.
- Chọn ngôn ngữ: tiếng Việt, Anh, Trung… đều được.
- Chọn tỷ lệ: 9:16 cho TikTok/Shorts.
- Chọn voice TTS: Edge TTS có hàng chục giọng tiếng Việt nam/nữ chất lượng cao.
- Chọn nhạc nền: tự upload vào
resource/songshoặc dùng track mặc định. - Generate: chờ 3-5 phút tuỳ độ dài.
File output nằm trong thư mục storage/tasks/{task_id}/. Đó là MP4 sẵn sàng upload.
Dùng API cho automation
Khởi động API server:
uv run python main.pyTruy cập docs tại http://localhost:8080/docs. Từ đây bạn có thể POST request tạo video qua HTTP – phù hợp khi tích hợp vào n8n, Zapier, hay workflow scheduler để tạo content hàng ngày tự động.
Một số mẹo và lưu ý quan trọng
Nếu bạn không có GPU và muốn tiết kiệm tài nguyên, dùng edge cho subtitle và Edge TTS cho voice – cả hai đều chạy mượt trên CPU 4 core. Whisper local chỉ thực sự cần nếu bạn quan tâm độ chính xác phụ đề cho ngôn ngữ phức tạp.
Khi gặp OSError: [Errno 24] Too many open files trên Linux, tăng giới hạn file handle:
ulimit -n 10240Trên Ubuntu/Debian nếu gặp lỗi ImageMagick@/tmp/..., hãy sửa policy.xml ở /etc/ImageMagick-X/ – đổi rights="none" thành rights="read|write" cho pattern @.
Để chất lượng nội dung tốt hơn, hãy thử các model mạnh như DeepSeek V4 hoặc GPT-5 thay vì model nhỏ. Chi phí với DeepSeek cực rẻ – một video 60 giây thường tốn chưa tới 0.01 USD token.
MoneyPrinterTurbo là một ví dụ điển hình về việc AI automation hạ thấp đáng kể rào cản tạo content video. Cho dù bạn đang xây kênh faceless trên TikTok, làm tutorial nội bộ cho công ty, hay đơn giản muốn test ý tưởng creative nhanh – dự án này đáng được thử nghiệm.








