Ruflo – Nền tảng điều phối AI agent doanh nghiệp dành cho Claude Code
Tóm tắt nhanh
- Ruflo (tiền thân là Claude Flow) là nền tảng điều phối AI agent mã nguồn mở, đạt phiên bản ổn định v3.5 sau 10 tháng phát triển với hơn 5.800 commit và 55 vòng lặp alpha.
- Ruflo biến Claude Code thành một môi trường đa agent hoàn chỉnh với hơn 60 loại agent chuyên biệt, 215 công cụ MCP và 26 lệnh CLI với hơn 140 subcommand.
- Tích hợp chỉ bằng một lệnh duy nhất:
claude mcp add ruflo -- npx -y ruflo@latest, không cần cài đặt phức tạp.- Hệ thống bộ nhớ HNSW cho tốc độ tìm kiếm nhanh hơn 150 đến 12.500 lần so với phiên bản trước; bộ định tuyến mô hình 3 tầng giúp tiết kiệm đến 75% chi phí API.
- Ruflo phù hợp cho cả cá nhân lẫn đội nhóm doanh nghiệp cần tự động hóa quy trình kỹ thuật phức tạp với kiến trúc swarm có khả năng chịu lỗi Byzantine.
- Dự án có giấy phép MIT, liên kết với nền tảng Cognitum v0 – hệ thống trí tuệ tỷ lệ với kiến trúc agent luôn hoạt động và điện năng cực thấp.
Khi Claude Code ra đời, nhiều lập trình viên nhận ra tiềm năng của nó nhưng cũng thấy rõ giới hạn: một agent đơn lẻ, dù mạnh đến đâu, vẫn xử lý mọi thứ theo trình tự tuyến tính. Ruflo ra đời để phá vỡ giới hạn đó – biến Claude Code từ một trợ lý lập trình đơn lẻ thành một đội ngũ AI đa chuyên ngành phối hợp song song, có bộ nhớ tự học và khả năng tự phục hồi khi xảy ra lỗi.
Ruflo là gì?
Ruflo là framework điều phối AI agent toàn diện, được phát triển bởi Reuven Cohen (ruvnet) và liên kết với nền tảng trí tuệ tỷ lệ Cognitum v0. Dự án tiền thân là Claude Flow – sau 10 tháng phát triển liên tục, hơn 5.800 commit, 55 vòng lặp alpha và đạt 19.800 sao trên GitHub, Ruflo v3.5 chính thức trở thành phiên bản ổn định đầu tiên vào ngày 27 tháng 2 năm 2026.
Điểm khác biệt cốt lõi nằm ở triết lý thiết kế: trong khi các công cụ AI thông thường chạy theo mô hình một câu hỏi – một câu trả lời, Ruflo xây dựng một lớp điều phối thực sự, nơi nhiều agent có vai trò chuyên biệt làm việc song song, chia sẻ bộ nhớ, chuyển giao kết quả cho nhau và tự học từ mỗi tác vụ hoàn thành.
Những con số nói lên điều đó
Ruflo v3.5 đạt các chỉ số ấn tượng sau khi ra mắt ổn định: hơn 60 loại agent chuyên biệt, 215 công cụ MCP, 26 lệnh CLI với 140+ subcommand, 17 hook tự học cộng với 12 background worker, 20 plugin (8 chính thức, 12 cộng đồng), 445 test đang pass và 0 lỗ hổng bảo mật trên production.
Kiến trúc nổi bật của Ruflo
Swarm intelligence và các cấu hình topo
Ruflo tổ chức các agent thành swarm với bốn cấu hình topo chính. Topo hierarchical phù hợp với nhóm nhỏ từ 6 đến 8 agent với cơ chế kiểm soát tập trung, ít nguy cơ drift. Topo hierarchical-mesh mở rộng lên 10-15 agent với mô hình queen kết hợp peer-to-peer. Topo mesh ưu tiên cộng tác ngang hàng, còn adaptive tự điều chỉnh theo tải công việc thực tế.
Ngoài ra, cơ chế Hive-Mind hỗ trợ đồng thuận Byzantine fault-tolerant: ngay cả khi một phần agent gặp lỗi, swarm vẫn đạt được kết quả nhất quán thông qua các chiến lược như Raft, Gossip, CRDT hay Byzantine voting.
Bộ nhớ tự học với HNSW và RAG
AgentDB v3 – hệ thống bộ nhớ của Ruflo – sử dụng chỉ mục HNSW (Hierarchical Navigable Small World) cho tìm kiếm vector nhanh hơn 150 đến 12.500 lần so với SQLite FTS. Tốc độ tạo embedding tăng 75 lần nhờ ReasoningBank chạy trên WASM thay vì gọi API ngoài.
Kiến trúc RAG của Ruflo hoạt động theo bốn giai đoạn: RETRIEVE (truy xuất với HNSW), JUDGE (đánh giá thành công/thất bại), DISTILL (tinh chỉnh LoRA) và CONSOLIDATE (hợp nhất bộ nhớ với EWC++ để tránh quên kiến thức cũ). Điều này cho phép agent học từ các tác vụ đã thực hiện và cải thiện theo thời gian.
Định tuyến mô hình 3 tầng
Thay vì gửi mọi yêu cầu lên mô hình lớn và tốn kém, Ruflo phân loại tác vụ theo độ phức tạp. Tầng 1 dùng Agent Booster WASM với độ trễ dưới 1ms và chi phí bằng 0 cho các biến đổi đơn giản. Tầng 2 dùng Claude Haiku cho tác vụ cơ bản với chi phí khoảng 0,0002 USD mỗi lần. Tầng 3 dùng Sonnet hoặc Opus cho suy luận phức tạp. Kết quả là tiết kiệm đến 75% chi phí API so với cách tiếp cận thông thường.
Hướng dẫn cài đặt Ruflo
Yêu cầu hệ thống
Ruflo chạy trên Linux, macOS và Windows. Bạn cần Node.js phiên bản 18 hoặc mới hơn (khuyến nghị v18 LTS hoặc v20 LTS), npm hoặc yarn và Claude Code đã được cài đặt và xác thực.
Cách 1: Tích hợp MCP với Claude Code (khuyến nghị)
Đây là cách nhanh nhất để bắt đầu. Chỉ cần một lệnh duy nhất:
claude mcp add ruflo -- npx -y ruflo@latestSau lệnh này, Claude Code ngay lập tức có quyền truy cập vào toàn bộ 215 công cụ MCP của Ruflo bao gồm điều phối swarm, bộ nhớ vector, hook tự học, huấn luyện neural và quét bảo mật.
Để tích hợp với Claude Desktop, thêm cấu hình sau vào file settings.json:
{
"mcpServers": {
"ruflo": {
"command": "npx",
"args": ["-y", "ruflo@latest"]
}
}
}Cách 2: Sử dụng CLI độc lập
Khởi tạo dự án mới với trình hướng dẫn tương tác:
npx ruflo@latest init --wizardKiểm tra sức khỏe hệ thống và tự động sửa các vấn đề thường gặp:
npx ruflo doctor --fixKhởi động background workers cho quá trình tự học:
npx ruflo daemon startLƯU Ý:
ba tên gói
ruflo,claude-flowvà@claude-flow/cliđều trỏ về cùng một CLI, vì vậynpx claude-flow@latest(alias cũ) vẫn tiếp tục hoạt động bình thường.
Hướng dẫn sử dụng Ruflo
Khởi tạo và triển khai swarm đầu tiên
Khởi tạo swarm theo cấu hình phân cấp với tối đa 8 agent:
npx ruflo swarm init --topology hierarchical --max-agents 8 --strategy specializedSau đó spawn các agent chuyên biệt theo nhu cầu:
npx ruflo agent spawn -t coder --name my-coder
npx ruflo agent spawn -t tester --name my-tester
npx ruflo agent spawn -t reviewer --name my-reviewerRuflo cung cấp hơn 60 loại agent được phân nhóm rõ ràng: nhóm core (coder, reviewer, tester, planner, researcher), nhóm SPARC (specification, pseudocode, architecture, refinement), nhóm GitHub (pr-manager, issue-tracker, release-manager), nhóm security, performance và nhiều domain chuyên biệt khác như ml-developer, mobile-dev, cicd-engineer.
Làm việc với bộ nhớ và RAG
Lưu một pattern vào bộ nhớ vector để sử dụng lại sau:
npx ruflo memory store --key "auth-pattern" --value "JWT with refresh tokens" --namespace patternsTìm kiếm ngữ nghĩa qua toàn bộ kiến thức đã lưu:
npx ruflo memory search --query "authentication best practices" --limit 5Để agent tự chọn đồng nghiệp phù hợp nhất cho một tác vụ:
npx ruflo hooks route --task "implement OAuth2 login flow"Sau khi hoàn thành tác vụ, huấn luyện hệ thống từ kết quả:
npx ruflo hooks post-task --task-id "t1" --success true --store-results trueChế độ cộng tác Claude và Codex song song
Ruflo hỗ trợ chạy đồng thời Claude Code và OpenAI Codex với bộ nhớ chia sẻ:
npx ruflo codex dual run feature \
--worker "claude:architect:Design the API structure" \
--worker "codex:coder:Implement REST endpoints" \
--worker "claude:tester:Write integration tests"Đây là điểm hiếm thấy trong các công cụ cùng loại: khả năng kết hợp hai nhà cung cấp LLM trong cùng một quy trình điều phối, với kết quả được gộp lại thông qua bộ nhớ chung.
Quản lý bảo mật và hiệu suất
Chạy kiểm tra bảo mật toàn diện:
npx ruflo security scan --depth fullLập hồ sơ hiệu suất và benchmark:
npx ruflo performance benchmarkHuấn luyện neural trên các pattern thành công:
npx ruflo neural train --pattern-type coordination --epochs 10Các kịch bản sử dụng thực tế
Ruflo phù hợp nhất với ba nhóm trường hợp. Nhóm thứ nhất là phát triển phần mềm theo phương pháp TDD: một agent viết test trước, agent thứ hai viết code cho đến khi test pass, agent thứ ba review chất lượng và agent thứ tư tạo tài liệu, tất cả chạy trong một pipeline tự động. Nhóm thứ hai là phân tích và phát hiện lỗ hổng bảo mật song song trên nhiều module codebase cùng lúc với agent security-architect và security-auditor. Nhóm thứ ba là quản lý repository GitHub tự động: pr-manager, issue-tracker và release-manager phối hợp để xử lý toàn bộ vòng đời release.
Nâng cấp từ phiên bản cũ (Claude Flow v2.x)
Nếu bạn đang dùng Claude Flow v2.x hoặc v3.0-alpha, quá trình nâng cấp được tự động hóa:
npx ruflo migrate status # kiểm tra trạng thái
npx ruflo migrate run --backup # chạy nâng cấp với backup
npx ruflo migrate validate # xác nhận kết quảĐối với người dùng v3.0-alpha, chỉ cần cập nhật lệnh MCP:
claude mcp remove claude-flow
claude mcp add ruflo -- npx -y ruflo@latestRuflo v3.5 đánh dấu sự trưởng thành của một dự án đầy tham vọng: từ một script thử nghiệm trên Reddit đến một nền tảng điều phối AI agent doanh nghiệp với kiến trúc hoàn chỉnh, bảo mật được kiểm chứng và hiệu suất vượt trội. Với chỉ một lệnh tích hợp vào Claude Code, bất kỳ lập trình viên nào cũng có thể bắt đầu triển khai swarm đa agent ngay lập tức.
Điều làm cho Ruflo trở nên đáng chú ý không chỉ là danh sách tính năng dài: đó là cách nó kết hợp tự học liên tục, quản lý chi phí thông minh và khả năng chịu lỗi trong một gói mã nguồn mở duy nhất, hoàn toàn có thể kiểm tra và tùy chỉnh.








