AI & AUTOMATION

Oh My OpenCode (Sisyphus): Biến Terminal thành đội ngũ lập trình AI chuyên nghiệp

Tóm tắt nhanh:

  • Oh My OpenCode (hay Sisyphus) là một Agent Harness hoạt động trên terminal, giúp điều phối nhiều AI agents cùng lúc để xử lý code.
  • Triết lý “Batteries-Included”: Tự động cấu hình, tự động phát hiện API key, tích hợp sẵn LSP và công cụ tìm kiếm mà không cần cài đặt thủ công.
  • Mô hình hoạt động: Sử dụng đa tác nhân (Multi-agent) như Sisyphus (quản lý), Prometheus (lên kế hoạch), Atlas (thực thi) để giải quyết các task phức tạp.
  • Tính năng nổi bật: Chế độ Ultrawork cho task nhanh và Prometheus mode cho các dự án lớn cần lập kế hoạch chi tiết.

Giới thiệu về Sisyphus và Oh My OpenCode

Oh My OpenCode là một bước tiến vượt bậc so với các công cụ AI coding agent đơn lẻ, biến OpenCode thành một hệ thống orchestration (điều phối) mạnh mẽ. Thay vì chỉ là một chatbot hỗ trợ, Sisyphus hoạt động như một đội ngũ phát triển phần mềm hoàn chỉnh ngay trong terminal của bạn.

Cái tên “Sisyphus” được lấy cảm hứng từ thần thoại Hy Lạp, ám chỉ việc các mô hình ngôn ngữ lớn (LLM) thực hiện các suy nghĩ lặp đi lặp lại. Tuy nhiên, trong context này, Sisyphus không phải chịu hình phạt mà là một orchestrator thông minh, biết cách chia nhỏ công việc cho các specialized AI agents (tác nhân AI chuyên biệt) để hoàn thành nhiệm vụ nhanh chóng và chính xác hơn. Với hơn 5.400 sao trên GitHub, đây được đánh giá là “The Best Agent Harness” hiện nay.

Triết lý “Batteries-Included” nghĩa là gì?

“Batteries-Included” có nghĩa là mọi thứ bạn cần để vận hành hệ thống đã được tích hợp sẵn ngay từ khi cài đặt, loại bỏ hoàn toàn gánh nặng cấu hình thủ công.

Ngay khi bạn chạy lệnh cài đặt, Oh My OpenCode sẽ thực hiện một loạt các tác vụ tự động hóa:

  1. Phát hiện Provider: Tự động nhận diện các API key có sẵn trong môi trường (OpenAI, Claude, Gemini…).
  2. Tối ưu hóa Model: Tự động gán mô hình phù hợp nhất cho từng loại agent dựa trên tài nguyên bạn có.
  3. Cấu hình MCP: Thiết lập Model Context Protocol để agents có thể truy cập Web Search, đọc tài liệu và tìm kiếm code trên GitHub.

Hệ thống đi kèm với các công cụ mạnh mẽ giúp agent hiểu code sâu sắc như:

  • 11 công cụ LSP (Language Server Protocol): Giúp agent refactor code chính xác như IDE.
  • AST-Grep: Phân tích cấu trúc cây cú pháp của code.
  • Multi-model routing: Tự động định tuyến request đến model phù hợp nhất.

Sisyphus viết code như thế nào?

Sisyphus không viết code một cách máy móc dựa trên snippet; nó mô phỏng tư duy và quy trình làm việc của một lập trình viên senior bằng cách hiểu ngữ cảnh toàn bộ dự án.

Hệ thống sẽ explore toàn bộ cấu trúc dự án để nắm bắt conventions, phân tích patterns và duy trì nhận thức về kiến trúc tổng thể. Khi bạn yêu cầu một tính năng mới, Sisyphus đảm bảo code sinh ra không chỉ chạy được mà còn phải “khớp” với phong cách hiện có của codebase.

Để phục vụ các nhu cầu khác nhau, Oh My OpenCode cung cấp hai chế độ chính:

1. Ultrawork Mode (Chế độ tốc độ)

Dành cho các tác vụ nhanh gọn, sửa lỗi nhỏ hoặc thêm tính năng đơn giản. Bạn chỉ cần gõ lệnh và Sisyphus sẽ tự động research, implement và verify cho đến khi hoàn thành.

ulw add authentication to my Next.js app

2. Prometheus Mode (Chế độ kế hoạch)

Dành cho các refactoring lớn hoặc thay đổi phức tạp.

  • Kích hoạt bằng phím Tab.
  • Prometheus sẽ “phỏng vấn” bạn để làm rõ yêu cầu.
  • Tạo ra một bản kế hoạch chi tiết (work plan).
  • Atlas (agent thực thi) sẽ phân phối task cho các sub-agents và theo dõi tiến độ.

Hệ sinh thái Multi-Agent hoạt động ra sao?

Oh My OpenCode vận hành dựa trên sự phối hợp của một đội ngũ AI agents chạy song song, thay vì một model duy nhất xử lý tuần tự.

Mỗi agent đảm nhận một vai trò chuyên biệt:

AgentVai tròNhiệm vụ chính
SisyphusOrchestratorĐiều phối luồng công việc, quản lý chung.
PrometheusPlannerPhỏng vấn user, lên kế hoạch chi tiết.
AtlasExecutorThực thi task, quản lý các sub-agents.
OracleDebuggerPhân tích kiến trúc, tìm lỗi logic.
LibrarianResearcherTra cứu tài liệu, tìm kiếm thông tin.
Frontend Eng.UI/UXChuyên xử lý giao diện và trải nghiệm người dùng.

Việc chạy song song giúp giảm đáng kể thời gian chờ đợi. Một số người dùng đã báo cáo việc chuyển đổi ứng dụng quy mô lớn chỉ trong một đêm nhờ khả năng làm việc không biết mệt mỏi của đội ngũ này.

TIPS:

Tối ưu chi phí API:
Bạn có thể cấu hình file JSON để sử dụng các model rẻ hơn (như Gemini 3 Flash hoặc GLM-4.7) cho các tác vụ đơn giản (tìm kiếm, đọc tài liệu) và chỉ dùng model đắt tiền (Claude 4.5 Sonnet/Opus) cho việc viết code logic phức tạp.

"agents": {
  "sisyphus": { "model": "anthropic/claude-4-5-sonnet" },
  "librarian": { "model": "google/gemini-3-flash-preview" }
}

Tận dụng Prometheus cho Project lớn:
Đừng dùng Ultrawork cho các thay đổi kiến trúc. Hãy luôn dùng Prometheus (nhấn Tab) để agent tạo ra một kế hoạch rõ ràng trước. Việc này giúp tránh tình trạng agent đi sai hướng và lãng phí token.

Hướng dẫn cài đặt nhanh

Bạn có thể thiết lập toàn bộ hệ thống chỉ trong vòng chưa đầy 5 phút nhờ cơ chế cài đặt thông minh.

Yêu cầu: Node.js hoặc Bun (khuyên dùng Bun), và ít nhất một API Key (OpenAI, Anthropic, v.v.).

Bước 1: Cài đặt qua terminal

bunx oh-my-opencode install

Bước 2: Cấu hình tương tác

Hệ thống sẽ hỏi bạn về các tài khoản bạn sở hữu (Claude Pro, ChatGPT Plus…). Dựa trên câu trả lời, file cấu hình tối ưu sẽ được tạo tại ~/.config/opencode/oh-my-opencode.json.

Bước 3: Kiểm tra và sử dụng

# Kiểm tra model:
opencode models

# Bắt đầu:
opencode

So sánh Sisyphus với các công cụ khác

Sisyphus vượt trội hơn nhờ khả năng hiểu sâu codebase và cơ chế multi-agent thực thụ.

  • So với AutoGPT: AutoGPT thường gặp khó khăn khi làm việc với codebase lớn và thiếu các công cụ chuyên dụng cho code (LSP). Sisyphus tích hợp sẵn LSP và AST-Grep, giúp thao tác file chính xác hơn.
  • So với Copilot/Cursor: Các công cụ này chủ yếu là “Completion” (hoàn thành đoạn code). Sisyphus là “Orchestration” (thực hiện cả một quy trình công việc từ A-Z), có khả năng tự sửa lỗi và tiếp tục làm việc cho đến khi task hoàn thành (relentless completion).

Câu hỏi thường gặp

1. Oh My OpenCode có miễn phí không?
Bản thân mã nguồn Oh My OpenCode là open-source và miễn phí. Tuy nhiên, bạn cần trả phí API cho các nhà cung cấp mô hình (như OpenAI, Anthropic) để agents hoạt động.

2. Tôi có thể dùng Local LLM (Ollama) không?
Có. Vì Oh My OpenCode cho phép cấu hình model linh hoạt, bạn có thể trỏ agent về các local server tương thích chuẩn OpenAI (như Ollama, LM Studio) để chạy hoàn toàn offline, tuy nhiên hiệu suất có thể không bằng các model thương mại lớn.

3. Làm sao để debug khi Agent bị kẹt?
Bạn có thể xem log chi tiết hoạt động của các agent. Nếu Sisyphus bị kẹt trong vòng lặp, hãy dùng lệnh /stop và thử lại với chế độ Prometheus để cung cấp hướng dẫn rõ ràng hơn trong bước lập kế hoạch.

Duy Nghiện
Hãy làm khán giả, đừng làm nhân vật chính :)

You may also like

Nhận thông báo qua email
Nhận thông báo cho
guest

0 Bình luận
Mới nhất
Cũ nhất Nhiều like nhất
Phản hồi nội tuyến
Xem tất cả bình luận