AutoResearchClaw - Từ ý tưởng đến bản thảo khoa học tự động trong một lệnh

Tóm tắt nhanh (Key Takeaways)

AutoResearchClaw là pipeline nghiên cứu học thuật 23 giai đoạn, tự động hoá toàn bộ quy trình từ định nghĩa đề tài, rà soát tài liệu, thiết kế và chạy thí nghiệm, tới viết, phản biện giả lập và xuất bản thảo LaTeX hội nghị.

Công cụ chạy trên dòng lệnh, dùng Python 3.11+, kết nối với API OpenAI/Anthropic hoặc bất kỳ API tương thích OpenAI, có sandbox thực thi code và cơ chế gate/rollback đảm bảo an toàn.

Bạn có thể chạy hoàn toàn tự động với --auto-approve hoặc dùng chế độ co‑pilot để can thiệp ở các bước quan trọng như lọc tài liệu, thiết kế thí nghiệm và chỉnh sửa bản thảo.

Cài đặt tương đối đơn giản: clone repo, tạo virtualenv, pip install -e ., chạy researchclaw setup rồi researchclaw init để tạo file config; sau đó một lệnh researchclaw run --topic "...“ sẽ tạo trọn bộ paper + code + chart trong thư mục artifacts.

AutoResearchClaw tích hợp sâu với OpenClaw và ACP (Agent Client Protocol), nên bạn có thể khởi chạy pipeline từ nhiều AI coding agent khác nhau hoặc từ các kênh chat như Discord, Telegram, Lark, WeChat.

AutoResearchClaw là một pipeline nghiên cứu học thuật tự động, nơi bạn cung cấp một đề tài nghiên cứu và hệ thống sẽ tự lo phần còn lại: tìm tài liệu, tổng hợp tri thức, đề xuất giả thuyết, thiết kế và chạy thí nghiệm, phân tích kết quả, viết bài, mô phỏng phản biện và xuất bản thảo cuối cùng. Về kiến trúc, nó được triển khai như một state machine 23 giai đoạn, mỗi giai đoạn được điều khiển bởi gọi LLM và các executor phụ trách phần code, sandbox, và lưu trữ tri thức.

Dự án được phát triển bởi AIMING Lab (UNC‑Chapel Hill), phát hành mã nguồn mở trên GitHub với license MIT, và nhanh chóng thu hút hàng chục nghìn sao nhờ khả năng “Chat an Idea. Get a Paper.”.

Tổng quan pipeline 23 giai đoạn

AutoResearchClaw chia quy trình nghiên cứu thành 8 phase, 23 stage rõ ràng, giúp bạn (và cả agent) dễ kiểm soát và debug. Cấu trúc chính:

Phase A – Research Scoping: định nghĩa câu hỏi nghiên cứu, phạm vi, ràng buộc (TOPIC_INIT, PROBLEM_DECOMPOSE).
Phase B – Literature Discovery: thiết kế chiến lược tìm kiếm, thu thập, sàng lọc và trích xuất tri thức từ bài báo thật ở OpenAlex, Semantic Scholar, arXiv (SEARCH_STRATEGY, LITERATURE_COLLECT, LITERATURE_SCREEN, KNOWLEDGE_EXTRACT).
Phase C – Knowledge Synthesis: gom nhóm chủ đề, phân tích khoảng trống và sinh giả thuyết có thể kiểm chứng (SYNTHESIS, HYPOTHESIS_GEN).
Phase D – Experiment Design: thiết kế protocol thí nghiệm, sinh code có validation, lên kế hoạch tài nguyên (EXPERIMENT_DESIGN, CODE_GENERATION, RESOURCE_PLANNING).
Phase E – Experiment Execution: chạy thí nghiệm trong sandbox hoặc Docker/remote, lặp lại refine khi cần (EXPERIMENT_RUN, ITERATIVE_REFINE).
Phase F – Analysis & Decision: phân tích kết quả, sinh báo cáo tóm tắt và quyết định PROCEED/REFINE/PIVOT (RESULT_ANALYSIS, RESEARCH_DECISION).
Phase G – Paper Writing: tạo dàn ý, viết bản thảo, mô phỏng phản biện và sửa lại bài (PAPER_OUTLINE, PAPER_DRAFT, PEER_REVIEW, PAPER_REVISION).
Phase H – Finalization: chấm chất lượng, lưu tri thức, export LaTeX, kiểm tra trích dẫn (QUALITY_GATE, KNOWLEDGE_ARCHIVE, EXPORT_PUBLISH, CITATION_VERIFY).

Ba giai đoạn 5, 9 và 20 là gate stage – mặc định yêu cầu phê duyệt hoặc --auto-approve, nếu bị từ chối pipeline sẽ rollback về stage trước đó.

Yêu cầu hệ thống và LLM

Trước khi cài AutoResearchClaw, bạn cần lưu ý các yêu cầu cơ bản trong tester guide:

Hệ điều hành: macOS, Linux hoặc WSL2 (khuyến nghị Ubuntu 22.04+).
Python: bắt buộc 3.11 trở lên.
RAM/Disk: tối thiểu 8 GB RAM (khuyến nghị 16 GB+) và vài GB disk cho code, dataset, artifacts.
GPU: không bắt buộc ở chế độ sandbox; Docker mode hỗ trợ GPU NVIDIA + CUDA 12.x cho thí nghiệm nặng.
LLM API key: cần key OpenAI hoặc Anthropic (hoặc bất kỳ endpoint tương thích OpenAI) vì mỗi stage đều dùng LLM cho viết, code, review.…

Đối với chi phí, tester guide ước tính mỗi lần chạy pipeline đầy đủ tiêu tốn cỡ 5-15 USD tiền API, tuỳ model và độ phức tạp thí nghiệm.

Cài đặt AutoResearchClaw từng bước

AutoResearchClaw là Python package, cài dạng editable trong virtualenv.

Bước 1: Clone repo và tạo môi trường ảo

git clone https://github.com/aiming-lab/AutoResearchClaw.git
cd AutoResearchClaw

python3 -m venv .venv
source .venv/bin/activate  # macOS/Linux
# .venv\Scripts\activate   # Windows (nên dùng WSL2)

Thiết lập virtualenv giúp isolate dependency của pipeline khỏi môi trường Python chung trên máy.

Bước 2: Cài package

pip install -e .

Lệnh này cài AutoResearchClaw ở chế độ editable để bạn có thể pull update và nhận thay đổi ngay.

Bước 3: Chạy setup kiểm tra môi trường

researchclaw setup

setup sẽ kiểm tra Docker/LaTeX, đề xuất cài các thành phần bổ trợ như OpenCode beast mode, và xác nhận môi trường thí nghiệm (sandbox vs docker).

Tạo file cấu hình cho pipeline

Bạn có thể tạo config theo hai cách: interactive hoặc copy template.

Cách 1: Interactive với `researchclaw init`

researchclaw init

Lệnh này hỏi bạn provider LLM, base URL, env var chứa API key… rồi sinh file config.arc.yaml sẵn cấu trúc.

Cách 2: Copy từ template

cp config.researchclaw.example.yaml config.arc.yaml

Sau đó mở config.arc.yaml và chỉnh các field tối thiểu:

project:
  name: "my-research"

research:
  topic: "Your research topic here"

llm:
  base_url: "https://api.openai.com/v1"
  api_key_env: "OPENAI_API_KEY"
  primary_model: "gpt-4o"
  fallback_models: ["gpt-4o-mini"]

experiment:
  mode: "sandbox"
  sandbox:
    python_path: ".venv/bin/python"

API key được đọc từ biến môi trường, tuyệt đối không hard-code trong file YAML để tránh rò rỉ.

Chạy pipeline: Từ ý tưởng đến bản thảo

Khi đã có virtualenv, package và config, bạn có thể chạy pipeline với một lệnh đơn giản.

Chạy full‑auto

export OPENAI_API_KEY="sk-..."  # hoặc ANTHROPIC_API_KEY

researchclaw run \
  --config config.arc.yaml \
  --topic "Your research idea" \
  --auto-approve

Với --auto-approve, pipeline sẽ tự vượt qua các gate stage 5, 9, 20, chạy từ scoping đến citation verify mà không cần bạn tương tác. Thời gian chạy thực tế dao động khoảng 30 phút đến vài giờ, tuỳ đề tài, model và chế độ thí nghiệm sandbox hay docker.

Chế độ co‑pilot

Nếu muốn giữ quyền kiểm soát ở những quyết định quan trọng, hãy dùng co‑pilot:

researchclaw run \
  --config config.arc.yaml \
  --topic "Your research idea" \
  --mode co-pilot

Ở mode này, pipeline tự chạy qua các stage đơn giản và tạm dừng ở các checkpoint như HYPOTHESIS_GEN, EXPERIMENT_DESIGN, PAPER_DRAFT để bạn review, chỉnh sửa hoặc chat cộng tác trước khi tiếp tục.

Kiểm tra kết quả và deliverables

Sau khi pipeline hoàn tất, output được đặt trong thư mục artifacts/rc-YYYYMMDD-HHMMSS-<hash>/deliverables/. Một run đầy đủ thường bao gồm:

paper_final.md và paper.tex: bản thảo hoàn chỉnh 5000-6500 từ và LaTeX sẵn template NeurIPS/ICLR/ICML.
references.bib: file BibTeX chỉ chứa các tài liệu thực sự được trích dẫn trong bài, đã qua nhiều tầng verification.
code/: mã thí nghiệm (ví dụ main.py, requirements.txt) được sinh và validate AST, security scan trước khi chạy.
charts/: các biểu đồ so sánh kết quả, đường cong học, timeline,… ở dạng PNG.
verification_report.json và quality_report.json: báo cáo integrity trích dẫn, quality gate và khuyến nghị cải thiện.

Bạn có thể import paper.tex lên Overleaf để chỉnh sửa thủ công, hoặc sử dụng paper_final.md làm nền cho một phiên bản rút gọn blog‑post, whitepaper hay tài liệu nội bộ.

Docker mode và thực thi thí nghiệm nặng

Nếu đề tài của bạn đòi hỏi training mô hình deep learning nặng, Docker mode là lựa chọn phù hợp.

Trong config.arc.yaml:

experiment:
  mode: "docker"
  docker:
    image: "researchclaw/experiment:latest"
    gpu_enabled: true
    network_policy: "setup_only"
    memory_limit_mb: 8192
    auto_install_deps: true

Quy trình chung:

Build image thí nghiệm từ thư mục researchclaw/docker/ nếu README yêu cầu.
Đảm bảo NVIDIA Container Toolkit cài đặt đúng để container thấy GPU.
Chạy researchclaw run --config config.arc.yaml --auto-approve như thường.

Pipeline chia execution thành ba phase: cài dependency (có mạng), setup, rồi chạy thí nghiệm with network off, giúp giảm rủi ro và tăng reproducibility.

Tích hợp với OpenClaw, ACP và các agent khác

Một điểm thú vị của AutoResearchClaw là khả năng trở thành “dịch vụ” bên trong hệ sinh thái agent như OpenClaw.

Trong OpenClaw, bạn chỉ cần gửi URL repo; OpenClaw đọc RESEARCHCLAW_AGENTS.md, hiểu pipeline và tự động clone, cài, cấu hình rồi chạy khi bạn nhắn “Research [topic]”.
Qua Agent Client Protocol (ACP), AutoResearchClaw có thể dùng bất kỳ AI coding agent CLI nào (Claude Code, Copilot CLI, Gemini CLI, OpenCode, Kimi CLI) làm backend LLM mà không cần bạn quản lý API key trong config.

Ở chế độ ACP, config LLM chỉ cần chỉ ra lệnh agent và thư mục làm việc, phần auth để agent tự xử lý.

Ứng dụng thực tế cho nhà nghiên cứu và builder

AutoResearchClaw không thay thế nhà nghiên cứu, nhưng giúp bạn tăng băng thông ở những khâu nặng thủ tục:

Khảo sát ý tưởng nhanh: bạn ném vào một giả thuyết, pipeline trả lại một vòng paper+experiment để bạn xem tính khả thi trước khi đầu tư công sức thật.
Tạo baseline và ablation framework: pipeline sinh mã thí nghiệm, logic training và benchmark hợp lý; bạn có thể fork để thêm mô hình, dataset và custom analysis.
Tài liệu hóa kết quả nội bộ: kể cả khi không xuất bản, việc auto‑generate LaTeX, figures và knowledge base giúp team lưu lại logic thí nghiệm, quyết định và lessons learned một cách có cấu trúc.

Với builder thiên về hệ thống AI agent, AutoResearchClaw là một “research service” thú vị để cắm vào stack: chat interface, OpenClaw, MetaClaw, skills library… tất cả đã được thiết kế sẵn để bạn tận dụng trong sản phẩm của riêng mình.

Tài nguyên tham khảo

Repo chính thức: https://github.com/aiming-lab/AutoResearchClaw
Bài báo arXiv mô tả hệ thống: https://arxiv.org/abs/2605.20025

Khi nắm được cách cài, cấu hình và chạy một vài topic trong lĩnh vực bạn am hiểu, bạn sẽ thấy rõ AutoResearchClaw không chỉ là “AI viết paper”, mà là một nền tảng tự động hoá nghiên cứu có thể cá nhân hoá theo phong cách, tiêu chuẩn và stack hạ tầng riêng của bạn.

Duy Nghiện

Hãy làm khán giả, đừng làm nhân vật chính :)