claude-mem: Giải pháp "bộ nhớ dài hạn" cho Claude Code

Tóm tắt nhanh:

Vấn đề: Claude Code thường xuyên “quên” ngữ cảnh (context) khi qua phiên làm việc mới hoặc khi xử lý codebase lớn.
Giải pháp: claude-mem hoạt động như một layer bộ nhớ dài hạn, tự động ghi lại, nén và tiêm (inject) lại kiến thức quan trọng.
Cơ chế: Capture (Ghi nhận) → Compress (Nén thông tin) → Inject (Nhắc lại ngữ cảnh).
Lợi ích: Tiết kiệm token, giảm thời gian “ôn bài” cho AI và duy trì mạch tư duy xuyên suốt dự án.

Tại sao Claude Code cần một “bộ nhớ ngoài”?

Mặc dù các mô hình như Claude 4.5 Sonnet sở hữu context window lên tới 200K token, thực tế cho thấy việc nhồi nhét toàn bộ lịch sử hội thoại vào một phiên làm việc không phải là giải pháp tối ưu. Khi bạn refactor một codebase cũ, xây dựng microservice phức tạp hoặc debug qua nhiều ngày, bạn sẽ gặp phải giới hạn:

Tràn context window: Log dài, diff lớn và nội dung file nhanh chóng lấp đầy bộ nhớ ngắn hạn.
Mất ngữ cảnh (Amnesia): Khi mở phiên mới, AI quên sạch các quy ước (convention) và kiến trúc đã thống nhất hôm qua.
Hiệu suất giảm: AI bắt đầu trả lời lạc đề hoặc ảo giác (hallucination) khi phải xử lý quá nhiều thông tin nhiễu.

claude-mem ra đời để giải quyết tận gốc vấn đề này bằng cách cung cấp khả năng long-term memory (trí nhớ dài hạn) ở cấp độ project.

claude-mem là gì?

claude-mem là một công cụ mã nguồn mở dành cho Claude Code, được thiết kế để tự động quản lý vòng đời kiến thức của dự án. Thay vì dựa hoàn toàn vào bộ nhớ tạm thời của mô hình ngôn ngữ, công cụ này tạo ra một kho lưu trữ bền vững các quyết định kỹ thuật và thay đổi quan trọng.

Cụ thể, claude-mem giúp Claude:

Ghi nhớ các thay đổi file, lệnh đã chạy và quyết định kiến trúc.
Nén thông tin thành các bản tóm tắt tinh gọn.
Tái sử dụng kiến thức này ở các phiên làm việc sau mà không cần người dùng nhập liệu thủ công.

Kết quả là bạn sẽ làm việc với một AI Developer có khả năng ghi nhớ xuyên suốt, thay vì một chatbot “reset” não mỗi lần tắt máy.

Cơ chế hoạt động: Quy trình 3 bước Capture – Compress – Inject

claude-mem vận hành dựa trên một vòng lặp liên tục để đảm bảo ngữ cảnh luôn tươi mới nhưng gọn nhẹ.

1. Capture – Ghi lại tương tác kỹ thuật

Ngay khi được kích hoạt, hệ thống sẽ lắng nghe các sự kiện trong Claude Code:

File nào đang được mở hoặc chỉnh sửa.
Các lệnh terminal được thực thi (test, build, grep…).
Các đoạn hội thoại giải thích về business logic hoặc refactoring.

Thay vì lưu trữ raw log (log thô) tốn kém dung lượng, claude-mem trích xuất các “observations” (quan sát) mang tính định hướng. Ví dụ: “Đã refactor UserService tách logic auth & profile” hay “Đổi cấu trúc response API /billing để trả thêm invoiceStatus“.

2. Compress – Nén thông tin thông minh

Để tránh làm tràn context window ở phiên sau, claude-mem sử dụng chính Claude’s agent-sdk để xử lý dữ liệu thô:

Tóm tắt: Chuyển đổi hàng trang log thành vài dòng mô tả súc tích.
Phân loại: Gom nhóm thông tin theo Repo, Feature hoặc Module.
Lọc nhiễu: Loại bỏ stack trace dài dòng hoặc output test lặp lại không cần thiết.

Dữ liệu sau khi xử lý được lưu thành các memory unit (đơn vị bộ nhớ), sẵn sàng cho việc truy xuất ngữ nghĩa (semantic search).

3. Inject – Tự động đồng bộ ngữ cảnh

Đây là bước tạo nên giá trị cốt lõi. Khi bạn khởi tạo một session mới:

Công cụ nhận diện project hiện tại.
Truy vấn bộ nhớ để tìm các thay đổi gần nhất và TODO list còn dang dở.
Tự động inject (tiêm) một đoạn tóm tắt vào đầu prompt hệ thống.

Ví dụ đoạn context được inject:

“Đây là project billing service. Các phiên trước đã:

Refactor InvoiceService hỗ trợ multi-currency
Thêm Stripe webhook handler tại webhooks/stripe.ts
TODO: tối ưu truy vấn DB ở getInvoicesForUser do N+1 query.”

Tối ưu chi phí Token:
Việc sử dụng claude-mem giúp giảm đáng kể số lượng token đầu vào (input tokens) vì bạn không cần paste lại toàn bộ tài liệu dự án mỗi lần mở chat. Điều này đặc biệt có lợi về mặt chi phí nếu bạn sử dụng API key cá nhân.

Hướng dẫn cài đặt claude-mem

Cách 1: Cài đặt nhanh

Cài đặt trên Claude Code session:

/plugin marketplace add thedotmack/claude-mem
/plugin install claude-mem

Khởi động lại Claude Code, context từ các phiên trước sẽ tự động xuất hiện trong các phiên mới.

Cách 2: Cài đặt nâng cao dành cho dev / testing

Bạn cần môi trường đã cài đặt Node.js (>= 18) và Claude Code.

Các bước cài đặt từ GitHub:

# 1. Clone repo mã nguồn
git clone https://github.com/thedotmack/claude-mem.git
cd claude-mem

# 2. Cài đặt các thư viện phụ thuộc (dependencies)
npm install

# 3. Build dự án
npm run build

# 4. Worker services sẽ tự động khởi động khi bắt đầu phiên Claude Code đầu tiên
# Hoặc khởi động thủ công bằng lệnh:
npm run worker:start

# 5. Kiểm tra xem tiến trình worker có đang chạy hay không
npm run worker:status

Sau khi cài đặt, bạn cần tích hợp vào cấu hình của Claude Code (thông qua khai báo plugin hoặc MCP server tùy theo phiên bản hiện tại).

Vị trí thư mục dữ liệu

Dữ liệu được lưu trữ trong ~/.claude-mem/:

Cài đặt: ~/.claude-mem/settings.json
Cơ sở dữ liệu: ~/.claude-mem/claude-mem.db
Tệp PID: ~/.claude-mem/.worker.pid
Tệp cổng: ~/.claude-mem/.worker.port
Nhật ký: ~/.claude-mem/logs/worker-YYYY-MM-DD.log

TIPS:

Sử dụng Web UI (http://localhost:37777) để kiểm tra trực quan dòng thời gian bộ nhớ. Điều này cho phép bạn kiểm tra chính xác những gì AI đã ghi lại liên quan đến lịch sử kho lưu trữ của bạn.

Lợi ích thực tế trong workflow lập trình

1. Duy trì mạch làm việc (Continuity)

Kịch bản thường gặp: Bạn làm dở một tính năng vào Thứ Sáu và quay lại vào Thứ Hai. Thông thường, bạn sẽ mất 15-30 phút để đọc lại code và giải thích lại cho AI. Với claude-mem, Claude sẽ chủ động nhắc lại: “Lần trước chúng ta đang chuyển toàn bộ auth flow sang JWT, bạn có muốn tiếp tục không?”.

2. Quản lý Codebase lớn hiệu quả

Đối với các dự án Monorepo hoặc Microservices, việc nhét hết context vào một prompt là bất khả thi. claude-mem giữ lại “bức tranh lớn” (Big Picture) về kiến trúc và flow dữ liệu, trong khi context window của Claude chỉ cần tập trung vào các file chi tiết đang xử lý.

3. Giảm thao tác thủ công

Bạn không còn phải thực hiện quy trình nhàm chán: Mở Editor -> Copy README/Spec -> Paste vào Chat -> Giải thích lại lịch sử. Bạn chỉ cần gõ lệnh và bắt đầu code ngay lập tức.

Chia sẻ bộ nhớ (Memory Sharing):
Nếu team của bạn cùng sử dụng claude-mem trên một repo chung, hãy xem xét việc commit file cấu hình hoặc file memory lên Git. Điều này giúp mọi thành viên (và AI của họ) đều có chung một hiểu biết về kiến trúc dự án.

Tương lai của AI Coding Assistant

claude-mem đại diện cho xu hướng chuyển dịch từ “Smart Autocomplete” sang “Stateful AI Teammate” (Đồng đội AI có trạng thái). Trong tương lai gần, các IDE và Agent sẽ tích hợp sẵn lớp bộ nhớ dài hạn này, cho phép developer xem, sửa và xóa ký ức của AI giống như cách chúng ta debug code hiện nay.

Nếu bạn muốn trải nghiệm cảm giác làm việc với một AI thực sự “hiểu” dự án của mình qua từng ngày, claude-mem là một plugin bắt buộc phải thử.

Trang chủ: https://claude-mem.ai
GitHub Repo: https://github.com/thedotmack/claude-mem

Câu hỏi thường gặp

Q: claude-mem có làm tăng chi phí sử dụng API không?
A: Có và Không. Nó tốn một lượng token nhỏ để thực hiện bước “Compress” (nén log), nhưng lại tiết kiệm lượng token lớn hơn nhiều ở bước “Inject” (do không cần gửi lại toàn bộ lịch sử thô). Về lâu dài, đây là phương án tối ưu chi phí.

Q: Dữ liệu dự án của tôi có bị gửi đi đâu không?
A: claude-mem hoạt động cục bộ (local) và giao tiếp trực tiếp với API của Anthropic (thông qua key của bạn). Bạn nên kiểm tra mã nguồn trên GitHub để đảm bảo tuân thủ các quy định bảo mật của công ty.

Q: Tại sao không đơn giản là dùng model có context window lớn hơn (như 1 triệu token)?
A: Context window lớn giúp xử lý nhiều dữ liệu tại một thời điểm, nhưng không giải quyết được vấn đề lưu trữ theo thời gian (qua nhiều session). Ngoài ra, context càng lớn thì độ chính xác (recall) có thể giảm và chi phí/độ trễ sẽ tăng cao. claude-mem giải quyết bài toán về quản lý tri thức bền vững, không phải dung lượng tức thời.

Duy Nghiện

Hãy làm khán giả, đừng làm nhân vật chính :)