AI & AUTOMATION

BrowserOS – Trình duyệt agentic mã nguồn mở thay thế ChatGPT Atlas, Perplexity Comet

Tóm tắt nhanh:

  • BrowserOS là một trình duyệt AI xây dựng trên nhân Chromium, cho phép bạn điều khiển web bằng ngôn ngữ tự nhiên và chạy tác vụ tự động ngay trên máy tính mà không phụ thuộc đám mây.
  • Bạn có thể tải BrowserOS cho Windows, macOS hoặc Linux, nhập dữ liệu từ Chrome, kết nối API khóa của Claude, OpenAI, Gemini hoặc mô hình cục bộ, và sử dụng trình trợ lý để trò chuyện, tự động điền biểu mẫu, trích xuất dữ liệu hoặc lên lịch tác vụ.
  • Trình duyệt này sử dụng uBlock Origin với hỗ trợ Manifest V2 để chặn quảng cáo mạnh mẽ hơn Chrome , tích hợp sẵn 31 công cụ để mở tab, thao tác, chụp ảnh và tìm kiếm lịch sử , hỗ trợ quy trình tự động bằng Workflows  và Scheduled Tasks , cung cấp quyền truy cập hệ thống tệp có kiểm soát  và giúp bạn kết nối với Gmail, Calendar, Slack, Notion thông qua giao thức MCP.
  • Đây là giải pháp mã nguồn mở, ưu tiên quyền riêng tư, và là đối thủ đáng gờm của các trình duyệt AI như ChatGPT Atlas, Perplexity Comet hay Dia.

BrowserOS là gì?

BrowserOS là một trình duyệt AI mã nguồn mở dựa trên Chromium do nhóm BrowserOS‑ai phát triển. Trên trang chủ dự án, BrowserOS được mô tả là “trình duyệt agentic mở nguồn” giúp biến lời mô tả của bạn thành hành động – từ việc bấm chuột, gõ phím đến điều hướng trang. Bạn chỉ cần mô tả tác vụ bằng tiếng Việt/tiếng Anh, BrowserOS sẽ thực hiện toàn bộ thao tác trong trình duyệt, như điền đơn hàng, trích xuất bảng giá hay tìm kiếm thông tin.

Khác với Chrome hay Safari, BrowserOS tích hợp sẵn AI ở cấp độ trình duyệt. Người dùng có thể gọi trợ lý ở thanh công cụ để hỏi, tóm tắt trang, so sánh câu trả lời giữa các mô hình hoặc tạo chuỗi hành động tự động. Sản phẩm được phát hành dưới giấy phép AGPL‑3.0 và hoàn toàn miễn phí; bạn chỉ trả phí khi dùng API của các nhà cung cấp AI như OpenAI hoặc Anthropic.

Vì sao BrowserOS khác biệt

Trên GitHub, nhóm phát triển lý giải vì sao BrowserOS khác với các trình duyệt phổ biến:

  • So với Chrome: Chrome dựa trên Chromium nhưng không phát triển các tính năng AI hay công cụ tự động hóa; BrowserOS thêm AI, hỗ trợ giao thức MCP và luôn tôn trọng quyền riêng tư .
  • So với Brave: Brave tập trung vào crypto, tìm kiếm và VPN; BrowserOS tập trung duy nhất vào duyệt web và tự động hóa thông qua AI .
  • So với Arc/Dia: Arc là phần mềm đóng và từng khiến người dùng mất dữ liệu khi ngừng hỗ trợ. BrowserOS hoàn toàn mã nguồn mở, có thể fork và phát triển tiếp bất kỳ lúc nào .
  • So với Perplexity Comet và ChatGPT Atlas: các trình duyệt này thuộc công ty quảng cáo hoặc tìm kiếm; dữ liệu duyệt web của bạn có thể bị sử dụng để nhắm quảng cáo hoặc huấn luyện mô hình. BrowserOS chạy tác vụ và lưu lịch sử cục bộ nên tránh rò rỉ .

Nhờ những khác biệt này, BrowserOS là giải pháp lý tưởng cho người dùng coi trọng quyền riêng tư, muốn tự động hóa công việc nhưng không muốn chia sẻ dữ liệu với các nền tảng đám mây.

Tính năng nổi bật

Giao diện quen thuộc và cài đặt nhanh

BrowserOS vẫn sử dụng giao diện Chromium nên cảm giác sử dụng giống Chrome, đồng thời cho phép cài đặt các tiện ích Chrome như uBlock Origin để chặn quảng cáo. Theo tài liệu, uBlock Origin được hỗ trợ đầy đủ nhờ BrowserOS kích hoạt lại Manifest V2 – điều mà Chrome đang loại bỏ – giúp trình duyệt chặn tới 68 % yêu cầu quảng cáo so với 7 % của Chrome .

Phần “Quick start” trong README hướng dẫn ba bước đơn giản: (1) tải và cài BrowserOS cho macOS, Windows hoặc Linux; (2) nhập dữ liệu từ Chrome; (3) kết nối với nhà cung cấp AI bạn muốn sử dụng. Bạn có thể mang toàn bộ dấu trang, mật khẩu và lịch sử vào BrowserOS chỉ bằng vài cú nhấp chuột .

AI Agent chạy cục bộ và bảo mật

BrowserOS cho phép chạy AI agent ngay trên máy tính thay vì phụ thuộc server của hãng khác. README nhấn mạnh rằng các agent “chạy trên trình duyệt của bạn chứ không nằm trên đám mây”. Bạn có thể sử dụng khóa API của mình cho Claude, OpenAI hay Gemini và cũng có thể dùng mô hình cục bộ qua Ollama hoặc LM Studio. Tính năng này giúp dữ liệu duyệt web và lịch sử tương tác AI vẫn nằm trên máy cá nhân .

31 công cụ điều khiển trình duyệt

Khi sử dụng BrowserOS với các khách hàng MCP như Claude Code hoặc Gemini CLI, bạn có thể điều khiển trình duyệt bằng 31 công cụ: mở/đóng tab, điều hướng, cuộn trang, click, gõ, chụp ảnh, liệt kê lịch sử, đánh dấu trang… Điều này biến BrowserOS thành nền tảng tự động hóa linh hoạt, giúp bạn viết tác vụ phức tạp hoặc tích hợp vào quy trình CI/CD.

Workflows – xây dựng quy trình tự động

Workflows là trình xây dựng kịch bản tự động dạng đồ họa. Bạn mô tả tác vụ (ví dụ: “lấy danh sách liên hệ từ Google Sheet và điền vào mẫu web”), BrowserOS sẽ tạo một biểu đồ hiển thị từng bước, cho phép bạn chỉnh sửa, thêm điều kiện hoặc chạy song song. Tài liệu khuyến nghị dùng Workflows khi (1) yêu cầu độ ổn định cao; (2) tác vụ bao gồm nhiều trang hoặc vòng lặp; (3) bạn sẽ lặp lại nhiều lần. Người dùng có thể kiểm thử, lưu và chạy Workflow bất kỳ lúc nào .

Scheduled Tasks – tác vụ định kỳ

Scheduled Tasks giúp tự động chạy agent vào khung giờ bạn định sẵn. Bạn chỉ cần vào Settings → Scheduled Tasks, đặt tên nhiệm vụ, mô tả và lịch (hàng ngày, mỗi vài giờ hoặc phút) rồi lưu lại. Khi đến giờ, BrowserOS sẽ chạy tác vụ trong nền mà không làm gián đoạn công việc của bạn. Bạn có thể xem kết quả tại trang Tab mới hoặc trong phần Scheduled Tasks. Các ví dụ gợi ý gồm tóm tắt lịch họp buổi sáng , tự động chấp nhận yêu cầu kết nối LinkedIn hay theo dõi giá sản phẩm trên Amazon .

Filesystem Access – quyền truy cập hệ thống tệp

Tính năng Filesystem Access cho phép BrowserOS đọc, ghi và thực thi lệnh trong một thư mục do bạn chỉ định. Agent có thể tải dữ liệu, lưu báo cáo dạng HTML/Markdown và chạy lệnh shell trong thư mục đó. Người dùng chọn thư mục thông qua hộp thoại, cấp quyền rồi bắt đầu sử dụng. Ví dụ, bạn có thể yêu cầu BrowserOS đọc top 3 bài Hacker News, tổng hợp bình luận rồi tạo file HTML , hoặc sắp xếp thư mục Downloads theo loại tệp. Truy cập bị giới hạn trong thư mục bạn chọn và có thể tắt bất kỳ lúc nào .

Chat Mode và LLM Hub

BrowserOS tích hợp sẵn cửa sổ trò chuyện với AI. Bạn có thể nhấn nút Chat hoặc phím tắt Option+K để mở panel trên bất kỳ trang nào. Panel hỗ trợ: (1) chuyển đổi nhanh giữa Claude, ChatGPT và Gemini ; (2) sao chép nội dung trang vào prompt; (3) chụp ảnh trang và đính kèm câu hỏi; (4) giữ nguyên khi bạn chuyển tab. Bạn cũng có thể mở LLM Hub bằng Cmd+Shift+U để so sánh câu trả lời song song của nhiều mô hình trong ba ô .

Kết nối ứng dụng qua MCP

BrowserOS hỗ trợ kết nối với nhiều ứng dụng thông qua Model Context Protocol (MCP) – một tiêu chuẩn mở giúp AI kết nối với Gmail, Calendar, Docs, Slack, Notion… Để thêm ứng dụng, bạn vào Settings → Connected Apps, chọn ứng dụng tích hợp sẵn và xác thực. Sau đó bạn có thể nhờ trợ lý kiểm tra lịch hôm nay, soạn email, đăng lên Slack hay tạo trang Notion. BrowserOS cũng cho phép thêm MCP server tùy chỉnh bằng cách cung cấp URL SSE; bạn có thể tự tích hợp Jira, GitHub hoặc API riêng .

Tích hợp n8n

n8n là công cụ xây dựng workflow dạng node. Tài liệu của BrowserOS hướng dẫn cách cài gói n8n-nodes-mcp, tạo workflow gồm Chat Trigger, AI Agent, Chat ModelMCP Client, cấu hình endpoint bằng URL MCP của BrowserOS và chạy thử lệnh “open google.com in BrowserOS”. Với n8n, bạn có thể tự xây dựng các quy trình lead enrichment, giám sát giá sản phẩm, tự động điền form hay trích xuất dữ liệu từ trang đăng nhập .

Hướng dẫn cài đặt BrowserOS

Việc cài đặt BrowserOS rất đơn giản và chỉ mất vài phút. Dưới đây là hướng dẫn chi tiết:

  1. Tải trình cài đặt – Từ trang GitHub hoặc trang chính BrowserOS, chọn phiên bản tương ứng với hệ điều hành của bạn (macOS, Windows hoặc Linux). Tải file cài đặt ứng với OS của bạn:
  2. Cài đặt – Chạy file cài đặt vừa tải và làm theo hướng dẫn.
  3. Nhập dữ liệu từ Chrome (tùy chọn) – Nếu đang dùng Chrome, bạn có thể nhập dấu trang, mật khẩu và lịch sử bằng cách truy cập chrome://settings/importData trong BrowserOS, chọn “Google Chrome” và nhấp Import. Trình duyệt sẽ xin quyền “Always allow”; hãy chấp thuận để hoàn tất.
  4. Kết nối AI – BrowserOS đi kèm mô hình mặc định với hạn chế về số lượt sử dụng. Để có trải nghiệm tốt, bạn nên thêm API key. Vào chrome://browseros/settings và chọn nhà cung cấp như Gemini, Claude, OpenAI hoặc OpenRouter. Mỗi thẻ trong phần cài đặt sẽ yêu cầu Model ID, API Key, tùy chọn hỗ trợ ảnh và kích thước context. Ví dụ, với Gemini bạn đặt Model ID gemini-2.5-flash-preview-05-20, dán API key và chọn context 1 000 000 token; với Claude Opus 4.5 bạn đặt context 200 000 token .
  5. Kích hoạt model local (tùy chọn) – Nếu muốn chạy AI hoàn toàn offline, hãy cài Ollama hoặc LM Studio, kéo mô hình phù hợp rồi định cấu hình trong BrowserOS. Tài liệu hướng dẫn đặt biến môi trường OLLAMA_CONTEXT_LENGTH=20000 khi khởi động Ollama , sau đó chọn thẻ “Ollama” trong cài đặt BrowserOS và điền Model ID, Context Window. Bạn cũng có thể dùng LM Studio bằng cách chọn thẻ “OpenAI Compatible” và nhập Base URL http://localhost:1234/v1/ cùng model ID .
  6. Bắt đầu sử dụng – Mở bất kỳ trang web nào, nhấn nút Assistant ở thanh công cụ để khởi động Chat Mode hoặc Agent Mode. Bạn có thể đặt câu hỏi, yêu cầu tóm tắt trang hoặc mô tả tác vụ để agent thực hiện .

Hướng dẫn sử dụng cơ bản

Sau khi cài đặt, hãy thử các tính năng chính của BrowserOS:

  • Trò chuyện và hỏi đáp: Nhấn biểu tượng Chat để mở cửa sổ trò chuyện, chuyển đổi nhanh giữa các mô hình AI và tận dụng tính năng copy nội dung trang hoặc chụp ảnh. Nếu muốn so sánh câu trả lời, mở LLM Hub và chọn 2-3 mô hình song song.
  • Tạo agent tự động: Trong Agent Mode, bạn mô tả mục tiêu; ví dụ: “mua vé máy bay đến Hà Nội vào ngày 15 tháng 4” hoặc “tải danh sách sản phẩm và lưu vào bảng”. Agent sẽ tự click, điền và điều hướng để hoàn thành nhiệm vụ. Đối với tác vụ phức tạp và cần lặp lại, hãy tạo Workflows qua sidebar, mô tả yêu cầu và kiểm thử trước khi lưu.
  • Lên lịch tác vụ: Vào Settings → Scheduled Tasks để đặt lệnh tự động chạy định kỳ như kiểm tra giá sản phẩm, thu thập lịch họp mỗi sáng hoặc tự động gửi báo cáo. BrowserOS cần mở khi tới giờ; nếu máy tắt, nhiệm vụ sẽ chạy ngay khi bạn mở lại.
  • Quản lý tệp: Bật Filesystem Access bằng cách chọn thư mục bạn muốn cấp quyền. Sau đó, bạn có thể yêu cầu agent đọc file, viết báo cáo hoặc chạy lệnh shell trong thư mục đó .
  • Kết nối ứng dụng: Thêm Gmail, Calendar, Slack hoặc Notion trong phần Connected Apps để trợ lý có thể gửi email, đặt lịch, đăng tin nhắn hoặc cập nhật cơ sở dữ liệu. Câu lệnh tự nhiên như “tạo cuộc họp với Duy lúc 3 giờ chiều mai” hoặc “soạn email cảm ơn nhóm” sẽ được agent thực hiện thông qua API của ứng dụng.
  • Tự động với n8n: Nếu bạn muốn tích hợp BrowserOS vào quy trình tự động hóa lớn hơn, hãy sử dụng n8n. Cài đặt node MCP, tạo workflow với Chat Trigger, AI Agent, Chat Model và MCP Client, cấu hình endpoint BrowserOS và thử câu lệnh.

So sánh với các giải pháp khác

Trình duyệtMã nguồnAI tích hợpQuyền riêng tưTự động hóaGhi chú
BrowserOSMã nguồn mở (AGPL)Có – Chat, Agent, WorkflowsDữ liệu lịch sử và tương tác AI lưu cục bộCó 31 công cụ điều khiển và hỗ trợ MCPHỗ trợ mô hình cục bộ và cloud, chặn quảng cáo mạnh mẽ
ChatGPT AtlasĐóngGửi dữ liệu duyệt web cho bên thứ baCó nhưng phụ thuộc cloudĐược OpenAI phát triển – người dùng lo ngại về quyền riêng tư
Perplexity CometĐóngCó – tập trung vào tìm kiếmDữ liệu có thể dùng cho quảng cáoTự động hóa hạn chếLà sản phẩm của công ty quảng cáo
Dia/ArcĐóngKhông rõHỗ trợ AI nhưng Arc từng ngừng hỗ trợ người dùngTập trung vào trải nghiệm người dùng
Chrome/BraveMã nguồn mở/đóngKhông/ítKhông tập trungKhông/ítChrome không có tính năng AI, Brave tập trung vào crypto

BrowserOS mang đến tầm nhìn mới cho trình duyệt trong kỷ nguyên AI: mở nguồn, tôn trọng quyền riêng tư và chạy tác vụ agentic cục bộ. Với khả năng tích hợp nhiều mô hình AI, import dữ liệu từ Chrome, hỗ trợ uBlock Origin và các workflow tự động, BrowserOS là lựa chọn hấp dẫn cho người dùng cá nhân, nhà nghiên cứu hoặc doanh nghiệp muốn tiết kiệm thời gian và kiểm soát dữ liệu.

Nếu bạn đang tìm kiếm giải pháp thay thế cho ChatGPT Atlas, Perplexity Comet hay các trình duyệt truyền thống, hãy thử BrowserOS. Bạn có thể tải miễn phí, tùy chỉnh theo nhu cầu và tham gia cộng đồng mã nguồn mở để đóng góp ý tưởng. Tương lai của duyệt web có thể nằm ở những agent thông minh hoạt động trên chính máy tính của bạn, và BrowserOS chính là minh chứng rõ ràng cho điều đó.

Duy Nghiện
Hãy làm khán giả, đừng làm nhân vật chính :)

You may also like

Nhận thông báo qua email
Nhận thông báo cho
guest

0 Bình luận
Mới nhất
Cũ nhất Nhiều like nhất
Phản hồi nội tuyến
Xem tất cả bình luận