Thói quen tìm kiếm và tiêu thụ nội dung trên Internet đang thay đổi rất nhanh. Nếu trước đây traffic chủ yếu đến từ search truyền thống và SEO cho người đọc, thì giờ đây ngày càng nhiều truy cập đến từ AI crawlers và AI agents.
Cloudflare vừa giới thiệu một tính năng đáng chú ý: Markdown for Agents – tự động chuyển HTML thành Markdown ngay tại Edge khi client yêu cầu.
Bài viết này sẽ tóm lược các góc nhìn quan trọng nhất và lý do vì sao nó liên quan trực tiếp tới anh em làm AI / Automation / Content.
Vì sao chuyện này quan trọng?
1. HTML “đắt token”, Markdown “rẻ token”
Cloudflare đưa ra ví dụ rất thực tế: Cùng một nội dung, HTML có thể tốn token cao hơn rất nhiều vì đầy các lớp bọc UI như div, class, script, nav…
Ví dụ trên một blog post của họ:
- HTML: ~16,180 tokens
- Markdown: ~3,150 tokens
- => Giảm ~80% lượng token tiêu thụ.
Nói gọn: Thay vì trả tiền cho model để “đọc chrome UI”, chúng ta trả tiền cho phần nội dung có ý nghĩa thực sự.
2. Markdown là “ngôn ngữ chung” của hệ Agent
Trong pipeline AI hiện nay, bước convert HTML → Markdown gần như đã thành mặc định. Tuy nhiên, khi mỗi hệ thống tự convert sẽ phát sinh các vấn đề:
- Tốn tài nguyên tính toán (compute).
- Tốn thời gian xử lý.
- Tốn chi phí vận hành.
- Conversion có thể sai lệch so với ý đồ của tác giả.
Cloudflare giải bài toán này bằng cách đẩy việc conversion về hạ tầng Edge.
Markdown for Agents hoạt động như thế nào?
Nếu website chạy qua Cloudflare và bật tính năng này, client chỉ cần gửi header:Accept: text/markdown
Cloudflare sẽ thực hiện:
- Lấy HTML từ Origin.
- Convert sang Markdown on-the-fly.
- Trả về Markdown cho client.
Ngoài ra, hệ thống còn cung cấp thêm header hữu ích: x-markdown-tokens (ước lượng số token của bản Markdown). Điều này cực kỳ tiện lợi cho việc chunking, tính toán context budget và cost planning.
Đây là một ví dụ về lệnh curl với header Accept: text/markdown:
curl https://developers.cloudflare.com/fundamentals/reference/markdown-for-agents/ \
-H "Accept: text/markdown"Và phần nhận về sẽ có định dạng như sau:
HTTP/2 200
date: Wed, 11 Feb 2026 11:44:48 GMT
content-type: text/markdown; charset=utf-8
content-length: 2899
vary: accept
x-markdown-tokens: 725
content-signal: ai-train=yes, search=yes, ai-input=yes
---
title: Markdown for Agents · Cloudflare Agents docs
---
## What is Markdown for Agents
The ability to parse and convert HTML to Markdown has become foundational for AI.
...
Điểm hay về policy: Content Signals
Response Markdown có thể đi kèm Content-Signal để thể hiện quyền sử dụng nội dung cho AI (Train / Search / Input). Điều này quan trọng ở góc nhìn của Publisher:
- Không chỉ tối ưu kỹ thuật cho AI đọc.
- Mà còn biểu đạt rõ ý định sử dụng nội dung.
Đây là bước chuyển từ “AI crawl tự phát” sang “AI consumption có policy”.
Tác động thực tế cho các Team
Với team AI Agent
- Tiết kiệm token rõ rệt.
- Tăng tốc độ Ingest dữ liệu.
- Đơn giản hóa pipeline parse nội dung.
Với team SEO / Content
Phải bắt đầu nghĩ theo 2 lớp audience:
- Human (Người dùng): Giao diện đẹp, trải nghiệm tốt.
- Agent (AI): Cấu trúc nội dung (heading, metadata) phải chuẩn chỉnh.
Với anh em làm Workflow Automation
- Có thể thêm nhánh fetch
markdown-firsttrước khi summarize / research / rewrite. - Chủ động dùng
x-markdown-tokensđể điều hướng (route) model tùy theo độ dài nội dung.
Đây có phải chỉ là “feature nhỏ”?
Không. Đây là tín hiệu rằng web stack đang dịch chuyển sang giai đoạn: Website không chỉ render cho trình duyệt của con người, mà còn “phục vụ” trình duyệt của AI.
Từ góc độ sản phẩm, ai tối ưu cho Agent sớm sẽ có lợi thế về Discoverability (khả năng được tìm thấy) trong kỷ nguyên AI-first discovery.
Gợi ý áp dụng nhanh cho anh em
- Khi crawl bài viết: Ưu tiên nguồn Markdown nếu có để tối ưu chi phí.
- Thiết kế pipeline:
Fetch → Detect token count → Chọn model phù hợp. - Viết content: Heading rõ ràng, đoạn ngắn, sử dụng Semantic tốt.
- Với site self-hosted/CDN: Cân nhắc xây dựng lớp “agent-facing output” thay vì chỉ tập trung vào HTML cho người dùng.
Cloudflare Markdown for Agents không chỉ đơn thuần là chuyển đổi định dạng. Nó phản ánh một xu hướng lớn: AI Agent đang trở thành kênh tiêu thụ nội dung thực thụ.
Nếu trước đây chúng ta tối ưu “SEO cho người tìm”, thì giờ cần tối ưu thêm “AEO cho Agent đọc và Agent suy luận”.








