BIẾT A.I CHƯA?N8N

Hướng dẫn xây dựng RAG agent chính xác chỉ trong vài phút với Pinecone Assistant

Trong thế giới AI, việc xây dựng các RAG (Retrieval-Augmented Generation) agent có khả năng truy xuất thông tin từ một cơ sở kiến thức riêng (như tài liệu PDF, văn bản nội bộ) là một nhu cầu vô cùng phổ biến. Tuy nhiên, nếu bạn đã từng thử sức, bạn sẽ biết quy trình này không hề đơn giản. Nó đòi hỏi nhiều bước kỹ thuật phức tạp, từ tiền xử lý dữ liệu, phân mảnh (chunking), nhúng (embedding) cho đến việc gắn thẻ siêu dữ liệu (metadata tagging) để đảm bảo kết quả trả về chính xác và có thể kiểm chứng.

Thử thách lớn nhất thường nằm ở việc làm sao để agent không chỉ đưa ra câu trả lời, mà còn trích dẫn chính xác nguồn gốc thông tin: tài liệu nào, trang số mấy, thậm chí là đoạn văn bản gốc. Việc này vô cùng quan trọng để chúng ta có thể tin tưởng vào kết quả mà AI cung cấp.

Và gần đây, mình đã tìm ra một giải pháp đột phá giúp đơn giản hóa toàn bộ quy trình này một cách đáng kinh ngạc: Pinecone Assistant. Dựa trên workflow n8n đi kèm, đây là cách dễ dàng và nhanh nhất để xây dựng một RAG agent mạnh mẽ, chính xác mà gần như không cần viết một dòng code nào.

Trong bài viết này, mình sẽ chia sẻ từng bước chi tiết để bạn có thể tự mình xây dựng một RAG agent tương tự chỉ trong vài phút.

Download workflow n8n: https://romhub.io/n8n/Pinecone_Assistant
Chia sẻ bởi Nate Herk

Pinecone Assistant: giải pháp đột phá cho RAG agent no-code

Trước khi đi vào hướng dẫn kỹ thuật, chúng ta cần hiểu tại sao Pinecone Assistant lại là một yếu tố thay đổi cuộc chơi.

Về cơ bản, Pinecone là một vector store (cơ sở dữ liệu vector) nổi tiếng. Tuy nhiên, họ đã phát triển một tính năng cao cấp hơn gọi là “Assistants”. Thay vì bắt bạn phải tự quản lý toàn bộ quy trình phức tạp như chunking, embedding và indexing, Pinecone Assistant sẽ xử lý tất cả những công việc đó ở phía sau (backend).

Nhiệm vụ của bạn chỉ đơn giản là:

  1. Tạo một Assistant.
  2. Tải lên các tài liệu (files) mà bạn muốn agent học.

Chỉ với hai bước đó, bạn đã có một cơ sở kiến thức sẵn sàng để truy vấn. Toàn bộ gánh nặng kỹ thuật đã được Pinecone gánh vác, giúp bạn tập trung vào việc xây dựng logic cho agent của mình.

Để bắt đầu, bạn chỉ cần đăng nhập vào tài khoản Pinecone, tìm đến mục Assistants và tạo một assistant mới. Giao diện rất trực quan, cho phép bạn kéo thả các file tài liệu của mình vào. Trong ví dụ của workflow, cơ sở kiến thức này được xây dựng từ ba báo cáo tài chính dạng PDF của Tesla, Nike và Nvidia.

Sau khi tải file lên, bạn thậm chí có thể trò chuyện thử ngay trong giao diện playground của Pinecone để kiểm tra xem assistant đã “hiểu” tài liệu của bạn hay chưa. Sức mạnh thực sự của nó sẽ được khai thác khi chúng ta kết nối với assistant này thông qua API.

Hướng dẫn chi tiết tích hợp Pinecone Assistant vào agent của bạn

Bây giờ, chúng ta sẽ đi vào phần chính: kết nối Pinecone Assistant với một AI agent trên nền tảng tự động hóa n8n, dựa theo workflow đã cung cấp.

Bước 1: Chuẩn bị AI agent và công cụ HTTP request

Trong workflow n8n, một AI Agent đã được thiết lập. Agent này bao gồm:

  • Bộ não: Một mô hình ngôn ngữ lớn được kết nối qua OpenRouter, cho phép linh hoạt lựa chọn các mô hình như GPT-4, Claude, v.v.
  • Công cụ (Tools): Các khả năng mà agent có thể sử dụng.

Vì không có node tích hợp sẵn cho Pinecone Assistant, chúng ta sẽ sử dụng công cụ linh hoạt nhất: HTTP Request Tool. Công cụ này cho phép agent gửi yêu cầu API đến bất kỳ dịch vụ nào, trong trường hợp này là Pinecone Assistant.

Bước 2: Cấu hình API call từ Pinecone

Đây là bước cực kỳ thông minh và tiết kiệm thời gian. Thay vì phải đọc tài liệu API và tự xây dựng yêu cầu từ đầu, Pinecone cung cấp sẵn một đoạn mã cURL để bạn sao chép.

  1. Trong giao diện Pinecone Assistant của bạn, tìm đến mục Connect hoặc API.
  2. Trong phần “Chat with your assistant”, bạn sẽ thấy một đoạn mã cURL mẫu.
  3. Sao chép đoạn mã này.
  4. Quay lại node HTTP Request Tool trong n8n, tìm chức năng “Import cURL” và dán đoạn mã vừa sao chép vào.

Hệ thống sẽ tự động điền tất cả các thông tin cần thiết như URL, phương thức (POST), headers, và body của yêu cầu. Việc duy nhất bạn cần làm là kết nối API key của mình (workflow sử dụng biến $PINECONE_API_KEY).

Bước 3: Biến truy vấn thành động (dynamic query)

Sau khi nhập cURL, bạn sẽ thấy trong phần body của request có một câu hỏi mẫu. Nếu để nguyên, agent sẽ luôn gửi đúng một câu hỏi này. Chúng ta cần làm cho nó trở nên “động”, tức là agent sẽ tự quyết định câu hỏi cần gửi dựa trên yêu cầu của người dùng.

Để làm điều này, workflow đã thay thế chuỗi văn bản tĩnh bằng một biểu thức (expression). Cụ thể, trong trường content, giá trị được đặt là:

"content": "{{ $fromAI("searchQuery") }}"

Với cú pháp này, AI agent sẽ tự phân tích yêu cầu của người dùng, tạo ra một tham số tên là searchQuery, và giá trị của tham số đó sẽ được điền vào đây để gửi đến công cụ Pinecone.

Bước 4: Tinh chỉnh hành vi của agent với system prompt

Bây giờ agent của bạn đã có thể kết nối và truy vấn kiến thức từ Pinecone. Tuy nhiên, nó chưa biết phải trình bày câu trả lời như thế nào. Đây là lúc System Prompt của node “Pinecone Assistant” Agent phát huy tác dụng.

System Prompt là những chỉ dẫn nền tảng, định hình hành vi của agent. Workflow đã cấu hình sẵn một prompt rất rõ ràng:

You are an AI agent specialized in analyzing earnings report data.

Use your Pinecone tool to search through earnings reports from Tesla, Nike, and Nvidia.

When answering the user's question, always cite your sources as far as: what document you got it from, what page it was from, what section, and an exact text based quote from the original source

Khi có chỉ dẫn này, agent sẽ hiểu rằng thông tin về nguồn (mà Pinecone trả về qua API) không phải là để giữ cho riêng mình, mà phải trình bày rõ ràng cho người dùng.

Bí quyết “vàng”: lấy trích dẫn chính xác tuyệt đối từ tài liệu gốc

Đây là một chi tiết rất quan trọng và việc khắc phục nó chính là chìa khóa để đạt được độ tin cậy tuyệt đối. Sau khi xem xét tài liệu API của Pinecone, giải pháp đã được tích hợp sẵn vào workflow.

Chúng ta chỉ cần thêm một tham số vào body của yêu cầu HTTP:

"include_highlights": true

Tham số nhỏ này yêu cầu Pinecone Assistant trả về không chỉ câu trả lời tóm tắt mà còn cả các đoạn văn bản gốc chính xác nơi nó tìm thấy thông tin. Node HTTP Request trong workflow đã được cấu hình với tham số này, đảm bảo rằng agent sẽ luôn nhận được trích dẫn nguyên văn, khớp 100% với tài liệu gốc.

So sánh hiệu quả: Pinecone Assistant và Vector store truyền thống

Để chứng minh sự vượt trội của phương pháp này, workflow n8n được cung cấp đã xây dựng sẵn một kịch bản so sánh trực tiếp. Workflow này không chỉ chứa agent dùng Pinecone Assistant mà còn có hai agent khác:

  1. Một agent sử dụng Pinecone Vector Store (theo phương pháp truyền thống, tự quản lý chunking/embedding).
  2. Một agent sử dụng Supabase Vector Store (một lựa chọn phổ biến khác).

Cả ba agent này đều có cùng một system prompt và cùng truy cập vào bộ ba tài liệu PDF đã nói ở trên. Khi bạn đặt cùng một câu hỏi cho cả ba, bạn có thể dễ dàng so sánh kết quả.

Thực tế thử nghiệm cho thấy:

  • Pinecone Assistant: Thường trả lời chính xác, cung cấp tên tài liệu, số trang và trích dẫn nguyên văn.
  • Pinecone & Supabase Vector Store (truyền thống): Thường gặp khó khăn hơn trong việc tìm ra câu trả lời chính xác cho các câu hỏi chi tiết, đôi khi đưa ra thông tin chung chung và tiêu tốn nhiều token hơn.

Rõ ràng, Pinecone Assistant không chỉ dễ cài đặt hơn rất nhiều mà còn cho ra kết quả chính xác và hiệu quả hơn đáng kể.


Việc xây dựng RAG agent không còn là một nhiệm vụ đáng sợ dành riêng cho các kỹ sư lập trình. Với sự ra đời của các công cụ như Pinecone Assistant và các nền tảng no-code như n8n, bất kỳ ai cũng có thể nhanh chóng tạo ra các AI agent mạnh mẽ, có khả năng truy vấn kiến thức từ tài liệu riêng một cách chính xác và đáng tin cậy.

Bằng cách loại bỏ các bước kỹ thuật phức tạp ở backend và cung cấp một API đơn giản nhưng mạnh mẽ, Pinecone Assistant đã thực sự mở ra một cánh cửa mới cho việc phát triển các ứng dụng AI thực tiễn. Workflow n8n đính kèm là một minh chứng hoàn hảo và là một điểm khởi đầu tuyệt vời để bạn tự mình trải nghiệm sức mạnh này.

Duy Nghiện
Hãy làm khán giả, đừng làm nhân vật chính :)

You may also like

Nhận thông báo qua email
Nhận thông báo cho
guest

0 Bình luận
Mới nhất
Cũ nhất Nhiều like nhất
Phản hồi nội tuyến
Xem tất cả bình luận