[Series AI Agent][Bài Số 10] Feedback loop: vũ khí bí mật khi dùng AI

May 07, 2026

Hai người cùng dùng ChatGPT, cùng model, cùng task. Người A ra kết quả tạm được, dùng luôn. Người B ra kết quả tốt hơn hẳn, sát ý mình. Khác biệt không nằm ở prompt đầu tiên. Mà ở chuyện xảy ra sau prompt đầu tiên.

Đa số dùng AI kiểu một chiều: hỏi, nhận, xong. Cách này ổn cho việc đơn giản. Dịch một câu, tra nghĩa một từ, tóm tắt đoạn văn ngắn.

Nhưng với việc phức tạp, kiểu một chiều bỏ phí phần mạnh nhất của AI.

Người dùng giỏi làm khác gì?

Để ý cách bạn làm việc với đồng nghiệp giỏi. Bạn giao việc, họ nộp bản nháp, bạn góp ý, họ sửa, bạn duyệt. Hiếm khi bản nháp đầu tiên là bản cuối.

Người dùng AI giỏi cũng vậy. Họ thêm một bước mà đa số bỏ qua: phản hồi.

Hỏi → Nhận → Góp ý cụ thể → AI sửa → Nhận lại → Góp ý tiếp → ...

Vòng lặp này gọi là feedback loop. Mỗi lần bạn góp ý, AI hiểu rõ hơn bạn muốn gì. Output lần sau tốt hơn lần trước.

Bạn chính là "user input" trong vòng lặp

Nếu đã đọc bài 2 về agent loop, bạn sẽ thấy quen. AI hoạt động theo vòng: nhận đầu vào → xử lý → tạo output → kiểm tra → lặp lại.

Ở đây, bạn là người kiểm tra. Bạn đọc output, đánh giá, rồi phản hồi. Phản hồi đó trở thành đầu vào mới cho vòng tiếp theo.

Nói cách khác, bạn là một phần của agent loop. Chất lượng phản hồi của bạn quyết định chất lượng output tiếp theo.

Phản hồi tệ thì vòng lặp quay vô ích. Phản hồi tốt thì mỗi vòng tiến gần hơn đến cái bạn cần.

Điều này cũng giải thích tại sao prompt "hoàn hảo" vẫn không cho output hoàn hảo mỗi lần. AI có yếu tố ngẫu nhiên. Cùng input, mỗi lần chạy cho output hơi khác. Feedback loop giúp bạn uốn nắn output về đúng hướng bất kể điểm bắt đầu.

Phản hồi tốt vs. phản hồi tệ

Đây là chỗ nhiều người sai.

Phản hồi tệ: "Viết lại đi." "Chưa được." "Làm hay hơn."

AI nhận được gì từ câu đó? Gần như không gì. "Chưa được" ở chỗ nào? "Hay hơn" là thế nào? AI không đọc được suy nghĩ của bạn. Nó đoán. Và thường đoán sai.

Giống nói với đầu bếp: "Nấu lại, chưa ngon." Mặn quá hay nhạt quá? Dai hay nát? Thiếu gia vị gì? Đầu bếp không biết.

Phản hồi tốt: "Phần 2 quá chung chung. Thêm ví dụ cụ thể về lãi suất kép. Giọng văn phần 3 quá trang trọng, chuyển sang giọng đời thường hơn."

Phản hồi này chỉ rõ: ở đâu (phần 2, phần 3), sai gì (quá chung, giọng sai), sửa thế nào (thêm ví dụ lãi kép, chuyển giọng).

Ba yếu tố: vị trí, vấn đề, hướng sửa. Đủ ba thì AI sửa chính xác.

Tại sao phản hồi cụ thể hiệu quả? Vì AI xử lý ngôn ngữ theo xác suất. "Viết lại" mở ra hàng triệu hướng khác nhau. "Phần 2, thêm ví dụ lãi kép" thu hẹp xuống còn vài hướng rõ ràng. Ít hướng để chọn thì AI chọn đúng hơn.

Ví dụ thực tế

Bạn nhờ AI viết bài giới thiệu sản phẩm.

Lần 1: AI viết bài 800 từ. Đọc xong, bạn thấy phần mở đầu hay nhưng phần tính năng đọc như brochure.

Phản hồi: "Giữ nguyên 2 đoạn mở đầu. Phần tính năng viết lại, mỗi tính năng kèm một tình huống thực tế người dùng gặp. Bỏ giọng quảng cáo."

Lần 2: AI sửa phần tính năng. Tốt hơn nhiều. Nhưng tình huống thứ 3 chưa sát với khách hàng của bạn.

Phản hồi: "Tình huống thứ 3 đổi: thay vì startup công nghệ, chuyển thành chủ tiệm cà phê muốn quản lý tồn kho."

Lần 3: Gần xong. Bạn chỉ cần chỉnh vài từ rồi dùng.

Ba vòng lặp. Mỗi vòng output tốt hơn. Nếu dừng ở lần 1, bạn có bài brochure chung chung. Thêm 2 vòng phản hồi, bạn có bài viết thật sự phù hợp.

Để ý: mỗi vòng phản hồi đều ngắn và cụ thể. Không viết lại prompt từ đầu. Chỉ chỉnh đúng chỗ cần sửa. Như sửa bản nháp vậy, bạn không xé bỏ viết lại cả bài mỗi lần thấy một đoạn chưa ổn.

Khi nào không cần feedback loop?

Không phải lúc nào cũng cần lặp đi lặp lại.

Dùng luôn lần đầu khi:

Task đơn giản, rõ ràng: "Dịch câu này sang tiếng Nhật"
Output dễ kiểm tra: đúng hoặc sai, không có "hơi đúng"
Rủi ro thấp: tin nhắn hẹn cà phê, tóm tắt nội bộ

Nên lặp 2-3 vòng khi:

Task quan trọng: proposal, báo cáo gửi khách hàng, nội dung marketing
Output có nhiều chiều: giọng văn, cấu trúc, nội dung, độ dài
Sai thì tốn kém: hợp đồng, email cho đối tác lớn

Quy tắc: output càng quan trọng, càng đáng phản hồi thêm vài vòng. Báo cáo cho sếp, bạn cũng không gửi bản nháp đầu tiên.

Mỗi vòng lặp là một cơ hội dạy AI

Feedback loop không chỉ sửa output. Nó còn "dạy" AI hiểu bạn hơn trong cuộc hội thoại đó.

Lần 1 bạn nói "bớt trang trọng". AI hiểu mức độ "bớt" của bạn. Lần 2 bạn nói "vẫn hơi cứng, thêm vài câu hài hước". AI hiểu rõ hơn giọng văn bạn muốn. Đến lần 3, AI gần như nắm được phong cách bạn cần.

Thật ra bạn đang xây dựng "context ngầm". Mỗi phản hồi thêm một lớp thông tin mà prompt ban đầu chưa có. AI hiểu ý bạn chính xác hơn, không phải vì nó "học" được, mà vì bạn đã cung cấp đủ thông tin qua từng vòng.

Đó là lý do feedback loop hiệu quả hơn viết một prompt dài cố gắng nghĩ trước mọi thứ. Bạn không cần đoán trước tất cả. Chỉ cần biết phản hồi đúng chỗ.

Feedback loop là kỹ năng, không phải bản năng

Phản hồi cụ thể không tự nhiên mà có. Đa số chúng ta quen nói "được" hoặc "chưa được". Nhưng AI cần hơn thế.

Tin vui: kỹ năng này luyện được. Lần sau dùng AI, thay vì "viết lại đi", thử trả lời 3 câu:

1. Chỗ nào chưa ổn? (vị trí)

2. Sai ở điểm gì? (vấn đề)

3. Muốn nó thế nào? (hướng sửa)

Trả lời được 3 câu đó, bạn đã có phản hồi tốt.

AI là cộng tác viên, không phải cỗ máy "bấm nút ra hàng". Cộng tác viên cần phản hồi rõ để làm đúng ý bạn. Phản hồi mơ hồ thì cộng tác viên giỏi mấy cũng đoán mò. Phản hồi cụ thể thì mỗi vòng lặp đều tiến gần hơn đến kết quả bạn thật sự cần.

---

Discussion about this post

Ready for more?