[Series AI Agent][Bài Số 04] Tại sao AI hay quên? Bí mật về context window

May 01, 2026

Bạn đang nhờ ChatGPT viết email quan trọng. 20 phút trước, bạn dặn rõ: "Giọng formal, gửi sếp Hùng, về dự án Q3." Giờ nó viết xong, giọng thân mật như nhắn tin bạn bè. Bạn nhắc lại. Nó xin lỗi, sửa. Được 3 lượt nữa, nó lại quên sếp Hùng là ai.

Quen không? Hầu hết mọi người đổ lỗi: AI ngu, AI lười, AI không chú ý. Thật ra không phải. Có lý do kỹ thuật rất cụ thể giải thích chuyện này. Và khi hiểu lý do đó, bạn sẽ biết cách phòng tránh.

AI không nhớ. AI đọc lại.

Nhiều người nghĩ AI nhớ cuộc trò chuyện giống mình nhớ. Sai hoàn toàn.

Mỗi lần bạn gửi tin nhắn, AI đọc lại toàn bộ cuộc hội thoại từ đầu đến cuối. Rồi mới trả lời. Giống bạn mở một email thread dài, cuộn từ trên xuống, đọc hết rồi mới reply. Mỗi lần reply đều đọc lại từ đầu.

Nghe vất vả? Đúng vậy. Nhưng đây là cách duy nhất AI "nhớ" được bạn nói gì.

Và cái giá là: tắt cửa sổ chat, AI quên sạch. Không có gì lưu lại trong "đầu" nó cả. Cuộc trò chuyện hôm qua với AI hôm nay? Hai người hoàn toàn xa lạ. Bạn mở tab mới, gõ "tiếp tục giúp tôi cái hôm qua", AI không hiểu bạn đang nói gì.

Thử nghĩ xem. Bạn có người đồng nghiệp siêu giỏi, trả lời gì cũng nhanh. Nhưng mỗi sáng đi làm, người này quên sạch mọi thứ hôm qua. Muốn tiếp tục, bạn phải kể lại từ đầu. Đó là AI.

Một số app như ChatGPT có tính năng "Memory", ghi nhớ vài thông tin giữa các cuộc chat. Nhưng đó là tính năng app thêm vào, không phải AI tự nhớ. Giống như bạn viết sticky note dán lên màn hình cho đồng nghiệp hay quên. Ghi được vài dòng thôi, không thể thay thế trí nhớ thật.

Bàn làm việc có giới hạn

Vậy tại sao chat dài thì AI "ngu dần"? Câu trả lời nằm ở một khái niệm tên context window.

Hãy hình dung context window là một cái bàn làm việc. Mỗi tin nhắn bạn gửi, mỗi câu AI trả lời, mỗi file bạn paste vào, đều là giấy tờ đặt lên bàn. Bàn này có kích thước cố định, không co giãn được.

Mỗi AI có bàn to khác nhau:

ChatGPT: khoảng 200 trang A4
Claude: khoảng 300 trang A4
Gemini: khoảng 1.500 trang A4

Con số này thay đổi theo phiên bản. Xu hướng chung là bàn ngày càng to hơn. Nhưng dù to bao nhiêu, nó vẫn có giới hạn. Và cách bạn dùng bàn quan trọng hơn kích thước bàn.

Nghe nhiều? Nhưng tốn nhanh hơn bạn tưởng.

Mỗi tin nhắn bạn gửi chiếm chỗ. Mỗi câu AI trả lời cũng chiếm chỗ, thường gấp 3-4 lần tin bạn gửi vì AI hay viết dài. Chat 30 phút, tầm 20 lượt qua lại, dễ ngốn 30-50% bàn. Paste thêm vài file code hay tài liệu dài, bàn đầy quá nửa. Có người paste cả trang web vào, bàn gần đầy ngay lượt thứ 2.

Để ý: bạn không chỉ "nói chuyện" với AI. Bạn đang xếp giấy tờ lên bàn. Mỗi lượt chat là thêm một chồng giấy. Và bàn thì không tự mở rộng.

Khi bàn còn trống, AI đọc mọi thứ rõ ràng. Khi bàn chật, rắc rối bắt đầu.

Đầy bàn thì phải dọn

Khi context window gần đầy, hệ thống tự dọn bàn. Nó nén những tin nhắn cũ lại, giữ tin nhắn mới nguyên vẹn.

Hình dung thế này: bàn đầy, bạn lấy mấy tờ giấy cũ nhất. Viết tóm tắt lên 1 tờ nhỏ, vứt mấy tờ gốc đi. Được thêm chỗ trống. Nhưng chi tiết trong tờ gốc thì mất.

Đây là lý do cái bạn dặn ở đầu cuộc chat hay bị quên trước. Tin nhắn thứ 2, thứ 3 của bạn nằm ở vùng cũ nhất. Khi hệ thống nén, chúng bị nén trước tiên. Cái dặn "giọng formal, gửi sếp Hùng" ở đầu cuộc chat? Nén mất rồi. AI chỉ còn thấy bản tóm tắt mờ nhạt.

Cho nên chat càng dài, AI càng "quên" những gì bạn nói ở đầu. Không phải nó phớt lờ. Nó thật sự không còn thấy rõ nữa.

Và bạn không nhận ra chuyện này đang xảy ra. Không có cảnh báo "context sắp đầy". Không có đèn đỏ nháy. AI vẫn trả lời bình thường, chỉ là câu trả lời mỗi lúc một kém đi. Giống chiếc xe hết xăng dần: vẫn chạy, nhưng chậm lại, rồi tắt máy giữa đường.

Nhớ đầu, nhớ cuối, quên giữa

Có một hiện tượng nữa khiến AI "quên" theo cách khó chịu hơn. Giới nghiên cứu gọi là "Lost in the Middle" (lạc ở giữa).

Dễ hiểu thôi. Bạn paste cho AI 50 trang tài liệu. AI không đọc đều 50 trang đó. Nó chú ý nhiều nhất vào phần đầu và phần cuối. Phần giữa? Lướt qua, dễ bỏ sót.

Giống bạn đọc một cuốn sách dày. Chương đầu nhớ rõ vì hào hứng. Chương cuối nhớ vì vừa đọc xong. Mấy chương giữa thì... mơ hồ.

AI cũng y vậy, chỉ khác là nó xử lý bằng toán thay vì cảm xúc. Nhưng kết quả giống nhau: thông tin ở giữa context window hay bị bỏ qua.

Biết điều này thì bạn có thể dùng ngay: đặt thông tin quan trọng ở đầu hoặc cuối tin nhắn. Đừng chôn nó ở giữa một đoạn dài.

Ví dụ cụ thể: bạn paste 20 trang tài liệu rồi viết "tóm tắt giúp tôi." Câu yêu cầu nằm ở cuối, tốt. Nhưng nếu trong 20 trang đó, thông tin then chốt nằm ở trang 10, AI rất có thể bỏ qua. Muốn chắc, hãy nói rõ: "Chú ý đặc biệt phần X ở trang 10." Kéo thông tin quan trọng ra khỏi vùng "giữa", đặt vào chỗ AI nhìn rõ nhất.

Vậy nên làm gì?

Quay lại chuyện sếp Hùng. Bạn dặn ở tin nhắn thứ 2. Chat thêm 20 lượt. Yêu cầu đó nằm ở vùng cũ nhất, dễ bị nén nhất. Lại nằm ở "giữa" context window, dễ bị bỏ sót nhất. Quên là đương nhiên.

Lần tới AI "quên", đừng vội bực. Kiểm tra trước: cuộc chat đã dài bao nhiêu? Bàn đầy chưa? Hơn 15-20 lượt rồi thì có lẽ đã đến lúc dọn bàn.

Cách dọn cụ thể thế nào? Bài tiếp theo sẽ chia sẻ 3 kỹ thuật đơn giản mà ai cũng làm được.

Nhưng chỉ cần hiểu một điều hôm nay: AI không quên vì nó kém. Nó quên vì bàn làm việc hết chỗ. Và khi bạn biết bàn to bao nhiêu, bạn bắt đầu biết cách sắp xếp.

Sếp Hùng vẫn đang chờ email. Lần này, bạn biết cách giữ cho AI không quên ông ấy.

---

Discussion about this post

Ready for more?