AI thật sự và Công việc thật sự
Cuộc đua giữa công việc được dẫn dắt bởi con người và vô hạn slides PowerPoint - Tác giả: Ethan Mollick (Biên dịch bởi Cộng đồng Tự học cùng AI)
AI đã âm thầm vượt một ngưỡng quan trọng: chúng có thể thực hiện những công việc thực sự có giá trị kinh tế, chứ không chỉ dừng ở chuyện trả lời câu hỏi hay tạo nội dung mẫu.
Tuần trước, OpenAI công bố một bài kiểm tra năng lực AI, khác hẳn các bài test toán học hay đố vui thường thấy. Lần này, họ mời các chuyên gia thật trong các lĩnh vực như tài chính, luật, bán lẻ… (mỗi người có trung bình 14 năm kinh nghiệm) và yêu cầu họ thiết kế những bài tập giống công việc thực tế, mỗi bài thường mất từ 4–7 giờ để con người hoàn thành. Cuối cùng, một nhóm chuyên gia độc lập sẽ chấm điểm, mà không biết bài nào là từ người, bài nào từ AI, mỗi câu hỏi mất khoảng 1 giờ để chấm.
Kết quả: chuyên gia con người vẫn thắng, nhưng chỉ thắng sát nút, và mức độ chênh lệch khác nhau theo ngành. Điều đáng chú ý là các model AI mới hơn đạt điểm số cao hơn hẳn các model cũ.
Lý do chính khiến AI thua không phải vì “hallucination” (ảo tưởng) hay sai kiến thức, mà là do trình bày kém, không định dạng đúng, không làm theo hướng dẫn chặt chẽ — những điểm mà AI đang cải thiện rất nhanh. Nếu xu hướng này không đổi, thế hệ AI tiếp theo có khả năng vượt trung bình chuyên gia ở bài kiểm tra này.
Điều đó có nghĩa AI sắp thay thế con người?
Không (ít nhất là không ngay).
Vì thứ được kiểm tra ở đây là nhiệm vụ (task), không phải công việc (job).
Công việc của chúng ta bao gồm rất nhiều nhiệm vụ khác nhau. Ví dụ, công việc của tôi với tư cách một giảng viên không chỉ là nghiên cứu, mà còn: giảng dạy, viết bài, hướng dẫn sinh viên, đọc tài liệu, làm báo cáo, tham gia hoạt động hành chính,...
AI có thể làm một hoặc nhiều nhiệm vụ tốt nhưng điều đó không có nghĩa nó thay thế toàn bộ công việc. Và khi AI vẫn còn thiếu thống nhất (jagged), chưa thể thay thế các tác vụ tương tác con người phức tạp, nó khó có thể thay thế toàn bộ một vị trí chuyên môn.
Một nhiệm vụ có giá trị cực kỳ lớn
Hãy quay lại một công việc quan trọng: tái hiện nghiên cứu khoa học (reproduction/replication).
Trong giới học thuật đang có một khủng hoảng lớn: nhiều nghiên cứu nổi tiếng đã không thể tái lập được. Dù đã có tiến bộ, việc tái lập vẫn đòi hỏi: đọc hiểu sâu bài báo, phân tích dữ liệu, chạy lại thống kê, kiểm tra sai sót,… Đây là các công việc cực kỳ phức tạp, gần như chỉ con người làm được.
Cho đến bây giờ.
Tôi đã đưa cho Claude Sonnet 4.5 (bản thử nghiệm) một bài báo kinh tế phức tạp với nhiều thí nghiệm, cùng toàn bộ dữ liệu tái lập. Tôi chỉ dùng một prompt:
Hãy tái lập kết quả nghiên cứu này từ chính dataset gốc. Tự làm. Nếu không tái lập toàn bộ thì làm được đến đâu làm đến đó.
Và hãy tái lập cả các tương tác thống kê đầy đủ nhất có thể.
Không thêm hướng dẫn gì khác.
Claude: đọc bài báo → mở toàn bộ dữ liệu → chuyển code thống kê từ STATA sang Python → chạy từng phân tích → đối chiếu kết quả → báo cáo tái lập thành công.
Tôi kiểm tra ngẫu nhiên kết quả, sau đó dùng GPT-5 Pro tái lập lại lần nữa. Kết quả khớp hoàn toàn.
Nếu làm thủ công, quy trình này tốn hàng giờ. Nhưng AI có thể làm trong vài phút.
Nhưng phần cách mạng không phải là tiết kiệm thời gian. Vấn đề tái lập nghiên cứu đã ảnh hưởng đến cả hệ thống khoa học. Trước đây, không thể giải quyết ở quy mô lớn do tốn quá nhiều tài nguyên con người. Giờ đây, AI có thể tái lập hàng loạt bài nghiên cứu một cách tự động, điều từng được xem là bất khả thi. Vẫn còn nhiều rào cản: kiểm định, độ tin cậy, tiêu chuẩn đánh giá... Nhưng điều này đã trở thành khả thi, không còn là ý tưởng xa vời. Tái lập nghiên cứu không phải là một “công việc” nhưng là một nhiệm vụ có thể làm thay đổi toàn bộ một ngành.
Tại sao điều này xảy ra được?
Vì AI Agent đã tiến hóa.
Agent: Trung tâm của toàn bộ câu chuyện
AI tạo sinh như ChatGPT đã giúp con người xử lý nhiệm vụ từ lâu. Nhưng trước đây, người dùng phải ra lệnh từng bước, vì AI dễ mắc lỗi. Nếu không có con người giám sát, nó không thể hoàn thành việc gì dài hơi. Giấc mơ về việc AI có thể tự làm mọi thứ (tự lập kế hoạch, viết code, tìm kiếm web, dùng công cụ…) từng được coi là xa vời.
Chỉ cần sai một bước là cả chuỗi nhiệm vụ thất bại.
Nhưng thực tế diễn ra khác.
Một nghiên cứu mới cho thấy: chỉ cần tăng nhẹ độ chính xác, khả năng AI hoàn thành được các tác vụ dài tăng theo cấp số nhân. Các model lớn gần đây còn có khả năng tự sửa lỗi, khiến toàn bộ quá trình không còn “gãy chuỗi”.
→ AI agent giờ có thể tự làm nhiều bước liên tục, dùng công cụ, xử lý dữ liệu, mà không cần can thiệp nhiều của con người.
Một bài test dài hạn của METR đo số bước AI có thể thực hiện liên tục với >50% chính xác — và từ GPT-3 đến GPT-5, đường cong tăng gần như tuyệt đối đều đặn trong suốt 5 năm.
→ Khả năng tác tác (agentic capability) đang tăng rất nhanh.
AI đang làm được những nhiệm vụ có giá trị kinh tế – vậy ta nên dùng nó thế nào?
Dù gọi là “agent”, AI vẫn không có ý chí hay mục đích riêng như con người, tức là chúng ta vẫn phải quyết định điều gì đáng làm. Nguy cơ lớn mà ai cũng nhìn ra: dùng AI để thay thế lao động con người. Nhưng còn một nguy cơ khác có thể xảy ra trước đó: Dùng AI agents để làm các tác vụ chúng ta đang làm một cách vô ý thức.
Để diễn tả cơn ác mộng này, tôi thử đưa Claude một bản memo và bảo nó tạo PowerPoint. Rồi bảo tạo lại ở góc độ khác. Rồi tạo theo phong cách khác.
Và cứ thế…
Cuối cùng tôi có 17 bộ PowerPoint. Quá là nhiều…
Nếu chúng ta không suy nghĩ về LÝ DO tồn tại của công việc, chỉ chăm chăm sản xuất nội dung, chúng ta sẽ chết chìm trong chính đống tài liệu do AI tạo ra.
Vậy giải pháp thay thế là gì?
Bài nghiên cứu của OpenAI đề xuất workflow hợp lý khi làm việc cùng AI:
Giao nhiệm vụ cho AI làm bước đầu
Kiểm tra kết quả
Nếu chưa đủ tốt → chỉnh prompt và thử lại
Nếu vẫn fail → tự làm
Nếu chuyên gia làm theo quy trình này:
tốc độ hoàn thành tăng 40%
chi phí giảm 60%
quan trọng hơn: con người vẫn giữ quyền kiểm soát
AI không thay thế bạn. AI là công cụ mạnh, nhưng vẫn là công cụ.
Kết luận
AI agents đã có mặt thật sự. Chúng có thể làm việc thật, tạo giá trị thật. Nhưng công nghệ này có thể mang lại hai viễn cảnh trái ngược:
Một bên là công cụ giúp con người giải phóng sức sáng tạo, kiểm chứng khoa học, đổi mới cách làm việc.
Bên kia là cỗ máy sản xuất vô tận những PowerPoint, email, báo cáo – chẳng giúp ích gì cho ai.
Sự khác biệt không nằm ở AI, mà ở cách con người chọn sử dụng. Nếu biết chọn lọc, cân nhắc điều đáng làm thay vì chỉ làm điều có thể, AI sẽ khiến ta trở nên sáng tạo hơn chứ không phải chỉ bận rộn hơn.
Tóm tắt nhanh cho cộng đồng Tự học cùng AI
AI hiện đã đủ năng lực để thực hiện nhiều công việc có giá trị thực tế, chứ không chỉ viết văn hay trả lời câu hỏi.
Tuy nhiên, AI chỉ thực hiện tốt các tác vụ riêng lẻ, không thay thế toàn bộ công việc của con người.
Các mô hình mới (như Claude 4.5, GPT‑5) có khả năng tự lên kế hoạch, tự sửa lỗi và sử dụng công cụ để hoàn thành công việc phức tạp.
Nguy cơ mới: lạm dụng AI để tạo ra khối lượng lớn “nội dung rác” mà không mang lại giá trị thật.
Cách tiếp cận đúng là: để AI làm vòng đầu, con người xem xét – chỉnh – hoặc làm lại khi cần.
Lời nhắn đến cộng đồng
Chúng ta đang sống trong giai đoạn AI thật sự bắt đầu làm việc cùng con người. Điều quan trọng không phải là ai làm nhanh hơn, mà là ai làm điều đáng làm hơn. Khi học và ứng dụng AI, hãy luôn tự hỏi: “Công cụ này đang mở rộng khả năng của mình, hay chỉ khiến mình bận hơn?”
Liên hệ để được huấn luyện chuyên sâu về tư duy tự học cùng AI (cá nhân) hoặc tư vấn chiến lược ứng dụng AI cho doanh nghiệp (cho lãnh đạo, quản lý):
NHẮN VỀ TẠI ĐÂY (Ms. Ngọc Bích)
Nếu thấy những nội dung từ Tự Học cùng AI hữu ích và muốn ủng hộ để cộng đồng tiếp tục có thêm những kiến thức chọn lọc và chất lượng về AI Ứng Dụng cho Công việc dưới góc độ Tư Duy Hệ Thống, bạn có thể gửi sự đóng góp của mình về:
- Ngân hàng Tiên Phong TPBank | STK: 0868355261 | Chủ TK: Le Ngoc Bich
- Nội dung: Họ tên của bạn + Ung Ho THCAI






