Hành trình 3 năm, từ GPT-3 đến Gemini 3
Từ chatbot đến agent
Từ bài viết “Three Years from GPT-3 to Gemini 3” của Ethan Mollick — 18/11/2025
Biên dịch bởi Tự học cùng AI
Tôi đã thử nghiệm mô hình Gemini 3 mới của Google. Nó thực sự rất mạnh. Nhưng thay vì đưa ra các bảng benchmark, tôi muốn cho bạn thấy AI đã tiến xa thế nào trong ba năm qua bằng cách để chính AI thể hiện điều đó.
Còn chưa đầy ba năm kể từ khi ChatGPT ra mắt. Vài ngày trước thời điểm đó, tôi đã viết bài đầu tiên trên Substack này về mô hình GPT-3 đời trước của OpenAI. Rồi ChatGPT xuất hiện, và tôi viết gần như ngay lập tức rằng:
Thông thường tôi rất dè dặt khi dự đoán công nghệ, nhưng lần này tôi nghĩ AI sẽ thay đổi thế giới nhanh hơn nhiều so với chúng ta dự đoán, và sâu rộng hơn. Thay vì chỉ tự động hóa các công việc lặp lại và nguy hiểm, có khả năng những công việc đầu tiên bị tác động sẽ lại là các công việc phân tích, sáng tạo, viết lách và giao tiếp.
Tôi nghĩ nhận định đó đã đúng.
Bài viết đầu tiên của tôi sau khi dùng GPT-3.5 ba năm trước
Tôi có thể giải thích sự khác biệt giữa ChatGPT - phiên bản đầu và Gemini 3 - mô hình AI mới Google vừa ra mắt. Nhưng tôi không cần làm thế. Thay vào đó, tôi đưa ảnh chụp màn hình bên trên cho Gemini 3 và chỉ dùng một câu prompt:
Tôi: “Hãy cho thấy AI đã tiến xa thế nào kể từ bài viết này, bằng cách làm gì đó.”
Gemini: “Tôi có thể cho bạn thấy ngay. Bài đăng bạn đưa là từ tháng 11/2022 — thời điểm AI hiện đại vừa bùng nổ. Khi đó, điều khiến mọi người ‘wow’ là việc AI có thể viết một đoạn văn mạch lạc hoặc một bài thơ đơn giản về một chủ đề ngớ ngẩn như ‘động cơ FTL chạy bằng kẹo để trốn rái cá’.
Để cho thấy chúng ta đã đi xa đến đâu, tôi sẽ không chỉ viết nữa. Tôi sẽ tạo cho bạn một trò chơi tương tác mô phỏng tàu vũ trụ FTL chạy bằng kẹo mà bạn có thể trực tiếp điều khiển.
Năm 2022, AI chỉ có thể mô tả động cơ. Năm 2025, AI có thể lập trình động cơ, thiết kế giao diện, và cho bạn lái con tàu.”
Và đúng thật, Gemini 3 tạo ra một mini-game hoàn chỉnh: tôi phải dùng “năng lượng kẹo” để thoát khỏi lũ rái cá, với thơ ngắn, cập nhật tình huống và cả tiếng hiệu vui tai.
Nếu bạn đang đọc blog này, có lẽ bạn đã biết AI hiện giờ làm được những việc như vậy. Nhưng điều thú vị hơn là những gì Gemini 3 có thể làm khi ta không còn xem nó là một chatbot, mà là một loại công cụ hoàn toàn mới.
Công cụ lập trình, nhưng không dừng lại ở đó
Cùng với Gemini 3, Google ra mắt Antigravity. Với lập trình viên, Antigravity khá quen thuộc, giống Claude Code hay OpenAI Codex: công cụ có thể được cấp quyền truy cập máy tính và tự động viết chương trình theo hướng dẫn.
Nếu bạn không phải lập trình viên, bạn có thể muốn bỏ qua. Nhưng đó là sai lầm.
Khả năng lập trình không chỉ để viết code mà là để làm bất kỳ thứ gì diễn ra trên máy tính. Nếu AI thao tác được với code, nó có thể làm phần lớn những gì con người làm khi ngồi trước màn hình:
– xây dashboard
– làm website
– tạo PowerPoint
– đọc & xử lý file
– tự động hóa tác vụ
– và hơn nữa
Điều này biến các agent biết lập trình thành công cụ đa năng thực sự.
Antigravity áp dụng triệt để ý tưởng này. Nó cung cấp một Inbox - nơi tôi có thể giao nhiệm vụ cho các agent và chúng sẽ báo lại khi cần quyền hay hướng dẫn.
Tôi không nói chuyện với chúng bằng code, chỉ bằng tiếng Anh. Còn chúng tự dùng code để làm phần việc nặng.
Điều khiến Gemini 3 mạnh là khả năng lập kế hoạch: nó biết làm gì tiếp theo và biết khi nào cần hỏi ý kiến tôi. Ví dụ, tôi cấp quyền cho Antigravity truy cập thư mục chứa toàn bộ bài viết của bản tin này. Sau đó tôi yêu cầu:
“Tổng hợp danh sách các dự đoán tôi từng đưa ra về AI, rồi tìm trên web xem cái nào đúng, cái nào sai.”
Nó đọc toàn bộ file, chạy code, rồi đưa tôi bản kế hoạch chi tiết để duyệt. Đây là lần đầu tiên trong quy trình nó hỏi tôi điều gì và sự hiểu ý của nó khá ấn tượng.
Tôi chỉnh sửa vài điểm nhỏ rồi để nó tiếp tục.
Nó tiến hành tìm kiếm web, dựng trang web, mở trình duyệt của tôi để kiểm tra, rồi trả kết quả. Giống như làm việc với một cộng sự, tôi xem qua, góp ý vài chỗ, và nó hoàn thiện phần còn lại.
Không phải Gemini 3 làm mọi thứ hoàn hảo. Nhưng lỗi không phải kiểu tạo câu trả lời ảo (hallucination), mà giống lỗi con người: diễn giải sai ý tôi, hoặc chọn hướng giải quyết không tối ưu. Quan trọng nhất: tôi luôn cảm thấy mình kiểm soát được tiến trình: AI luôn báo cáo, công việc minh bạch. Cảm giác rất giống quản lý một đồng nghiệp hơn là nói chuyện với một chatbot.
Trí tuệ cấp độ PhD?
Nhưng Antigravity không phải điều duy nhất khiến Gemini 3 khiến tôi bất ngờ. Nó còn có thể xử lý các công việc cần phán đoán thực sự.
Đánh giá AI bằng benchmark rất hỗn loạn. Gemini 3 dẫn đầu hầu hết các thang đo, dù có thể chưa vượt GPT-5 Pro giá 200 đô (nhưng tôi đoán khi bản “Deep Think” của Gemini ra, chuyện này sẽ thay đổi).
Điều bạn sẽ nghe nhiều trong giới AI: “mức trí tuệ cấp PhD.”
Vậy tôi thử nghiệm.
Tôi đưa cho Gemini 3 một thư mục cũ dùng cho nghiên cứu Huy động vốn cộng đồng (crowdfunding) cách đây 10 năm: file hỏng, file STATA cũ, bảng tính đặt tên kiểu “final_project_seriously_this_time.xls”… và bảo nó:
“Hãy hiểu dữ liệu, xác định cấu trúc, làm sạch dữ liệu và chuẩn bị cho một phân tích mới.”
Nó làm được, thậm chí khôi phục một số dữ liệu hỏng.
Rồi tôi giao đúng bài tập của một nghiên cứu sinh PhD năm hai:
“Viết một bài nghiên cứu mới dựa trên dữ liệu này. Tự tìm đề tài có giá trị trong lĩnh vực khởi nghiệp hoặc chiến lược kinh doanh. Tự nghiên cứu nền tảng, phân tích dữ liệu, và viết bài theo chuẩn học thuật.”
Không gợi ý thêm.
AI:
– tự nghĩ đề tài,
– tự triển khai giả thuyết,
– tự chạy phân tích thống kê,
– tự xuất bản thảo 14 trang theo định dạng học thuật.
Điều thú vị nhất: tôi không nói cho nó phải nghiên cứu gì. Nó tự tìm một chủ đề đủ quan trọng và khả thi với dữ liệu hiện có — điều khó dạy nhất.
Nó còn tự tạo ra thước đo “mức độ độc đáo” của ý tưởng crowdfunding bằng cách dùng NLP để so sánh các mô tả dự án: tự viết code, chạy code, kiểm tra kết quả.
Vậy đây có phải “trí tuệ cấp PhD”?
Ở nhiều mặt: có. Nó làm tốt như một nghiên cứu sinh giỏi. Nhưng cũng có điểm yếu:
– một số phân tích chưa tối ưu,
– lý thuyết quá đà so với dữ liệu,
– chọn phương pháp chưa hoàn hảo.
Nhưng đây là lỗi con người, không phải lỗi kiểu “AI bịa”. Và khi tôi góp ý chung chung, nó cải thiện rất nhanh, y hệt cách một nghiên cứu sinh nhận phản hồi từ giảng viên.
Chúng ta chưa hoàn toàn đạt mức “PhD thực thụ”, nhưng khoảng cách đã rất gần.
Gemini 3
Gemini 3 là một cộng sự thông minh biết nghĩ và làm, tiếp cận được bởi hàng tỷ người. Nó cho thấy nhiều điều:
– AI vẫn tăng tốc, chưa có dấu hiệu chậm lại
– mô hình agent đang lên ngôi
– chúng ta cần cách quản lý AI thông minh hơn
… và hơn thế nữa.
Ba năm trước, chúng ta ngạc nhiên vì AI viết được thơ về rái cá.
Chưa đầy 1.000 ngày sau, tôi tranh luận về phương pháp thống kê với một agent tự xây dựng môi trường nghiên cứu của chính nó.
Kỷ nguyên chatbot đang chuyển thành kỷ nguyên “đồng nghiệp số”.
Gemini 3 không hoàn hảo và vẫn cần một “người quản lý”. Nhưng vai trò con người đang thay đổi:
Từ “người sửa lỗi cho AI”
→ thành “người giao việc và định hướng cho AI.”
Và đó có thể là thay đổi lớn nhất kể từ ngày ChatGPT xuất hiện…
Liên hệ để được huấn luyện chuyên sâu về tư duy tự học cùng AI (cá nhân) hoặc tư vấn chiến lược ứng dụng AI cho doanh nghiệp (cho lãnh đạo, quản lý):
NHẮN VỀ TẠI ĐÂY (Ms. Ngọc Bích)
Nếu thấy những nội dung từ Tự Học cùng AI hữu ích và muốn ủng hộ để cộng đồng tiếp tục có thêm những kiến thức chọn lọc và chất lượng về AI Ứng Dụng cho Công việc dưới góc độ Tư Duy Hệ Thống, bạn có thể gửi sự đóng góp của mình về:
- Ngân hàng TPBank | STK: 0868355261 | Chủ TK Le Ngoc Bich
- Nội dung: Họ tên của bạn + Ung Ho THCAI





