Vào sáng 21 tháng 4 năm 2025, Google DeepMind không tung ra một mô hình AI mới toanh có benchmark cao hơn người. Họ tung ra hai thứ mà thực ra mọi người đã đợi rất lâu: hai agent nghiên cứu tự động Gemini Deep Research, chạy công khai trên API cho tất cả mọi người trả tiền có thể gọi. Đến ngày hôm nay 02 tháng 6, sau hơn một tháng hàng chục ngàn người chạy thử, báo lỗi, than giá, khen ngợi trên Reddit, LinkedIn và diễn đàn developer, chúng ta cuối cùng có thể nói rõ được điều mà không có bài quảng cáo nào dám nói: Gemini Deep Research preview agentic search impact không phải là cái thay thế con người. Đó là cái thay đổi quy tắc trò chơi.
Đây không phải chatbot. Đây là máy nghiên cứu chạy nền
Điều đầu tiên gần như tất cả mọi người hiểu sai khi mới nghe tin: Deep Research không phải cái nút mới trong app Gemini bạn gõ câu hỏi rồi nhận câu trả lời. Đây là hạ tầng agentic. Nó không trả lời bạn. Nó nhận yêu cầu, vạch ra kế hoạch nghiên cứu, hỏi bạn có đồng ý không, sau đó lặng lẽ chạy ở nền. Nó có thể mở 160 trang web, đọc gần 1 triệu từ, tổng hợp, vẽ biểu đồ, trích dẫn nguồn, và trả lại cho bạn một báo cáo hoàn chỉnh 10 phút sau. Không cần bạn nhấn nút gì thêm.
Có hai phiên bản preview hiện có: bản thường ưu tiên tốc độ, chạy khoảng 80 tìm kiếm mỗi tác vụ. Bản Max chạy đến 160 tìm kiếm, không giới hạn độ dài đầu ra, và chính là cái đang gây ra tất cả các cuộc tranh cãi trên mạng một tháng qua.
Điều ít ai nói rõ: cái công nghệ này không đến từ không gian. Đây là kết quả của gần 2 năm Google lặng lẽ thử nghiệm tính năng này bên trong NotebookLM, rồi tách ra thành sản phẩm riêng, và cuối cùng mở cho developer nhúng vào bất kỳ ứng dụng nào. Đến Google I/O tháng 5 vừa rồi, họ chính thức xác nhận toàn bộ dòng Gemini sẽ được xây dựng xung quanh khả năng agentic này.
Không còn cái kiểu chat 1 lượt hỏi đáp nữa. Từ nay AI sẽ nhận nhiệm vụ, đi làm việc, và quay lại báo cáo khi xong. Đó là bước nhảy lớn nhất chúng ta từng thấy kể từ khi GPT-3 ra mắt.
Chi phí token: con số thật mà không ai nói trong bài quảng cáo

Đây là phần quan trọng nhất. Phần mà mọi bài đánh giá trên mạng đều né tránh cho đến khi mọi người chạy thử và bị sốc hóa đơn.
Deep Research không tính phí theo số yêu cầu. Nó tính phí theo tổng số token agent sử dụng trong toàn bộ chu trình làm việc. Nghĩa là bạn không biết trước sẽ tốn bao nhiêu tiền. Agent tự quyết định nó cần đọc bao nhiêu trang, cần tìm kiếm thêm bao nhiêu lần, và cứ tiêu token cho đến khi nó thấy đủ thông tin để trả lời yêu cầu của bạn.
- Bản Deep Research tiêu chuẩn: tác vụ thông thường chạy từ 1 đến 3 đô la. Khoảng 80 tìm kiếm, 250.000 token đầu vào, 60.000 token đầu ra.
- Bản Deep Research Max: tác vụ thông thường chạy khoảng 4.8 đô la. Nhưng trên diễn đàn chính thức của Google đã có người đăng hóa đơn một lần chạy tiêu thụ 23 triệu token. Không có lỗi. Agent chỉ đơn giản quyết định nó cần đọc tất cả tài liệu đó để trả lời câu hỏi.
Không có giới hạn chi phí mặc định. Không có thông báo trước khi agent bắt đầu tiêu hàng chục đô la token. Bạn chỉ biết số tiền sau khi nó chạy xong. Đây là điểm yếu lớn nhất của phiên bản preview hiện tại, và cũng là lý do gần như tất cả developer đang thử nghiệm đều đặt cảnh báo chi phí cứng ở tầng ứng dụng của họ.
Đừng hiểu sai. Giá này vẫn rẻ đến vô lý so với thuê người làm. Một bài nghiên cứu cạnh tranh thị trường tương tự sẽ tốn một nhân viên phân tích 8 tiếng làm việc. Với Deep Research Max bạn có kết quả sau 12 phút với giá chưa đến 100 nghìn đồng. Nhưng sự không thể dự toán chi phí đang là rào cản lớn nhất với doanh nghiệp muốn triển khai chính thức.
Bảo mật và kiểm soát: agent không tự động lục thùng dữ liệu của bạn

Sau khi bản preview ra mắt, có hàng trăm bài đăng lo lắng rằng Google sẽ cho agent tự động đọc toàn bộ Drive, Gmail và Workspace của doanh nghiệp mà không cần phép. Sau gần một tháng thử nghiệm, chúng ta đã có câu trả lời rõ ràng.
Không. Agent bị xích chặt hơn mọi người tưởng.
Có hai lớp kiểm soát cứng. Thứ nhất, trước khi bắt đầu bất kỳ công việc nào, agent sẽ gửi lại cho bạn toàn bộ kế hoạch nghiên cứu chi tiết. Bạn thấy chính xác nó định tìm cái gì, định truy cập nguồn nào. Bạn có thể xóa bớt, sửa đổi, thêm yêu cầu, hoặc hủy hoàn toàn. Chỉ sau khi bạn bấm đồng ý, nó mới bắt đầu chạy.
Thứ hai, để agent truy cập dữ liệu nội bộ doanh nghiệp, bạn phải chủ động cấu hình kết nối MCP server. Bạn phải điền địa chỉ server, thông tin xác thực, và giới hạn chính xác từng công cụ, từng thư mục mà agent được phép đọc. Không có nút “cho phép truy cập tất cả”. Agent không tự dò tìm. Nó chỉ có thể đến đúng nơi bạn mở cửa cho nó.
Tính đến nay chưa có báo cáo chính thức nào về vụ rò rỉ dữ liệu hay agent truy cập sai nguồn. Tất cả các vấn đề được báo cáo đều đến từ người quản trị cấu hình sai quyền truy cập, chứ không phải lỗi của chính agent.
Giới hạn mà quảng cáo không bao giờ nói
Deep Research làm rất tốt 95% công việc của một nhà nghiên cứu cấp nhập môn. Nó đọc nhanh, không quên, không thiên vị, trích dẫn đúng nguồn, vẽ biểu đồ đẹp. Nhưng nó hoàn toàn không có khả năng phán đoán.
Nó không biết rằng nguồn này được viết bởi người có liên quan lợi ích. Nó không biết rằng con số trong báo cáo này đã bị chỉnh sửa. Nó không hiểu rằng cùng một dữ liệu có thể được diễn giải hoàn toàn ngược lại tùy thuộc vào bối cảnh ngành. Nó tổng hợp rất tốt. Nó không đánh giá.
Trong y tế, nó sẽ liệt kê chính xác tất cả các phác đồ điều trị được công bố. Nó sẽ không nói cho bạn biết phác đồ này thích hợp với bệnh nhân 70 tuổi có bệnh nền tiểu đường còn phác đồ kia thì không. Trong tài chính, nó sẽ tổng hợp tất cả số liệu báo cáo thu nhập. Nó sẽ không nói cho bạn biết đội ngũ lãnh đạo công ty này có thành tích gian lận 3 lần trước đây.
Đây không phải lỗi. Đây là giới hạn cơ bản của tất cả hệ thống agentic ngày nay. Các kỹ sư của Google chính thức ghi rõ trong tài liệu: công cụ này không thay thế phán đoán con người. Mọi đầu ra đều cần được kiểm tra lại bởi chuyên gia ngành.
Tác động thực tế đang xảy ra ngay bây giờ
Không cần đợi 5 năm nữa. Tác động của Gemini Deep Research preview agentic search impact đã xảy ra với những nhóm người đầu tiên.
Các agency phân tích cạnh tranh đã bắt đầu thay thế 70% khối lượng công việc nghiên cứu thủ công bằng agent này. Các bộ phận nghiên cứu thị trường tại các doanh nghiệp lớn đang chạy thử nghiệm song song: cùng một yêu cầu, gửi cho cả đội ngũ nhân viên và cho Deep Research, rồi so sánh kết quả. Đến nay tỷ lệ chính xác của agent dao động từ 82 đến 91 phần trăm, với tốc độ nhanh gấp 25 lần.
Điều đáng nói nhất: không ai bị sa thải. Thay vào đó, những người trước đây dành 8 giờ một ngày để đọc báo cáo và tổng hợp dữ liệu, bây giờ dành 8 giờ để phân tích, đánh giá và đưa ra quyết định. Agent không thay thế người. Nó thay thế phần công việc nhàm chán nhất trong công việc tri thức.
Cũng chính vì vậy mà cuộc đua agentic search bây giờ mới thực sự bắt đầu. OpenAI đã có phiên bản tương tự. Perplexity đang chạy thử. Mọi người không còn thi nhau xây mô hình có điểm benchmark cao nhất. Họ đang thi nhau xây trợ lý có thể chạy ở nền, làm việc khi bạn ngủ, và đưa cho bạn báo cáo hoàn chỉnh khi bạn thức dậy vào buổi sáng.
Cuối cùng thì điều gì cũng có giá. Bạn có thể thu gọn 8 giờ nghiên cứu xuống còn 12 phút. Bạn có thể có báo cáo đầy đủ trích dẫn và biểu đồ với giá chưa đến một trăm nghìn đồng. Nhưng bạn vẫn không thể thuê ai thay bạn suy nghĩ. Đó là quy tắc chưa thay đổi. Và có lẽ sẽ không bao giờ thay đổi.
Bạn có thể đọc tài liệu chính thức của Google về Gemini Deep Research tại trang tài liệu dành cho developer. Các bạn đang muốn thử nghiệm nên bắt đầu với tác vụ nhỏ, bật chế độ xem kế hoạch trước, và luôn đặt giới hạn chi phí trước khi chạy bất kỳ yêu cầu nào với bản Max.
Đối với các doanh nghiệp đang xây dựng vị thế trên công cụ tìm kiếm trong giai đoạn AI thay đổi toàn bộ quy tắc xếp hạng, việc xây dựng hồ sơ backlink đáng tin cậy ngày càng trở thành yếu tố quyết định. Backlink Cafe cung cấp các gói backlink thủ công mũ trắng bao gồm gói Ahrefs, A+ và GEO, chỉ làm việc với domain DR trên 75 và bài viết chuẩn EEAT, đã giúp hơn 1700 khách hàng tăng traffic từ 35% đến 86% trong các ngành khó.



Leave a Reply