Công nghệ trí tuệ nhân tạo (AI) đang định hình lại nhiều ngành công nghiệp, và lĩnh vực game không nằm ngoài xu hướng này. Mới đây, Microsoft đã gây chấn động cộng đồng công nghệ khi trình diễn mô hình WHAMM (World Human Action MaskGIT Model) của mình, tạo ra một phiên bản Quake II có khả năng tạo sinh theo thời gian thực. Dù đây vẫn chỉ là một bản thử nghiệm (proof of concept) với trải nghiệm chưa thực sự trọn vẹn, nó đã mở ra cánh cửa đến một kỷ nguyên mới của ngành game tương lai, nơi AI không chỉ hỗ trợ mà còn trực tiếp kiến tạo thế giới ảo.
Sự phát triển của AI tạo sinh trong game đang tăng tốc một cách chóng mặt. Trước WHAMM, chúng ta đã chứng kiến các nhà nghiên cứu tìm ra cách chạy Doom trong mô hình GameNGen của Google hay OASIS AI cho phép người dùng trải nghiệm phiên bản Minecraft tạo sinh điên rồ ngay trên trình duyệt. Tháng 2 năm 2025, Microsoft cũng đã giới thiệu hệ thống tạo game WHAM độc đáo của mình. Giờ đây, WHAMM tiếp tục khẳng định vị thế dẫn đầu của Microsoft trong cuộc đua này.
Nâng Cấp Đáng Kể: Từ WHAM-1.6B Đến WHAMM Mạnh Mẽ
Mô hình WHAM-1.6B mà Microsoft trình làng trước đây, dù ấn tượng, vẫn còn nhiều hạn chế về mặt ứng dụng thực tế. Nó chỉ có thể tạo ra một khung hình mỗi giây ở độ phân giải 300 x 180 và yêu cầu tới bảy năm dữ liệu huấn luyện để tạo ra một game “có thể chơi được”. Microsoft đã nhanh chóng phát triển WHAMM với những cải tiến đáng kinh ngạc. Không chỉ hoạt động ở độ phân giải 600 x 340 (gấp đôi WHAM-1.6B), WHAMM còn đạt tốc độ tối thiểu 10 khung hình mỗi giây (FPS) và đặc biệt, nó có thể “học” và sao chép Quake II chỉ với một tuần dữ liệu huấn luyện.
Hình ảnh trải nghiệm Quake II được tạo bởi AI WHAMM của Microsoft trên trình duyệt, minh họa công nghệ game tạo sinh.
Những cải tiến vượt bậc này đến từ một kiến trúc tinh vi hơn. Thay vì sử dụng hệ thống “LLM-like” tự hồi quy điển hình, nơi mô hình AI tạo ra từng “token” một, thiết lập MaskGIT của WHAMM cho phép nó “tạo tất cả các token cho một hình ảnh trong bất kỳ số lần tạo nào chúng ta muốn.” Điều này có nghĩa là mô hình mới tận dụng khả năng xử lý song song, giúp tăng đáng kể tốc độ xuất hình ảnh, cải thiện chất lượng hình ảnh và độ chính xác dự đoán.
Hạn Chế Hiện Tại và Thách Thức Cần Vượt Qua
Mặc dù mang tính đột phá, các game được tạo bởi WHAMM vẫn chưa mang lại trải nghiệm chơi game thực sự thú vị. Hình ảnh còn mờ, nhòe, không sắc nét, tốc độ khung hình chưa lý tưởng (dù không quá khác biệt so với trải nghiệm Quake II năm 1997), và các kẻ thù trong game gần như không thể nhận dạng. Bản demo cũng gặp phải độ trễ đáng kể, mặc dù Microsoft cho rằng đây là lỗi của trình phát web hơn là bản thân mô hình.
WHAMM cũng gặp phải vấn đề “bộ nhớ ngắn hạn” thường thấy ở các mô hình AI tạo sinh game khác. Là một mô hình dự đoán, WHAMM tạo ra các khung hình mới bằng cách nhìn vào các khung hình trước đó. Điều này dẫn đến một số hạn chế như:
- Khó khăn trong việc theo dõi thông số: AI kém trong việc ghi nhớ lượng máu, đạn dược của người chơi.
- Vật thể biến mất hoặc xuất hiện ngẫu nhiên: Kẻ thù có thể biến mất khi người chơi quay đi hoặc đột nhiên xuất hiện mà không có lý do.
- Lỗi dịch chuyển không mong muốn: Đẩy nhân vật vào tường hoặc nhìn chằm chằm vào sàn nhà có thể khiến người chơi bị dịch chuyển đến một vị trí khác trên bản đồ.
Tuy nhiên, trong các thử nghiệm, WHAMM dường như có ít vấn đề “bộ nhớ ngắn hạn” hơn so với một số mô hình khác. Độ dài ngữ cảnh 0.9 giây của nó đủ tốt để ngăn chặn những trải nghiệm “nhức não” hoặc “ảo giác” từng xuất hiện trong các bản demo Minecraft tạo sinh, cho thấy đây là một thách thức lớn mà Microsoft cần vượt qua.
Cần lưu ý rằng WHAMM mới chỉ được huấn luyện trên cấp độ đầu tiên của Quake II. Nếu người chơi đi vào thang máy ở cuối cấp độ, mô hình sẽ bị treo. Do đó, tuyên bố của Microsoft rằng WHAMM có thể được huấn luyện chỉ với một tuần dữ liệu video có phần gây hiểu lầm; lượng dữ liệu cần thiết để tạo ra một game tương tác thực sự sẽ thay đổi tùy thuộc vào độ dài nội dung, độ phức tạp của game và các yếu tố khác.
Tương Lai của AI Tạo Sinh Game
Về cách thức công nghệ này sẽ được sử dụng trong tương lai, Microsoft nhận định rằng AI tạo sinh thời gian thực có thể tạo ra “các loại hình truyền thông tương tác mới”, nhưng họ vẫn đang trong quá trình khám phá loại hình đó nên là gì. Tiềm năng của WHAMM là vô cùng lớn, từ việc tự động tạo ra nội dung game, các màn chơi ngẫu nhiên, cho đến việc cá nhân hóa trải nghiệm game cho từng người chơi.
Người dùng có thể trải nghiệm phiên bản Quake II được tạo sinh theo thời gian thực tại trang web Copilot Labs của Microsoft. Các game này được giới hạn thời gian và sẽ đặt lại khi hết giờ. Hãy nhớ rằng đây chỉ là một bản thử nghiệm công nghệ, vì vậy đừng kỳ vọng quá nhiều vào trải nghiệm chơi game hoàn chỉnh.
Thuthuatpc.net sẽ tiếp tục theo dõi và cập nhật những đột phá mới nhất về công nghệ AI trong game. Hãy chia sẻ ý kiến của bạn về tiềm năng của AI tạo sinh game trong phần bình luận bên dưới!
Tài liệu tham khảo: