Sony chính thức giới thiệu một AI “siêu phàm” mới, đánh bại hoàn toàn các tay đua hàng đầu trong game Gran Turismo

Tram Ho

Một vài ngày trước, hãng Sony từng úp mở về một dự án AI đột phá và giờ đây, “bước đột phá” này đã chính thức lộ diện – một chương trình AI “siêu phàm” mới, có thể đánh bại các cao thủ hàng đầu của trò chơi đua xe kinh điển Gran Turismo.

Chương trình AI mới này có tên GT Sophy và được Sony xem như “sự siêu phàm đáng tin cậy” – có thể đánh bại cả các tay đua hàng đầu trong tựa game Gran Turismo Sport với thể thức các vòng đua liên tiếp.

Nhiều người có thể cho rằng đây là một thách thức dễ dàng khi chiến thắng trong mỗi cuộc đua xe chỉ đơn giản là vấn đề về tốc độ và thời gian phản ứng. Do vậy, chiến thắng của một chương trình AI là điều quá dễ hiểu? Thế nhưng theo các chuyên gia về AI cũng như game đua xe, thành công của GT Sophy là một bước đột phá đáng kinh ngạc, cho thấy sự thông thạo cả về chiến lược và chiến thuật trên đường đua.

 

Sony chính thức giới thiệu một AI "siêu phàm" mới, đánh bại hoàn toàn các tay đua hàng đầu trong game Gran Turismo - Ảnh 1.

GT Sophy được huấn luyện bằng phương pháp học tăng cường – về cơ bản là một dạng thử sai liên tục – khi chương trình AI được đưa vào trong một môi trường mới không có hướng dẫn nào và được thưởng sau khi đạt được mỗi mục tiêu cụ thể. Trong trường hợp của GT Sophy, các nhà nghiên cứu của Sony đã tinh chỉnh đặc biệt cẩn thận “chức năng phần thưởng” này. Ví dụ, hình phạt cho mỗi lần va chạm được tinh chỉnh để định hình phong cách lái xe mạnh mẽ có thể đạt tới chiến thắng mà không làm AI bắt nạt các tay đua khác trên đường đua.

Sử dụng học tăng cường, GT Sophy có thể đi vòng quanh đường đua chỉ sau vài giờ huấn luyện và chỉ “trong vòng một đến hai ngày”, nó đã nhanh hơn 95% các tay lái khác trong bộ dữ liệu huấn luyện. Sau 45.000 giờ huấn luyện, GT Sophy có thể đạt được thành tích siêu phàm trên 3 đường đua – Dragon Trail Seaside, Lago Maggiore GP và Circuit de la Sarthe trong Gran Turismo.

Một lo ngại thường thấy khi thử nghiệm các chương trình AI là việc chúng có một số lợi thế nhất định về khả năng xử lý đối với con người. Ví dụ đầu vào của GT Sophy là10 Hz, trong khi của con người về lý thuyết có thể đạt tối đa 60 Hz. Thời gian phản ứng của GT Sophy trong môi trường game đạt tới 23-30 ms, nhanh hơn nhiều so với 200-250 ms của các vận động viên chuyên nghiệp.

Sony chính thức giới thiệu một AI "siêu phàm" mới, đánh bại hoàn toàn các tay đua hàng đầu trong game Gran Turismo - Ảnh 2.

Để bù đắp điều này, độ trễ trong thời gian phản ứng của GT Sophy đã được điều chỉnh lên các mức 100, 200, 250 ms. Tuy nhiên, các nhà nghiên cứu nhận thấy “Cả 3 mức thử nghiệm đều cho thấy thời gian hoàn thành vòng đua siêu phàm.”

GT Sophy còn được thử nghiệm với cả 3 lái xe e-sport hàng đầu thế giới hiện nay: Emily Jones, Valerio Gallo và Igor Fraga – không một ai có thể đánh bại GT Sophy trong thời gian thử nghiệm. Cho dù vậy, cuộc đối đầu này lại giúp họ khám phá được các chiến thuật mới.

Thật thú vị khi nhìn thấy con đường mà AI sẽ đi, có những góc nhất định mà tôi sẽ cua rộng ra và đi cắt vào trong, nhưng AI lại đi bám theo các góc cua đó, vì vậy tôi học được rất nhiều từ những con đường này.” Tay đua e-sport Emily Jones cho biết sau một buổi thử nghiệm.

Ví dụ ở lượt đi đầu tiên, tôi phanh muộn hơn so với AI, nhưng AI lại thoát ra nhanh hơn tôi và đánh bại tôi ở góc của tiếp theo. Tôi không nhận ra điều đó cho đến khi tôi nhìn thấy AI và cảm giác giống như: “Được rồi, nhẽ ra tôi nên làm điều đó“.”

Sony cho biết hiện họ đang nghiên cứu để tích hợp GT Sophy vào tựa game Gran Turismo trong tương lai, nhưng không cho biết lộ trình cụ thể.

Tham khảo The Verge

Chia sẻ bài viết ngay

Nguồn bài viết : Genk