Đánh bại Poker online những điều bạn nên biết P2

remimotao · #1 07-04-2017, 03:17 PM

Hệ thống quảng cáo SangNhuong.com

Đầu tiên cách chơi bài poker là nó chỉ xem xét một số lượng giới hạn các hành động. AI có thể FOLD (bỏ bài), CALL (cược bằng người chơi trước), ALL-IN (đặt hết số tiền) hoặc chỉ đặt cược gấp 2 hay 3 lần. Điều này giúp giới hạn một cách đáng kể số lượng các trạng thái của tương lai cần phải được xem xét – chỉ còn khoảng 140 cách xếp bài dựa trên những quân mà nó có. Nó cũng sẽ không tìm kiếm tiếp toàn bộ các khả năng có thể xảy ra. Kết quả là AI này chỉ mất 5 giây để hoàn thành phép tính với một card đồ họa NVIDIA GeForce GTX 1080 duy nhất.

Thứ hai là giới hạn các khả năng lên bài của đối phương. Tất cả công việc trên vẫn đòi hỏi phải tìm kiếm các giá trị có thể của những lần lên bài trong tương lai. Tuy nhiên, nhờ vào việc sử dụng hai mạng lưới thần kinh nhân tạo Deep Learning (học sâu), hai bản sao của cùng một mạng lưới: một dành cho 3 lá bài chung đầu tiên đánh bài online ăn tiền thật , mạng lưới thứ hai dành cho hai lá bài riêng cuối cùng. Về cơ bản, AI này có khả năng phán đoán các lá bài của đối phương mà không cần nhìn vào mặt họ.

Hiệu quả của DeepStack

Để thử nghiệm AI này, thông qua Liên đoàn Poker Quốc tế, nhóm nghiên cứu thuê 33 người chơi để chơi đối đầu với nó. Nhưng giá trị tiền mặt của giải thưởng không đủ để thu hút những người chơi tốt nhất cho thử nghiệm này, và một vài người trong số họ chỉ hoàn thành một số ít ván đấu.

Chỉ có hai người chơi kết thúc ván đấu với việc dẫn trước DeepStack, và cả hai người đó đều chơi rất ít ván, vì vậy rất khó dự đoán được những lá bài rút được sẽ là gì. Với 11 người chơi đã trải qua đầy đủ 3.000 ván đấu với DeepStack, tất cả đều kết thúc với việc đứng sau nó, 10 người trong số họ thậm chí còn thua với một khoảng cách rất đáng kể.

Do các cách tiếp cận của hai nhóm Libratus và DeepStack rất khác biệt, nên có rất ít cơ hội để hai nhóm nghiên cứu có thể sáp nhập với nhau dù họ muốn. Tuy vậy, cách tiếp cận của DeepStack đang cho thấy tổng quát hơn, vì nó không dựa vào một siêu máy tính để cập nhật hệ thống trong thời gian nghỉ.

Nhưng điều quan trọng là liệu phần mềm này có thể mở rộng ra bên ngoài các trò chơi hay không. Cả hai nhóm đều tuyên bố sẽ đưa ra một cách tiếp cận tổng quát cho các trường hợp thông tin không hoàn hảo: Đối với DeepStack, phần code dành riêng cho poker dường như chỉ là việc sử dụng các mạng lưới thần kinh nhân tạo để tính toán giá trị của trạng thái ván đấu trong tương lai và ra quyết định tùy vào các giá trị đó rút tiền happy8 .

Nếu những đoạn code này được chuyển đổi sang các lĩnh vực khác, nó có thể ứng dụng được cho các vấn đề trong thế giới thực. Các tác giả của DeepStack cho rằng nó sẽ rất có giá trị trong việc ra các quyết định về y tế và quốc phòng.

Tuy nhiên, bước tiếp theo của nghiên cứu này chỉ đơn giản là cho phần mềm này chơi khi có nhiều hơn một đối thủ. Cả hai AI này hiện tại mới được thiết kế dành cho các trận đối đầu một một, việc bổ sung thêm người chơi trên bàn sẽ làm gia tăng tính phức tạp và nâng cao thách thức điện toán.