Prisoner’s Dilemma อาจมีในเกมกลยุทธ์ ก็ได้

มีคน เอาผลงานของ John Nash ​ผู้​เป็น​ปรมาจารย์​เรื่อง​ Game Theory มาทำ​เป็น​หนังเรื่อง A Beautiful Mind ไปแล้ว
คราวนี้ไม่รู้ว่าถูกนำมาใช้ใน Reality เกมกลยุทธ์ บ้างหรือเปล่านะครับ แต่ใครที่สนใจจะสมัครก้ไปทำการบ้านไว้บ้างก็ดี เพราะถ้าเล่นเกม อย่าง Game Theory แล้วจะไม่หยิบ Prisoner’s Dilemma ซึ่งเป็น Game Theory ต้นๆของ John Nash ก้กระไรอยู่
เหมือนไม่ให้เกียรติเจ้าของผลงานที่นำมาใช้

เกมส์นี้ถ้าว่าไปแล้วเป็นเกมส์หนึ่งใน Game Theory ซึ่งเป็นศาสตร์หนึ่งในวิชาเศรษฐศาสตร์ เกมส์พวกหมากรุกหมากฮอตก็เข้าข่าย Game Theory เหมือนกันนะครับ แต่เนื่องจาก Prisoner’s Dilemma เป็นเกมส์ที่มีกติกาเรียบง่าย สามารถจำลองสถานการเล่นในห้องเรียนได้สะดวก ดังนั้นเกมส์นี้ถ้าเปรียบเทียบไป มันก็คือ Hello, World ของ Game Theory นั่นเอง

เกมส์นี้คิดค้นกันมากว่า 50 ปีแล้วครับ ดูเหมือนจะเป็นเกมส์ง่ายๆ ที่ไม่สามารถยึดหลักอะไรได้เลย คุณตอบได้เพียงว่าจะร่วมมือโดยการปฏิเสธทุกข้อกล่าวหา (Cooperate) หรือกล่าวหาเพื่อนของคุณเลยว่าเป็นคนผิด (Defect) แถมยังต้องเล่นพร้อมกัน การเลือกในอดีตไม่ส่งผลในตาปัจจุบัน

แม้กติกาดูน้อยเกินไปที่จะไปหาหลักการ แต่จริงๆ แล้วเรื่องนี้ซับซ้อนพอสมควรจนมีทฤษฎีในการเล่น พวกนี้เรียกว่า Algorithm

​โจทย์ต้น​ฉบับ​นั้น​เป็น​เรื่องติดคุก​ ​ถ้า​ใครติดน้อยที่สุดก็ชนะ​ ​แต่สมมุติว่าเรา​ปรับตัวเลข​ให้​เป็น​บวก​ ​
ใคร​ใด้​คะ​แนนสูงสุดคน​นั้น​ชนะ​ ​จะ​ทำ​ให้​เข้า​ใจ​ได้​ง่ายกว่า​ ​ผมลองเปลี่ยนตัวเลข​เป็น​ดังนี้

​ผู้​เล่นคนแรก​ Cooperate คนที่​ 2 Cooperate แบบนี้​ ​คนแรก​ได้ 3 คะ​แนน​ ​คนที่​ 2 ก็​ได้​ 3 คะ​แนน
​ผู้​เล่นคนแรก​ Cooperate คนที่​ 2 Defect แบบนี้​ ​คนแรก​ได้​ 0 คะ​แนน​ ​คนที่​ 2 ได้​ 5 คะ​แนน
​ผู้​เล่นคนแรก​ Defect คนที่​ 2 Cooperate แบบนี้​ ​คนแรก​ได้​ 5 คะ​แนน​ ​คนที่​ 2 ได้​ 0 คะ​แนน
​ผู้​เล่นคนแรก​ Defect คนที่​ 2 Defect แบบนี้​ ​ได้​ไปคนละ​ 1 คะ​แนน

​ถ้า​กติกา​เป็น​แบบข้างบน​ ​คุณว่า​เล่นแบบปลอดภัยคุณควร​จะ​เลือก​ Cooperate หรือ​ Defect คำ​ตอบก็​ไม่​ยากครับ​ ​จุดสมดุล​อยู่​ที่คนแรกควรเลือก​ Defect ส่วน​คนที่​ 2 เมื่อคนแรกเลือก​ Defect แล้ว​ ​ตัวเอง​ต้อง​เลือก​ Cooperate ​เพื่อ​ให้​ตนเอง​ได้​ 1 ซึ่ง​ดีกว่า​ไม่​ได้​เลย​ ​แต่​เมื่อ​ต้อง​เล่นพร้อม​กัน​ ​ดัง​นั้น​จึง​ควรเลือก​ Defect ครับ

​จุดสมดุลที่ผมกล่าว​ถึง​นั้น​ ​เรา​เรียกว่า​ Nash Equilibrium (พหูพจน์คือ​ Nash Equilibria) ซึ่ง​คิด​ค้น​โดย​ John Nash ​นักเศรษฐศาสตร์รางวัลโนเบิล​ ​หลักการหา​ ​ก็​ใช้​วิธีการสร้าง​ Game Tree จาก​นั้น​ก็ตัดทางที่​ได้​รับผลประ​โยชน์น้อยออก​ (Dominanted Strategy) ซึ่ง​ Game Tree ตัวนี้​เอง​เป็น​รากฐานของ​ MiniMax ซึ่ง​เป็น​ Algorithm ที่​ใช้​ใน​การเดินหมากกระดานต่างๆ

ผมกำลังค้นคว้า Algorithm ในการเล่น เช่น Pavlov, STFT, TF2T อื่นๆอยู่ ถ้าเจอจะนำมาเล่าอีกครับ

……………………………………………………………………………………………………………………………………….