เว็บสล็อตออนไลน์อาเขตการศึกษา

เว็บสล็อตออนไลน์อาเขตการศึกษา

เมื่อ AlphaStar เข้าร่วม Wünsch AI เล่น StarCraft II เว็บสล็อตออนไลน์เหมือนกับที่มนุษย์ทำ: มันทำตัวเหมือนเชิดหุ่นคนเดียวที่ควบคุมตัวละครทั้งหมดในกองเรือได้อย่างสมบูรณ์ แต่มีหลายสถานการณ์ในโลกแห่งความเป็นจริงที่อาศัย AI ผู้บงการเพียงคนเดียวในการจัดการอุปกรณ์จำนวนมากจะกลายเป็นเทอะทะ Jakob Foerster นักวิจัยด้านปัญญาประดิษฐ์จาก Facebook AI Research ในซานฟรานซิสโกกล่าว

ลองนึกถึงการดูแลหุ่นยนต์พยาบาลหลายสิบตัว

ที่ดูแลผู้ป่วยทั่วทั้งโรงพยาบาล หรือรถบรรทุกที่ขับเคลื่อนด้วยตนเองซึ่งควบคุมความเร็วของพวกมันข้ามทางหลวงหลายไมล์เพื่อลดปัญหาคอขวดของการจราจร ดังนั้น นักวิจัยรวมถึง Foerster กำลังใช้เกม StarCraft เพื่อลองใช้รูปแบบ “หลายตัวแทน” ที่แตกต่างกัน

ในการออกแบบบางหน่วยรบแต่ละหน่วยมีความเป็นอิสระบางส่วน แต่ยังคงยึดถือผู้ควบคุมจากส่วนกลาง ในการตั้งค่านี้ AI ผู้ดูแลจะทำหน้าที่เหมือนโค้ชตะโกนจากข้างสนาม โค้ชสร้างแผนภาพรวมและออกคำแนะนำให้กับสมาชิกในทีม แต่ละหน่วยใช้คำแนะนำนั้น ควบคู่ไปกับข้อสังเกตโดยละเอียดเกี่ยวกับสภาพแวดล้อมในบริเวณใกล้เคียง เพื่อตัดสินใจว่าจะดำเนินการอย่างไร นักวิทยาศาสตร์คอมพิวเตอร์ Yizhou Wang จากมหาวิทยาลัยปักกิ่งในประเทศจีนและเพื่อนร่วมงานรายงานประสิทธิภาพของการออกแบบนี้ในบทความที่ส่งไปยังธุรกรรมของ IEEE บนเครือข่ายประสาทและระบบการเรียนรู้

กลุ่มของ Wang ฝึกฝนทีม AI ใน StarCraft โดยใช้การเรียนรู้แบบเสริมแรง ซึ่งเป็นประเภทของการเรียนรู้ของเครื่องที่ระบบคอมพิวเตอร์จะรวบรวมทักษะโดยการโต้ตอบกับสิ่งแวดล้อมและรับรางวัลเสมือนจริงหลังจากทำสิ่งที่ถูกต้อง เพื่อนร่วมทีมแต่ละคนจะได้รับรางวัลตามจำนวนศัตรูที่ถูกกำจัดในบริเวณใกล้เคียง และไม่ว่าทั้งทีมจะชนะกองยานที่ควบคุมโดยคู่ต่อสู้อัตโนมัติที่สร้างขึ้นในเกมหรือไม่ ในการท้าทายที่แตกต่างกันหลายอย่างกับทีมที่มีหน่วยรบอย่างน้อย 10 หน่วย ทีม AI ที่นำทางโดยโค้ชจะชนะ 60 ถึง 82 เปอร์เซ็นต์ของเวลาทั้งหมด ทีม AI ที่ควบคุมจากส่วนกลางซึ่งไม่มีความสามารถในการให้เหตุผลอย่างอิสระนั้นประสบความสำเร็จน้อยกว่าเมื่อเทียบกับคู่ต่อสู้ในตัว

ทีมงาน AI ที่มีผู้บัญชาการสูงสุดเพียงคนเดียว

ที่ออกแรงควบคุมอย่างน้อยบางส่วนในแต่ละหน่วยอาจทำงานได้ดีที่สุดเมื่อกลุ่มสามารถพึ่งพาการสื่อสารที่รวดเร็วและแม่นยำระหว่างตัวแทนทั้งหมด ตัวอย่างเช่น ระบบนี้สามารถทำงานกับหุ่นยนต์ภายในคลังสินค้าเดียวกันได้

ในคลิปนี้จากวิดีโอเกม Starcraft II ผู้เล่น StarCraft II มืออาชีพ Dario Wünsch ซึ่งเล่นเป็น “LiquidTLO” ถูกครอบงำโดยปัญญาประดิษฐ์ AlphaStar ซึ่งสร้างความเสียหายให้กับฐานของ Wünsch ผู้สร้าง AI ที่ DeepMind เชียร์ขณะที่ AI แสดงความเหนือกว่า Wünsch ก้าวขึ้นมาอย่างก้าวกระโดดเมื่อ AlphaStar เอาชนะเขาได้ 5 นัดต่อ 0

แต่สำหรับเครื่องจักรจำนวนมาก เช่น รถยนต์ที่ขับเคลื่อนด้วยตัวเองหรือฝูงโดรนที่แผ่กระจายไปทั่วระยะทางกว้างไกล อุปกรณ์ที่แยกจากกัน “จะไม่มีการเชื่อมต่อข้อมูลที่สม่ำเสมอ เชื่อถือได้ และรวดเร็วกับคอนโทรลเลอร์เพียงตัวเดียว” Foerster กล่าว มันคือ AI ทุกตัวสำหรับตัวมันเอง โดยทั่วไปแล้ว AI ที่ทำงานภายใต้ข้อจำกัดเหล่านี้จะไม่สามารถประสานงานได้เช่นเดียวกับทีมที่รวมศูนย์ แต่ Foerster และเพื่อนร่วมงานได้คิดค้นแผนการฝึกอบรมเพื่อเตรียมเครื่องจักรที่มีความคิดอิสระเพื่อทำงานร่วมกัน

ในระบบนี้ ผู้สังเกตการณ์แบบรวมศูนย์จะให้ข้อเสนอแนะแก่เพื่อนร่วมทีมระหว่างการเรียนรู้แบบเสริมกำลัง แต่เมื่อกลุ่มได้รับการฝึกฝนอย่างเต็มที่แล้ว AIs ก็เป็นของตัวเอง ตัวแทนหลักไม่เหมือนโค้ชที่ถูกกีดกันและเป็นเหมือนครูสอนเต้นรำที่นำเสนอนักบัลเล่ต์ในระหว่างการซ้อม แต่ยังคงเป็นแม่ระหว่างการแสดงบนเวที

ผู้ดูแล AI เตรียม AI แต่ละตัวให้พอเพียงโดยเสนอคำแนะนำส่วนบุคคลในระหว่างการฝึกอบรม หลังจากการทดลองใช้แต่ละครั้ง ผู้ดูแลจะจำลองทางเลือกที่เป็นไปได้ในอนาคตและบอกเจ้าหน้าที่แต่ละคนว่า “นี่คือสิ่งที่เกิดขึ้นจริง และนี่คือสิ่งที่จะเกิดขึ้นถ้าทุกคนทำแบบเดียวกัน แต่คุณทำสิ่งที่แตกต่างออกไป” วิธีนี้ซึ่งทีมของ Foerster นำเสนอในนิวออร์ลีนส์ในเดือนกุมภาพันธ์ 2018 ที่การประชุม AAAI Conference on Artificial Intelligence ช่วยให้หน่วย AI แต่ละหน่วยตัดสินว่าการกระทำใดช่วยหรือขัดขวางความสำเร็จของกลุ่ม

เพื่อทดสอบเฟรมเวิร์กนี้ Foerster และเพื่อนร่วมงานได้ฝึกอบรมหน่วย AI สามกลุ่มจากห้าหน่วยใน StarCraft หน่วยที่ได้รับการฝึกอบรมต้องดำเนินการตามการสังเกตสภาพแวดล้อมในบริเวณใกล้เคียงเท่านั้น ในรอบการสู้รบกับทีมที่เหมือนกันซึ่งได้รับคำสั่งจากคู่ต่อสู้ที่ไม่ใช่มนุษย์ที่มีอยู่ภายใน กลุ่ม AI ทั้งสามกลุ่มจะชนะเกือบทุกรอบ โดยทำผลงานได้ดีพอๆ กับทีม AI ที่ควบคุมจากส่วนกลาง 3 ทีมในสถานการณ์การต่อสู้เดียวกันสล็อตออนไลน์