เว็บตรงเรียนรู้ตลอดชีวิต

เว็บตรงเรียนรู้ตลอดชีวิต

ประเภทของการฝึกอบรม AI ที่โปรแกรมเมอร์ทดสอบในเว็บตรง StarCraft และ StarCraft II มีวัตถุประสงค์เพื่อช่วยให้ทีม AI เชี่ยวชาญงานเดียว เช่น การประสานงานสัญญาณไฟจราจรหรือโดรน เกม StarCraft นั้นยอดเยี่ยมสำหรับสิ่งนั้น เพราะสำหรับส่วนที่เคลื่อนไหวทั้งหมด เกมนั้นค่อนข้างตรงไปตรงมา: ผู้เล่นแต่ละคนมีเป้าหมายเดียวในการเอาชนะคู่ต่อสู้ แต่ถ้าปัญญาประดิษฐ์จะมีความอเนกประสงค์และเหมือนมนุษย์มากขึ้น โปรแกรมจะต้องสามารถเรียนรู้เพิ่มเติมและรับทักษะใหม่ ๆ อย่างต่อเนื่อง

“ระบบทั้งหมดที่เราเห็นในตอนนี้ที่เล่น Go และหมากรุก

 — โดยพื้นฐานแล้วพวกเขาได้รับการฝึกฝนให้ทำงานชิ้นนี้ได้ดี และจากนั้นก็ได้รับการแก้ไขเพื่อไม่ให้เปลี่ยนแปลง” Risi กล่าว ระบบการเล่นแบบ Go-playing ที่นำเสนอด้วยตารางขนาด 18 x 18 แทนที่จะเป็นกระดานเกมมาตรฐานขนาด 19 x 19 อาจต้องได้รับการฝึกอบรมใหม่ทั้งหมดบนกระดานใหม่ Risi กล่าว การเปลี่ยนคุณสมบัติของหน่วย StarCraft จะต้องมีการฝึกอบรมแบบ back-to-square-one แบบเดียวกัน อาณาจักร Minecraft ที่เหมือนเลโก้กลายเป็นสถานที่ที่ดีกว่าสำหรับแนวทางการทดสอบเพื่อทำให้ AI ปรับตัวได้มากขึ้น 

ในสภาพแวดล้อมต่างๆ ที่ประกอบด้วยบล็อกสามมิติ ผู้เล่น Minecraft สามารถสร้างโครงสร้างและสำรวจสภาพแวดล้อมได้ (ตัวอย่างด้านบน)

 CHRISTOPH SALGE และคณะ / PROC. ของอินเตอร์เนทครั้งที่ 13 ประชุม บนรากฐานของดิจิทัลเกมส์ 2018

Minecraft ไม่เหมือนกับ StarCraft ไม่มีภารกิจเดียวให้ผู้เล่นทำสำเร็จ ในโลกเสมือนจริงที่สร้างจากดิน แก้ว และวัสดุอื่นๆ สามมิตินี้ ผู้เล่นจะรวบรวมทรัพยากรเพื่อสร้างโครงสร้าง เดินทาง ออกล่าหาอาหาร และทำอะไรก็ได้ตามใจชอบ Caiming Xiong นักวิจัยด้านปัญญาประดิษฐ์ที่ Salesforce บริษัท

ซอฟต์แวร์ในซานฟรานซิสโก 

และเพื่อนร่วมงานใช้สิ่งปลูกสร้างที่เรียบง่ายซึ่งเต็มไปด้วยบล็อกใน Minecraft เพื่อทดสอบ AI ที่ออกแบบมาเพื่อเรียนรู้อย่างต่อเนื่อง

แทนที่จะมอบหมายให้ AI เรียนรู้งานเดียวผ่านการลองผิดลองถูกในการเรียนรู้แบบเสริมกำลัง ทีมของ Xiong กลับเซการศึกษาของ AI นักวิจัยได้ชี้นำ AI ผ่านความท้าทายในการเรียนรู้การเสริมแรงที่ยากขึ้นเรื่อยๆ ตั้งแต่การค้นหาบล็อกเฉพาะไปจนถึงการซ้อนบล็อก AI ได้รับการออกแบบมาเพื่อแบ่งความท้าทายออกเป็นขั้นตอนที่ง่ายกว่า มันสามารถจัดการกับแต่ละขั้นตอนโดยใช้ความเชี่ยวชาญเก่าหรือลองสิ่งใหม่ เมื่อเทียบกับ AI อื่นที่ไม่ได้ออกแบบมาเพื่อใช้ความรู้เดิมเพื่อแจ้งประสบการณ์การเรียนรู้ใหม่ AI ของทีม Xiong ได้พิสูจน์การศึกษาที่เร็วกว่ามาก

AI ที่สะสมความรู้ยังปรับให้เข้ากับสถานการณ์ใหม่ได้ดีขึ้นอีกด้วย Xiong และเพื่อนร่วมงานได้สอน AI ทั้งสองถึงวิธีการเก็บบล็อก ในขณะที่ฝึกในห้องธรรมดาที่มีเพียงหนึ่งบล็อก AI ทั้งสองได้รับทักษะ “รวบรวมไอเท็ม” ลง แต่ในห้องที่มีหลายบล็อก AI แบบแยกภารกิจพยายามดิ้นรนเพื่อระบุเป้าหมายและคว้าบล็อกที่ถูกต้องเพียง 29 เปอร์เซ็นต์ของเวลาทั้งหมดเว็บตรง / บาคาร่าเว็บตรง