เว็บตรง / บาคาร่าเว็บตรง โมเดลแมชชีนเลิร์นนิงที่ตรวจพบ COVID-19 จากการเอ็กซ์เรย์ทรวงอกไม่เหมาะสำหรับการใช้งานทางคลินิก

เว็บตรง / บาคาร่าเว็บตรง โมเดลแมชชีนเลิร์นนิงที่ตรวจพบ COVID-19 จากการเอ็กซ์เรย์ทรวงอกไม่เหมาะสำหรับการใช้งานทางคลินิก

เว็บตรง / บาคาร่าเว็บตรง ปีที่แล้ว ชุมชนวิทยาศาสตร์ได้สร้างแบบจำลองแมชชีนเลิร์นนิงและระบบปัญญาประดิษฐ์อื่นๆเพื่อระบุโควิด-19 บนภาพเอ็กซ์เรย์ทรวงอกและ CT นักวิจัยบางคนไม่มั่นใจในผลลัพธ์: แบบจำลองระบุพยาธิสภาพของ COVID-19 หรือไม่ หรือพวกเขาตัดสินใจโดยอิงจากปัจจัยที่ทำให้สับสน เช่น ลูกศร และลักษณะอื่นๆ ที่ไม่เกี่ยวข้องทางการแพทย์

เพื่อตอบคำถามนี้ นักศึกษาแพทย์สองคนที่ทำงาน

เพื่อปริญญาเอกด้านวิทยาการคอมพิวเตอร์ในห้องทดลองของ Su-In Leeที่มหาวิทยาลัย Washington ได้ทำการตรวจสอบแบบจำลองแมชชีนเลิร์นนิง (ML) หลายร้อยตัวที่มีจุดประสงค์เพื่อจำแนกรังสีเอกซ์ทรวงอกเป็นเชื้อโควิด-19 หรือโควิด-19 เชิงลบ รายงานผลการตรวจสอบในNature Machine Intelligence

ปัญหาการเลื่อนโดเมนนักวิจัยของ University of Washington ต้องการทราบว่าแบบจำลอง ML ที่เผยแพร่นั้นเป็นแบบทั่วไปหรือไม่ แบบจำลอง ML ทั่วไปที่จำแนกได้จะจำแนกการเอ็กซ์เรย์ทรวงอกเป็นโควิด-19 เชิงบวก หรือโควิด-19 เชิงลบ อย่างถูกต้อง ไม่ว่าเอ็กซ์เรย์ทรวงอกจะมาจากไหน แบบจำลองที่ไม่สามารถอธิบายได้ทั่วไปจะทำงานได้ไม่ดี เช่น เมื่อเห็นการเอ็กซ์เรย์ทรวงอกที่ได้รับจากโรงพยาบาลอื่น

นักวิทยาศาสตร์คอมพิวเตอร์เรียกการเปลี่ยนแปลงโดเมนประสิทธิภาพที่ลดลงนี้ โมเดล ML ที่ได้รับผลกระทบจากการเลื่อนโดเมนจะเกิดขึ้นในเวลาไม่กี่นาที ความแตกต่างอย่างเป็นระบบระหว่างชุดข้อมูลที่มีความแข็งแกร่งและชัดเจนสำหรับโมเดลมากกว่าสัญญาณบ่งชี้ที่ละเอียดอ่อนของการติดเชื้อ COVID-19 จากนั้น โมเดล ML เหล่านี้จึงนำการเรียนรู้แบบลัดมาใช้ การฝึกอบรมเกี่ยวกับตัวสร้างความสับสน เช่น ลูกศรและป้ายกำกับข้อความ และสร้างการเชื่อมโยงที่หลอกลวงซึ่งเกิดขึ้นได้แม้ในขณะที่โมเดลได้รับการฝึกอบรมและทดสอบในชุดข้อมูลอื่นๆ

ด้วยวิธีนี้ โมเดล ML ที่ใช้การเรียนรู้แบบช็อตคัต

จะแสดงให้เห็นการเปลี่ยนแปลงของโดเมนและจะไม่สามารถทำให้เป็นแบบทั่วไปได้ ในขณะที่แบบจำลอง ML ที่อาศัยคุณลักษณะที่เกี่ยวข้องทางการแพทย์ในการตัดสินใจ มีแนวโน้มที่จะทำให้เป็นแบบทั่วไปได้ และรักษาประสิทธิภาพการทำงานข้ามชุดข้อมูล

การตรวจสอบรูปแบบการเรียนรู้ของเครื่อง

แม้ว่าแบบจำลอง ML ที่ออกแบบมาเพื่อจำแนกประเภทของรังสีเอกซ์ทรวงอกมักจะใช้สถาปัตยกรรม วิธีการฝึกอบรม และรูปแบบการเพิ่มประสิทธิภาพที่คล้ายคลึงกัน แต่อุปสรรคแรกที่นักวิจัยของ University of Washington เผชิญคือการสร้างแบบจำลอง ML ที่เผยแพร่ขึ้นใหม่

“แบบจำลองอาจแตกต่างกันไปในทางที่ละเอียดอ่อน…และแทนที่จะแจกจ่ายแบบจำลองที่ได้รับการฝึกอบรม นักวิจัยจะให้คำแนะนำเกี่ยวกับวิธีการสร้างแบบจำลองของพวกเขา” Alex DeGraveผู้เขียนร่วมคนแรกในการศึกษาของมหาวิทยาลัยวอชิงตันกล่าว “มีโมเดลมากมายที่คุณสามารถออกจากชุดทิศทางนั้นได้เนื่องจากการสุ่มในกระบวนการฝึกอบรม [model]”

เพื่อสะท้อนถึงความผันแปรที่อาจเกิดขึ้นระหว่างการฝึกอบรม DeGrave และJoseph Janizek ผู้เขียนร่วมคนแรก พร้อมด้วยที่ปรึกษาและผู้เขียนอาวุโสSu-In Leeได้ออกแบบตัวแทนโมเดล ML ของตัวอย่างที่ได้รับการแนะนำในการศึกษาหลายสิบครั้ง และจากนั้นจึงทำการปรับเปลี่ยนเล็กน้อยใน โมเดลตัวแทน ในที่สุดพวกเขาก็สร้างและตรวจสอบแบบจำลองหลายร้อยแบบและจำแนกประเภทของเอ็กซ์เรย์ทรวงอกนับพัน

มันคือ COVID-19 หรือแค่ลูกศร?

หลังจากแนะนำแบบจำลองของตนกับชุดข้อมูลใหม่และสังเกตประสิทธิภาพการจำแนกที่ลดลงซึ่งบ่งชี้ถึงการเปลี่ยนแปลงโดเมนและการเรียนรู้ทางลัด นักวิจัยจึงตัดสินใจระบุทางลัดด้วยตนเอง นี่เป็นเรื่องที่ท้าทายเพราะการตัดสินใจของโมเดล ML มาจาก “กล่องดำ” – วิธีการที่โมเดลเหล่านี้ทำการตัดสินใจในการจัดหมวดหมู่นั้นไม่เป็นที่รู้จักแม้แต่นักออกแบบโมเดล

DeGrave และ Janizek แยกส่วน “กล่องดำ” นี้ออกด้วยแผนที่เด่นที่เน้นบริเวณที่แบบจำลองเห็นว่าสำคัญ โดยใช้วิธีการกำเนิดที่แปลงภาพและโดยการแก้ไขภาพด้วยตนเอง แผนที่ความเด่นบางแผนที่แสดงให้เห็นพื้นที่ที่เกี่ยวข้องทางการแพทย์ เช่น ปอด ในขณะที่แผนที่อื่นๆ ชี้ไปที่ข้อความหรือลูกศรบนรูปภาพ หรือที่มุมของรูปภาพ ซึ่งบ่งชี้ว่าแบบจำลอง ML ได้เรียนรู้และตัดสินสถานะ COVID-19 ตามคุณสมบัติเหล่านี้มากกว่าพยาธิวิทยา

เพื่อตรวจสอบผลลัพธ์เหล่านี้ นักวิจัยได้ใช้วิธีการกำเนิดเพื่อทำให้การเอ็กซ์เรย์ทรวงอกที่เป็นลบของโควิด-19 ดูเหมือนเอ็กซ์เรย์ทรวงอกที่เป็นบวกของโควิด-19 และในทางกลับกัน

“เราพบว่าหากเรากลับไปและป้อนรูปภาพ [ที่ดัดแปลง] เหล่านี้ลงในเครือข่ายดั้งเดิมที่เรากำลังตรวจสอบ โดยปกติแล้วจะหลอกเครือข่ายเหล่านั้นให้คิดว่าเป็นรูปภาพจากคลาสตรงข้าม” DeGrave อธิบาย “นั่นหมายความว่าสิ่งที่เครือข่ายกำเนิดเหล่านี้กำลังเปลี่ยนแปลงเป็นสิ่งที่เครือข่ายที่เรากำลังตรวจสอบอยู่”

นักวิจัยพบอีกครั้งว่าประสิทธิภาพของแบบจำลองขึ้นอยู่กับเครื่องหมายข้อความเมื่อพวกเขาสลับข้อความที่เขียนเป็นคู่ของรูปภาพ (เอ็กซ์เรย์ทรวงอก COVID-19 หนึ่งตัวและเอ็กซ์เรย์ทรวงอกที่ลบ COVID-19 หนึ่งตัว) การทดลองของนักวิจัยยังเปิดเผยว่าสถาปัตยกรรมแบบจำลองมีผลกระทบต่อประสิทธิภาพของแบบจำลองเพียงเล็กน้อย

“งานวรรณกรรมมีจุดเน้นมากมาย ฉันคิดว่า ‘เรามีสถาปัตยกรรมใหม่ที่อร่อยที่สุดและน่าสนใจที่สุด’ เราพบว่าจริงๆ แล้วมีผลกระทบจำกัด…ในขณะที่การทำงานกับข้อมูล และการเปลี่ยนแปลงข้อมูล การรวบรวมข้อมูลที่ดีขึ้น มีผลกระทบอย่างมาก” Janizek กล่าว

การสร้างและตรวจสอบระบบ AI ที่น่าเชื่อถือผลลัพธ์ของนักวิจัยชี้ให้เห็นถึงแรงโน้มถ่วงของการเรียนรู้แบบลัด พวกเขายังชี้ให้เห็นถึงความต้องการปัญญาประดิษฐ์ที่อธิบายได้ ซึ่งกำหนดให้การตัดสินใจของแบบจำลอง ML นั้นมนุษย์สามารถเข้าใจและติดตามได้ในอนาคต เว็บตรง / บาคาร่าเว็บตรง