วิจัยฮาร์วาร์ดชี้ AI วินิจฉัยเคสฉุกเฉิน 'แม่นยำเท่าหมอ' แต่ยังแทนมนุษย์ไม่ได้


วิจัยฮาร์วาร์ดพบ AI วินิจฉัยเคสฉุกเฉินแม่นยำเทียบเท่าหมอ โดยเฉพาะช่วงคัดกรองที่ข้อมูลจำกัด แต่ผู้เชี่ยวชาญย้ำ 'ยังแทนมนุษย์ไม่ได้' เพราะต้องใช้การตัดสินใจในนาทีชีวิต

งานวิจัยใหม่เผยข้อมูลที่น่าทึ่ง เมื่อลองเอา AI (Large Language Models) ไปทดสอบกับเคสจริงในห้องฉุกเฉิน ผลปรากฏว่ามีโมเดลบางตัวที่สามารถวินิจฉัยโรคได้แม่นยำกว่าคุณหมอจริงๆ ในหลายสถานการณ์

งานวิจัยชิ้นนี้เพิ่งตีพิมพ์ในวารสาร Science เมื่อสัปดาห์ที่ผ่านมา โดยเป็นผลงานของทีมวิจัยจากคณะแพทยศาสตร์ มหาวิทยาลัยฮาร์วาร์ด (Harvard Medical School) ร่วมกับ ศูนย์การแพทย์เบธ อิสราเอล ดีคอนเนส (Beth Israel Deaconess Medical Center) ซึ่งทีมวิจัยชุดนี้ประกอบด้วยทั้งแพทย์และนักวิทยาศาสตร์คอมพิวเตอร์ พวกเขาตั้งใจออกแบบการทดสอบหลายรูปแบบ เพื่อเปรียบเทียบดูว่าโมเดล AI จากค่าย OpenAI จะทำผลงานได้ดีแค่ไหนเมื่อเทียบกับแพทย์ที่เป็นมนุษย์

ทีมวิจัยได้ทดสอบกับเคสจริงของผู้ป่วย 76 รายในห้องฉุกเฉิน โดยนำผลวินิจฉัยของอายุรแพทย์ระดับอาจารย์หมอ 2 ท่าน มาเปรียบเทียบกับผลที่ได้จากโมเดล o1 และ 4o ของ OpenAI เพื่อความเป็นธรรม ผลวินิจฉัยทั้งหมดจะถูกประเมินโดยแพทย์ผู้เชี่ยวชาญอีกชุดหนึ่งแบบ 'ไม่ระบุตัวตน' (Blind Test) เพื่อให้มั่นใจว่าผู้ตัดสินจะไม่รู้ว่าคำตอบนั้นมาจากมนุษย์หรือ AI

ผลการวิจัย ระบุว่า ในทุกช่วงจุดของกระบวนการวินิจฉัย โมเดล o1 มีประสิทธิภาพการทำงานที่ดีกว่าเล็กน้อย หรืออย่างน้อยก็เทียบเท่ากับแพทย์ผู้เชี่ยวชาญทั้ง 2 ท่านและโมเดล 4o พร้อมเสริมว่า ความแตกต่างดังกล่าวเห็นได้ชัดเป็นพิเศษที่กระบวนการคัดแยกผู้ป่วยเบื้องต้นในห้องฉุกเฉิน (Initial ER triage) ซึ่งเป็นจุดที่มีข้อมูลเกี่ยวกับผู้ป่วยน้อยที่สุดและเป็นช่วงที่มีความเร่งด่วนที่สุดในการตัดสินใจให้ถูกต้อง

อย่างไรก็ตาม ในข่าวประชาสัมพันธ์ของคณะแพทยศาสตร์ มหาวิทยาลัยฮาร์วาร์ดเกี่ยวกับงานวิจัยนี้ นักวิจัยเน้นย้ำว่าทีมวิจัยไม่ได้ปรับแต่งหรือเตรียมข้อมูลล่วงหน้าแต่อย่างใด โดยโมเดล AI จะได้รับข้อมูลชุดเดียวกันกับที่มีอยู่ในเวชระเบียนอิเล็กทรอนิกส์ของผู้ป่วย ณ เวลาที่มีการวินิจฉัยจริงในแต่ละครั้ง

ด้วยข้อมูลดังกล่าว โมเดล o1 สามารถให้การวินิจฉัยที่ถูกต้องหรือใกล้เคียงมากกับความจริงในระดับ 67% ของกรณีการคัดแยกผู้ป่วยเทียบกับแพทย์คนหนึ่งที่ให้การวินิจฉัยที่ถูกต้องหรือใกล้เคียง 55% และแพทย์อีกคนหนึ่งที่ให้การวินิจฉัยที่ถูกต้อง 50%

อย่างไรก็ตาม ในข่าวประชาสัมพันธ์ของคณะแพทยศาสตร์ มหาวิทยาลัยฮาร์วาร์ดเกี่ยวกับงานวิจัยนี้ นักวิจัยเน้นย้ำว่าทีมวิจัยไม่ได้ปรับแต่งหรือเตรียมข้อมูลล่วงหน้าแต่อย่างใด โดยโมเดล AI จะได้รับข้อมูลชุดเดียวกันกับที่มีอยู่ในเวชระเบียนอิเล็กทรอนิกส์ของผู้ป่วย ณ เวลาที่มีการวินิจฉัยจริงในแต่ละครั้ง

'อรชุน มันไร' (Arjun Manrai) หัวหน้าห้องปฏิบัติการด้าน AI ของคณะแพทย์ศาสตร์ มหาวิทยาลัยฮาร์วาร์ด และหนึ่งในผู้เขียนหลักของงานวิจัยกล่าวในข่าวประชาสัมพันธ์ว่า ได้ทดสอบโมเดล AI กับเกณฑ์มาตรฐานแทบทุกรูปแบบ และผลลัพธ์ที่ได้นั้นเหนือกว่าทั้งโมเดลรุ่นก่อนหน้า รวมถึงเกณฑ์มาตรฐานของแพทย์ของเรา

อย่างไรก็ตาม เพื่อความชัดเจน งานวิจัยไม่ได้อ้างว่า AI พร้อมที่จะตัดสินใจในสถานการณ์ความเป็นความตายในห้องฉุกเฉินจริง ๆ แล้ว แต่ระบุว่า ผลการศึกษาดังกล่าวแสดงให้เห็นถึงความจำเป็นเร่งด่วนสำหรับการการวิจัยแบบไปข้างหน้า (Prospective Trials) เพื่อประเมินเทคโนโลยีเหล่านี้ในสภาพแวดล้อมการดูแลผู้ป่วยในโลกแห่งความเป็นจริง

นักวิจัยยังตั้งข้อสังเกตอีกว่า การศึกษานี้ตรวจสอบเฉพาะประสิทธิภาพการทำงานของโมเดล AI เมื่อได้รับข้อมูลในรูปแบบที่เป็นเป็นข้อความเท่านั้น และการศึกษาที่มีอยู่ในปัจจุบันบ่งชี้ว่าโมเดลพื้นฐานในตอนนี้ยังมีข้อจำกัดมากกว่าเมื่อต้องให้เหตุผลกับข้อมูลที่ไม่ใช่ข้อความ

'อดัม ร็อดแมน' (Adam Rodman) แพทย์จากศูนย์การแพทย์เบธ อิสราเอลและหนึ่งในผู้เขียนหลักของงานวิจัย ให้สัมภาษณ์กับสำนักข่าวเดอะ การ์เดียน (The Guardian) โดยเตือนว่า ขณะนี้ยังไม่มีกรอบการกำกับดูแลความรับผิดชอบอย่างเป็นทางการเกี่ยวการวินิจฉัยด้วย AI และผู้ป่วยยังคงต้องการแพทย์ที่เป็นมนุษย์ในการเป็นผู้ชี้นำพวกเขาผ่านการตัดสินใจที่เกี่ยวข้องกับความเป็นความตาย รวมถึง การตัดสินใจเกี่ยวกับการรักษาที่ซับซ้อน

ในบทความเกี่ยวกับงานวิจัยนี้ 'คริสเตน แพนธากานี' (Kristen Panthagani) แพทย์เวชศาสตร์ฉุกเฉิน ระบุว่างานวิจัยชิ้นนี้ถือเป็นการศึกษาด้าน AI ที่น่าสนใจ แต่ถูกนำไปพาดหัวข่าวที่เกินความจริงไปอย่างมาก โดยเฉพาะอย่างยิ่งเนื่องจากเป็นการเปรียบเทียบการวินิจฉัยโดย AI กับการวินิจฉัยโดยแพทย์อายุรกรรม ไม่ใช่แพทย์เวชศาสตร์ฉุกเฉินโดยตรง

นอกจากนี้ยังระบุด้วยว่า  ถ้าจะเปรียบเทียบเครื่องมือ AI กับความสามารถทางคลินิกของแพทย์ ก็ควรเริ่มจากการเปรียบเทียบกับแพทย์ที่ทำงานในสาขานั้นจริง ๆ พร้อมเสริมว่า คงไม่แปลกใจถ้า LLM สามารถเอาชนะแพทย์ผิวหนังในการสอบบอร์ดศัลยกรรมประสาทได้ แต่สิ่งนั้นไม่ได้ให้ข้อมูลที่มีประโยชน์มากนัก

แพทย์เวชศาสตร์ฉุกเฉิน รายนี้ ยังให้เหตุผลเพิ่มเติมว่า "ในฐานะแพทย์ห้องฉุกเฉินที่พบคนไข้เป็นครั้งแรก เป้าหมายหลักของตนเองไม่ใช่การเดาการวินิจฉัยขั้นสุดท้าย แต่หลักคือการตรวจสอบว่าผู้ป่วยมีอาการหรือภาวะที่อาจถึงแก่ชีวิตได้หรือไม่มากกว่า"

 

ที่มา : Springnews

วันที่ 12 พ.ค. 2569


ไฟล์เอกสารแนบ
-
ที่มา : springnews
ข้อมูลวันที่ : 2026-05-12 08:57:19
700/1 หมู่ 1 นิคมอุตสาหกรรมอมตะซิตี้ ชลบุรี, ถ.บางนา-ตราด กม. 57, ต.คลองตำหรุ, อ.เมือง, จ.ชลบุรี 20000
038-215033-39, 033-266040-44
Icon made by Freepik from www.flaticon.com