بغداد اليوم - متابعة
نشرت وسائل إعلام، اليوم الخميس (26 كانون الأول 2024)، دراسة تقارن بين تشخيص الذكاء الاصطناعي والأطباء، للحالات المرضية المستعصية.
وكشفت دراسة حديثة أجراها باحثون من كلية الطب بـ"جامعة هارفارد" و"جامعة ستانفورد" أن الذكاء الاصطناعي قد يتفوق على الأطباء في تشخيص الحالات الطبية المعقدة.
وأظهرت النتائج أن نموذج o1-preview تمكن من تشخيص 78.3% من الحالات التي حُللت بدقة. وفي مقارنة مباشرة شملت 70 حالة محددة، ارتفعت دقة النظام إلى 88.6%، متفوقًا بفارق كبير على نظام GPT-4 السابق الذي سجل نسبة قدرها 72.9%.
في المقابل حقق الأطباء المتمرسون درجات عالية في 28 حالة فقط، في حين لم يستطع الأطباء المقيمون (المتدربون) الحصول على الدرجات العالية سوى في 16 حالة.
وفي تعليق له عبر منصة "إكس"، صرح الدكتور آدم رودمان، أحد المشاركين في الدراسة، قائلًا: "إن هذه أول مرة أروّج لمسودة دراسة قبل مراجعتها بالكامل، ولكنني أعتقد أن نتائجنا تحمل انعكاسات كبيرة على الممارسة الطبية، لذا كان من الضروري نشرها سريعًا".
وبرز نموذج الذكاء الاصطناعي o1-preview بنحو خاص في إدارة الحالات الطبية المعقدة التي صممها 25 أخصائيًا لتكون تحديًا للنموذج والأطباء. وعلّق رودمان قائلًا: "واجه البشر صعوبات متوقعة، في حين أظهر النموذج أداءً مذهلًا لا يحتاج إلى إحصائيات لتوضيح تفوقه".
وفي هذه الحالات، سجل النموذج 86% من النقاط، وهو أكثر من ضعف ما حققه الأطباء باستخدام نموذج GPT-4 أو الأدوات التقليدية الأخرى.
وكانت شركة OpenAI قد أعلنت حديثًا إطلاق الإصدار الكامل النهائي o1، بالإضافة إلى الإصدار الجديد o3 الذي أظهر تحسينات كبيرة في التفكير التحليلي، لكن ما زالت هناك انتقادات للنموذج بشأن التكلفة المرتفعة للفحوصات التي يقترحها، وصعوبة تطبيقها في بيئات الرعاية الصحية الفعلية.
وحذر رودمان من المبالغة في التوقعات قائلًا: "إن هذه دراسة معيارية. وهي تستخدم معايير ‘ذهبية’ لتقييم الأطباء البشريين، لكنها لا تعكس واقع الرعاية الطبية. لا تتخلوا عن أطبائكم لصالح o1".
ودعا الباحثون إلى تطوير طرق تقييم أفضل لأنظمة الذكاء الاصطناعي في المجال الطبي تشمل تجارب سريرية واقعية وبنية تحتية تقنية متقدمة لتعزيز التعاون بين الأطباء والذكاء الاصطناعي، بهدف تحقيق استخدام أكثر فعالية في بيئات الرعاية الصحية.