الخميس _26 _يونيو _2025AH

ابق على اطلاع مع التحديثات المجانية

سمع أحد أقاربي بعض القصص الغريبة عند العمل على خط مساعدة للرعاية الصحية خلال جائحة Covid. كانت وظيفتها هي مساعدة المتصلين على إكمال اختبارات التدفق الجانبي السريع التي استخدمت ملايين المرات أثناء القفل. لكن بعض المتصلين كانوا في حيرة من أمره من خلال الإجراء. “لذلك ، لقد شربت السائل في الأنبوب. ماذا أفعل الآن؟” طلب واحد.

قد يكون هذا الارتباك المستخدم مثالًا متطرفًا لمشكلة تكنولوجية شائعة: كيف يمكن للأشخاص العاديين استخدام منتج أو خدمة في العالم الحقيقي قد يختلف بشكل كبير عن نوايا المصممين في المختبر.

في بعض الأحيان يمكن أن يكون سوء الاستخدام متعمدًا ، للأفضل أو للأسوأ. على سبيل المثال ، حاول مراسلو منظمة الحملات الحملات بدون حدود حماية حرية التعبير في العديد من البلدان الاستبدادية من خلال إخفاء المحتوى المحظور على ماين كرافت خادم ألعاب الفيديو. في هذه الأثناء ، يستخدم المجرمون طابعات ثلاثية الأبعاد لتصنيع الأسلحة التي لا يمكن تعقبها. في كثير من الأحيان ، رغم ذلك ، سوء الاستخدام غير مقصود ، كما هو الحال مع اختبارات covid. نسميها مشكلة سوء الاستخدام غير المقصودة ، أو “IMP” لفترة قصيرة. قد تكون gremlins الجديدة في الآلات هي IMPS في chatbots.

خذ الغرض العام chatbots ، مثل chatgpt ، والتي يتم استخدامها من قبل 17 في المائة من الأميركيين مرة واحدة على الأقل في الشهر إلى المخاوف الصحية للتشخيص الذاتي. هذه الدردشة لديها قدرات تكنولوجية مذهلة كانت تبدو وكأنها السحر قبل بضع سنوات. فيما يتعلق بالمعرفة السريرية والفرز وتلخيص النص والاستجابات لأسئلة المريض ، يمكن أن تتطابق أفضل النماذج الآن للأطباء البشريين ، وفقًا للاختبارات المختلفة. قبل عامين ، على سبيل المثال ، استخدمت الأم في بريطانيا ChatGpt بنجاح لتحديد متلازمة الحبل المربوطة (المتعلقة بـ Spina Bifida) في ابنها الذي فاته 17 طبيبًا.

هذا يثير احتمال أن تصبح هذه الدردشة في يوم من الأيام “الباب الأمامي” الجديد لتسليم الرعاية الصحية ، مما يحسن الوصول بتكلفة أقل. هذا الأسبوع ، وعد ويس ستريت ، وزير الصحة في المملكة المتحدة ، بترقية تطبيق NHS باستخدام الذكاء الاصطناعي لتوفير “طبيب في جيبك لإرشادك من خلال رعايتك”. لكن الطرق التي يمكن من خلالها استخدامها ليست هي نفس الطريقة التي يتم بها استخدامها بشكل شائع. أبرزت دراسة حديثة بقيادة معهد أوكسفورد للإنترنت بعض العيوب المثيرة للقلق ، حيث يكافح المستخدمون لاستخدامها بفعالية.

قام الباحثون بتسجيل 1،298 مشاركًا في تجربة عشوائية محكومة لاختبار مدى استطاعتهم استخدام مجموعات الدردشة للرد على 10 سيناريوهات طبية ، بما في ذلك الصداع الحاد والعظام المكسورة والالتهاب الرئوي. طُلب من المشاركين تحديد الحالة الصحية وإيجاد مسار عمل موصى به. تم استخدام ثلاثة chatbots: Openai's GPT-4O و Meta's Llama 3 و Cohere's Command R+، والتي لها خصائص مختلفة قليلاً.

عندما تم إدخال سيناريوهات الاختبار مباشرة في نماذج الذكاء الاصطناعي ، حددت chatbots بشكل صحيح الشروط في 94.9 في المائة من الحالات. ومع ذلك ، فإن المشاركين قد سوءون: لقد قدموا معلومات غير مكتملة وغالبًا ما أساءت الدردشة تفسير مطالباتهم ، مما أدى إلى انخفاض معدل النجاح إلى 34.5 في المائة فقط. لم تتغير القدرات التكنولوجية لهذه النماذج ، لكن المدخلات البشرية لم تتغير ، مما أدى إلى مخرجات مختلفة للغاية. والأسوأ من ذلك ، أن المشاركين في الاختبار تفوقت أيضًا من قبل مجموعة مراقبة ، لم تتمكن من الوصول إلى محركات الدردشة ولكنهم استشاروا محركات البحث العادية بدلاً من ذلك.

نتائج هذه الدراسات لا تعني أننا يجب أن نتوقف عن استخدام chatbots للحصول على المشورة الصحية. ولكن هذا يشير إلى أنه يجب على المصممين إيلاء المزيد من الاهتمام لكيفية استخدام الأشخاص العاديين خدماتهم. “يميل المهندسون إلى الاعتقاد بأن الناس يستخدمون التكنولوجيا خطأ. أي عطل مستخدم هو لذلك خطأ المستخدم. لكن التفكير في المهارات التكنولوجية للمستخدم أمر أساسي للتصميم” ، هذا ما يقوله لي مؤسس شركة منظمة العفو الدولية. هذا صحيح بشكل خاص مع المستخدمين الذين يبحثون عن مشورة طبية ، قد يكون الكثير منهم يائسين أو مريضين أو كبار السن الذين يظهرون علامات تدهور عقلي.

قد تساعد المزيد من الدردشة المتخصصة للرعاية الصحية. ومع ذلك ، وجدت دراسة حديثة لجامعة ستانفورد أن بعض برامج الدردشة العلاجية المستخدمة على نطاق واسع ، والتي تساعد في مواجهة تحديات الصحة العقلية ، يمكنها أيضًا “تقديم التحيزات والفشل التي قد تؤدي إلى عواقب خطيرة”. يقترح الباحثون أنه ينبغي تضمين المزيد من الدرابزين لتحسين مطالبات المستخدم ، وطلب المعلومات بشكل استباقي لتوجيه التفاعل والتواصل بشكل أكثر وضوحًا.

يجب على شركات التكنولوجيا ومقدمي الرعاية الصحية أيضًا إجراء المزيد من اختبارات المستخدمين في ظروف العالم الحقيقي لضمان استخدام نماذجها بشكل مناسب. تطوير التقنيات القوية شيء واحد ؛ تعلم كيفية نشرها بفعالية هو شيء آخر تمامًا. احذر من IMPS.

john.thornhill@ft.com

شاركها.
اترك تعليقاً

Exit mobile version