ذكاء اصطناعي

6 طرق لتجنب الإفراط في استخدام خوارزميات التعلم الآلي

- إعلان-

قد تكون عملية تطوير نموذج التعلم الآلي صعبة وتستغرق وقتًا طويلاً. على هذا النحو ، من الأهمية بمكان علماء البيانات لتطوير النماذج مستقرة ودقيقة. 

على الرغم من أن جميع النماذج لن تعمل بشكل جيد على البيانات الجديدة ، إلا أن هناك خطوات يمكنك اتخاذها لتقليل التزود بالخوارزمية التي اخترتها.

1 - فهم مقايضة التباين والتحيز

من الطرق الشائعة التي تتعلم بها خوارزميات التعلم الآلي العلاقات المعقدة بين ميزات الإدخال في مجموعة البيانات الخاصة بك هي ملاءمة منحنى عبر هذه النقاط. ومع ذلك ، نظرًا للقيود المفروضة على الذاكرة العاملة أو قوة الحوسبة ، فإن تطبيق الوظائف المعقدة بشكل مباشر قد يؤدي إلى نموذج غير مناسب (أي نموذج لا يلتقط جميع الهياكل الموجودة في مجموعة التدريب). للتعويض عن هذا النقص ، يلزم نوع من التنظيم. من ناحية أخرى ، قد يفشل النموذج البسيط جدًا في التقاط هياكل مهمة في مجموعة البيانات الخاصة بك ويمكن أن يؤدي إلى نموذج أكثر من اللازم. في مثل هذه الحالة ، لن يؤدي تطبيق أنواع أكثر تعقيدًا من التنظيم إلى تصحيح هذه المشكلة لأن هذه الهياكل موجودة بالفعل في مجموعة التدريب الخاصة بك.

كقاعدة عامة ، إذا رأيت أن دقتك في مجموعة التحقق من الصحة أو مجموعة الاختبار تستمر في الارتفاع مع تقليل معيار L2 (المعروف أيضًا باسم معامل الانحدار ريدج) ، فمن المحتمل أنك وجدت توازنًا جيدًا بين التحيز والتباين.

اقرأ أيضا: التعلم الآلي: مستقبل ثقافة الأعمال الناجحة

2 - استخدام الضبط للخوارزمية الخاصة بك

في حين أنه قد يكون من السهل تفسير متوسط ​​الخطأ التربيعي أو درجات R2 كمقياس كمي لمدى جودة النموذج ، إلا أن هذا قد يكون خادعًا. على سبيل المثال ، في حالة الانحدار ، يؤدي تطبيق الكثير من التنظيم إلى عدم ملاءمة البيانات الجديدة وضعف الأداء (البيانات غير مستخدمة للتدريب). من ناحية أخرى ، عندما لا تطبق تنظيمًا كافيًا ، يمكن أن يصبح نموذجك شديد التعقيد وعرضة للتركيب الزائد.

لذلك ، من المهم أن تقرأ الطباعة الدقيقة لكل خوارزمية وتضع المعلمات وفقًا لذلك. من درجات التحقق من الصحة أو منحنيات التعلم مثل منحنيات ROC والرسوم البيانية ، حدد مقياسًا مناسبًا لما يجعل النموذج "جيدًا". سيعطيك هذا بعض الإرشادات حول ما إذا كانت إضافة المزيد من الأوزان أو المزيد من الملاحظات إلى مجموعة البيانات الخاصة بك ستؤدي إلى نتائج أفضل.

3 - جرب خوارزميات تحسين مختلفة

يمكن أن يكون لخوارزمية التحسين التي تختارها تأثير كبير على النموذج النهائي. بينما قد تعمل طرق النسب المتدرجة بشكل جيد للانحدار الخطي واللوجستي ، يجب استبدالها بخوارزميات أكثر تقدمًا مثل الذاكرة المحدودة BFGS (L-BFGS) أو التدرج المترافق (CG). لحسن الحظ في الوقت الحاضر ، هناك الكثير من الحزم التي تتيح لك مقارنة الخوارزميات المختلفة بسرعة باستخدام نتائج التحقق من الصحة. اعتمادًا على مشكلتك المحددة ، قد تتمكن حتى من ضبط معلمة فرط معدل التعلم بشكل مباشر أثناء التحسين.

4 - جرب وظائف الخسارة المختلفة وأهداف التنظيم

عند إجراء التصنيف ، اعتمادًا على ما إذا كنت تريد تجنب الإيجابيات الزائفة أو السلبيات الخاطئة ، من المهم تجربة وظائف خسارة أو أهداف تنظيم مختلفة. على سبيل المثال ، في التصنيف متعدد الفئات باستخدام طرق ثنائية متوازنة وواحدة مقابل الكل (OAA) ستمنحك مزيدًا من التحكم في المفاضلة بين الإيجابيات الحقيقية والإيجابيات الخاطئة.

اقرأ أيضا: 7 خطوات يجب أن تعرفها إذا كنت تريد أن تصبح مهندسًا للتعلم الآلي

5 - تدريب نماذج مختلفة في نفس الوقت

بمجرد العثور على مجموعة تدريب جيدة وبنية نموذجية ، حاول تشغيل أنواع مختلفة من النماذج على بياناتك في وقت واحد. على سبيل المثال ، بالنسبة لتصنيف النص ، قد يكون من المثير للاهتمام استخدام كل من أجهزة التشفير التلقائي المتناثرة المكدسة مع تضمين الكلمات بالإضافة إلى شبكات المعتقدات العميقة الشبكات العصبية العميقة. أيضًا ، ضع في اعتبارك تجربة ميزات الإدخال المختلفة على الرغم من أنها قد لا تبدو ضرورية. من المهم ملاحظة أنه لا يُسمح لك ببساطة بتدريب كل خوارزمية على نفس المجموعة وإلا فإن مقاييس الخير الخاصة بك ستكون متحيزة. ومع ذلك ، بالنسبة للعديد من المشكلات ، من الممكن تدريب كل خوارزمية على جزء صغير من مجموعة البيانات التي تم أخذ عينات منها عشوائيًا في السابق دون استبدال.

6 - جرب خوارزميات مختلفة وأهداف تنظيم باستخدام مقياس أهمية الميزة

يُطلق على إحدى الأدوات الأكثر شيوعًا المستخدمة لتقييم السمات المهمة في مشكلة الانحدار أو التصنيف أهمية الميزة. يجيب على السؤال "ما مقدار تغيير هذه الميزة قبل أن يبدأ أداء نموذجنا في مجموعة خارج العينة في الانخفاض؟" لا توفر العديد من الخوارزميات مثل هذه المعلومات بشكل مباشر ، وبالتالي سيكون الأمر متروكًا لك كممارس لتقرير مدى أهمية كل متغير مستقل. ومع ذلك ، إذا كانت الخوارزمية الخاصة بك توفر بعض الخسارة المنتظمة ، فيمكن استخدام نتائج التحقق المتبادل للتوصل إلى مقياس أهمية الميزة.

اقرأ أيضا: أهم 15 سؤالاً وجوابًا في مقابلة تعلم الآلة

الخلاصة:

يعد التعلم الآلي مجالًا واسعًا وهناك الكثير من العثرات التي يجب تجنبها في سعيك وراء العظمة. يجب أن تكون النصائح حول كيفية اختيار أفضل المعلمات الفائقة بمثابة نقطة انطلاق جيدة في رحلتك الاستكشافية ، ولكن تذكر - لا تتوقف أبدًا عن التعلم!

تابعونا على Instagram (uniquenewsonline) والفيسبوك (uniquenewswebsite) للحصول على تحديثات إخبارية منتظمة مجانًا

مقالات ذات صلة