مقدمة إلى تقنية تعلّم الآلة ML
- تعريف تعلّم الآلة:
ابتكر العالم الأمريكي آرثر صموئيل Arthur Samuel المتخصص في مجال ألعاب الحاسوب والذكاء الاصطناعي مُصطلح تعلّم الآلة Machine Learning ML عام 1959 في شركة IBM (International Business Machines)، وعرف تعلّم الآلة بأنه “مجال الدراسة الذي يُمكن أنظمة الحواسيب من التعلم دون الحاجة إلى أيّ برمجة صريحة”. ولكن حتى الآن لا يوجد تعريف مُتّفق عليه عالمياً لتعلّم الآلة. ولذلك، سنستعرض تعريفين آخرين:
- تعلّم الآلة: هو برمجة أجهزة الحاسوب لتحسين معيار الأداء بالاعتماد على بيانات وتجارب سابقة، حيث يوجد نموذج (model) مُحدد ببعض المعايير، والتعلّم هو تنفيذ برنامج حاسوبي لتحسين معايير هذا النموذج باستخدام بيانات التدريب أو التجارب السابقة. وقد يكون النموذج تنبؤي لعمل تنبؤات في المستقبل، أو وصفي لاكتساب المعرفة من البيانات.
- ويُعرّف أيضاً بأنه مجال الدراسة الذي يهتم بكيفية إنشاء برامج حاسوبية تتحسّن بشكل تلقائي من خلال التجربة.
يُعد تعلّم الآلة فرع من فروع الذكاء الاصطناعي (artificial intelligence)، ويتضمّن تطوير الخوارزميات والنماذج الإحصائية التي تُمكّن الحواسيب من تطوير أدائها في المهمات بناء على التجارب السابقة. وصُمّمت هذه الخوارزميات والنماذج للاستفادة من البيانات في اتخاذ القرارات والتنبؤات دون الحاجة الى أوامر صريحة.
يوجد عدة أنواع من تعلّم الآلة منها التعلّم الموجه (supervised learning) والتعلّم غير الموجّه (unsupervised learning) والتعلّم المعزّز (reinforcement learning).
يتضمن تعلّم الآلة الموجه تدريب نموذج على بيانات مُصنفة، بينما التعلّم غير الموجه يتضمّن تدريب نموذج على بيانات غير مصنّفة، أما التعلم المعزز فيقوم على التدريب من خلال التجربة والخطأ. ويُستخدم تعلّم الآلة في مجموعة واسعة من التطبيقات، منها التعرف على الصورة والكلام ومعالجة اللغة الطبيعية (تقنية تُمكّن أجهزة الحاسوب من تفسير اللغة البشرية ومعالجتها وفهمها)، بالإضافة إلى أنظمة الاقتراحات.
نقول إنّ برنامج الحاسوب يتعلّم من التجربة E فيما يتعلق ببعض المهام T ومقياس الأداء P، إذا تحسن أداؤه في المهام T كما قيست عبر P مع التجربة E.
أمثلة على ذلك:
- تعلّم التعرُّف على خط اليد
- المهمة T: التعرّف على الكلمات المكتوبة بخط اليد وتصنيفها داخل صور.
- الأداء P: النسبة المئوية للكلمات المُصنّفة بشكل صحيح.
- تدريب التجربة E: قاعدة بيانات من الكلمات المكتوبة بخط اليد المُصنّفة بشكل مُعين.
- تعليم القيادة لروبوت
- المهمة T: القيادة على الطُّرق السريعة باستخدام حساس الرؤية.
- الأداء P: مُتوسط المسافة المقطوعة قبل الخطأ.
- تدريب التجربة E: سلسلة من الصور والأوامر المُوجهة سُجِلت أثناء مراقبة شخص يقود.
وبناء على ما سبق نُسمّي برنامج الحاسوب الذي يتعلّم من التجربة ببرنامج تعلّم الآلة أو برنامج التعلم.
تصنيف تعلّم الآلة:
تُصنّف تطبيقات تعلّم الآلة الى أربع فئات رئيسية، ويعتمد هذا التصنيف على طبيعة (إشارة signal أو استجابة response) التعلّم المتاحة لنظام التعلّم، وهي:
هو مهمة لتعلّم وظيفة تقوم بتعيين المدخلات إلى المخرجات بناءً على أمثلة أزواج المُدخلات والمُخرجات الموجودة سابقاً، وتكون البيانات المعطاة مُصنّفة، وتعد مسائل التصنيف (classification) والانحدار (regression) من أنواع التعلّم الموجه.
1-تعلّم الآلة المُوجه:
مثال:
يوجد لدينا مجموعة بيانات لمرضى يقصدون عيادة طبيب، وهذه البيانات تتضمّن الجنس والعمر لكل مريض، ويُصنّف كل شخص على أنه إمّا سليم أو مريض.
الجنس | العمر | التصنيف |
ذكر | 48 | مريض |
ذكر | 67 | مريض |
أنثى | 53 | سليم |
ذكر | 49 | مريض |
أنثى | 32 | سليم |
ذكر | 34 | سليم |
ذكر | 21 | سليم |
2-تعلّم الآلة غير المُوجّه:
هو النوع الذي تُستخدم فيه خوارزمية تعلّم الآلة لاستخلاص نتائج من بيانات تتكون من مُدخلات غير مُصنفة، ولا يُدرج التصنيف والتوزيع في خوارزميات التعلّم غير الخاضع للإشراف في الملاحظات.
مثال:
يوجد لدينا بيانات لمرضى يقصدون عيادة طبيب، وهذه البيانات تتضمن الجنس والعمر لكل مريض.
الجنس | العمر |
ذكر | 48 |
ذكر | 67 |
أنثى | 53 |
ذكر | 49 |
أنثى | 34 |
ذكر | 21 |
يُشبه هذا النوع من التعلّم الطّرق التي يستخدمها الانسان ليكتشف أن بعض الأشياء أو الأحداث من نفس التصنيف، مثل ملاحظة درجة التشابه بين الأشياء. وتعتمد بعض أنظمة الاقتراحات التي تظهر في الانترنت على شكل أتمتة التسويق marketing automation (منصات برمجية لتبسيط عمليات التسويق والمبيعات) على هذا النوع من التعلّم.
3-التعلّم المُعزز:
كيفية جعل الوكيل المبرمج (agent) يتعامل مع بيئته المحيطة من أجل زيادة مكافآته، وعلى عكس معظم أشكال تعلّم الآلة لا يعلم المُتعلّم ما الإجراء المناسب الذي عليه اتّخاذه، بل ينبغي عليه اكتشاف الإجراءات التي تحقق أكبر قدر من المكافآت بنفسه من خلال تجربتها كلها، وعلى سبيل المثال، عند تعليم كلب حيلة جديدة لا نقوم بإخباره بما عليه فعله أو ما لا يجب عليه فعله، ولكننا نستطيع إمّا أن نكافئه إذا قام بالفعل بشكل صحيح أو نعاقبه في حالة الخطأ.
4-تعلّم الآلة شبه المُوجّه:
وفيه تُعطى إشارة تدريب غير كاملة، أي أن تحتوي مجموعة التدريب على البعض أو الكثير من المُخرجات المُستهدفة المفقودة، ويوجد حالة خاصة لهذا المبدأ تُعرَف باسم التحويل Transduction حيث تعرف كافة كيانات المسألة أثناء التعلّم، باستثناء أن جزء من الأهداف مفقود. يُعتبر التعلّم شبه المُوجّه نهج للتعلّم الآلي يجمع بين كمية صغيرة من البيانات المُصنفة مع كمية كبيرة من البيانات غير المُصنفة أثناء التدريب، وهو مزيج بين التعلّم المُوجّه والتعلّم غير المُوجّه.
التصنيف بناءً على الخرج المطلوب:
ينشأ تصنيف آخر لمهام التعلّم الآلي عندما ننظر إلى النتيجة المطلوبة من نظام التعلّم:
- التصنيف (Classification): عندما تنقسم المدخلات الى فئتين أو أكثر، يجب على المُتعلم أن يُنشِئ نموذج يُعين مُدخلات غير مرئية لواحد أو أكثر (تصنيف مُتعدد التسميات) من هذه الفئات. ويندرج التصنيف تحت التعلّم المُوجّه، وتُعتبر فلترة البريد الإلكتروني العشوائي مثال للتصنيف، حيث تُعد رسالة البريد الإلكتروني (أو غيرها) الدخل والفئات هي “عشوائي” و”غير عشوائي”.
- الانحدار (Regression): وهو أيضاً نوع من أنواع التعلّم المُوجّه، وفي هذه الحالة تكون المُخرجات مُستمرة بدلاً من أن تكون مُتقطعة.
- التجميع (Clustering): عندما يتم تقسيم مجموعة من المُدخلات إلى مجموعات مُتعددة، وعلى عكس التصنيف فإن هذه المجموعات غير معروفة مُسبقاً، وبالتالي يُعتبر هذا النوع غير مُوجّه.
نلجأ الى تعلّم الآلة عندما لا نستطيع حل المشكلات باستخدام الأساليب المعتادة، وتُعزز خوارزميات ML مع تكنولوجيا الحوسبة الجديدة قابلية التوسع إضافةً إلى تحسين الكفاءة، ويمكننا استخدام نماذج تعلّم الآلة الحديثة للتنبؤ بدءاً بتفشّي الأمراض وصولاً إلى ارتفاع وانخفاض الأسهم.
المصدر: هنا.
ترجمة: أماني صالح ، مراجعة وتصميم: علي العلي ، تدقيق لغوي: غزل روميه، ، تحرير: نور شريفة.