تعلُّم الآلة الموجّه وغير الموجّه
تعلّم الآلة الموجّه:
يتعلم الآلة الموجّه وكما يشير اسمه، يتمّيز بوجود مُشرف على عمليّة التّعليم يقوم بتدريب الآلة باستخدام بيانات مُصنّفة مُسبقاً، أي أنّ البيانات تكون مُرفقة بالإجابات (المخرجات) الصحيحة وتسمّى هذه البيانات “بيانات التّدريب”، بعد ذلك تُعطى الآلة مجموعة جديدة من الأمثلة (بيانات) غير المُصنّفة لتقوم خوارزمية التّعلُّم الموجَّه بتصنيفها بعد تحليل بيانات التدريب.
على سبيل المثال، بفرض أن لدينا سلّة تحتوي مجموعة من الفواكه المختلفة، نبدأ بتدريب الآلة على أنواع الفواكه كلٌّ على حِدة كالتالي:
- إذا كان شكل الجسم مدوَّراً ويحوي انخفاض في أعلاه، ولونه أحمر، نُصنّفه كـ “تفاحة”.
- إذا كان شكل الجسم أسطواني طويل ومنحني، لونه بين الأخضر والأصفر، نُصنّفه كـ “موزة”.
الآن وبعد انتهاء التّدريب نُعطي الآلة فاكهة جديدة لتتعرف عليها، موزة على سبيل المثال.
بما أنّ آلتنا قد درست البيانات السَّابقة (الفاكهة الموجودة في السّلة)، ستستفيد مما درسته للتَّعرُّف على الفاكهة الجديدة وتصنيفها، تقوم الآلة بتصنيف الفاكهة بناءً على شكلها ولونها فتضعها في فئة الموز، بالتالي فإن الآلة تتعلَّم من بيانات التدريب (سلة الفاكهة في هذا المثال) ثم تُطبِّق ما تعلَّمته لاختبار معلومات جديدة وتصنيفها.
يتألف التعلُّم الموجَّه من نوعين من الخوارزميات:
- خوارزميات التَّصنيف: حيث يكون الناتج المُتوقع عبارة عن فئة، مثل “أحمر” أو “أزرق”، أو “مرض” أو “ليس مرض”.
- خوارزميات الانحدار: حيث يكون الناتج المُتوقع عبارة عن قيمة حقيقية (مستمرة)، مثل “سعر (دولار)” أو “وزن (كغ)”.
يعتمد التعلُّم الموجَّه على بيانات مُصنفة مُسبقاً كبيانات للتدريب، وهذا يتطلب توفُّر بعض البيانات ذات نتائج معروفة مسبقاً.
أنواع خوارزميات التعلّم الموجّه:
- الانحدار (Regression).
- الانحدار اللوجستي (Logistic Regression).
- التصنيف (Classification).
- تصنيف بايز البسيط (Naive Bayes Classifiers).
- خوارزمية أقرب الجيران K-NN (K-NN or K nearest neighbors)؛ (يعبر “k” عن عدد القيم المجاورة التي ستأخذها الخوارزمية بعين الاعتبار).
- شجرة القرارات (Decision Trees).
- دعم الآلات الموجّه (Support Vector Machine).
الإيجابيات:
- يُمَكِّننا التعلُّم الموجَّه من جمع البيانات من تجارب سابقة واستخدامها في إنتاج بيانات (نتائج) مبنية عليها.
- يساعد في تحسين معايير الأداء بالاعتماد على الخبرة.
- يساعد في حل العديد من المشاكل الحسابية الحقيقية.
السلبيات:
- صعوبة تصنيف كميات كبيرة من البيانات.
- عملية التدريب في التعلُّم الموجَّه تتطلَّب الكثير من الوقت لإجراء العمليات الحسابية بالتالي يأخذ التعلُّم الموجَّه وقتاً طويلاً.
تعلم الآلة غير الموجَّه:
هو عملية تدريب الآلة باستخدام بيانات غير مصنّفة والسّماح لها بالتعامل مع هذه البيانات دون توجيه، وفيه تعمل الآلة على تجميع بيانات عشوائية ضمن مجموعات بناءً على التشابهات والأنماط والاختلافات فيما بينها دون الحاجة إلى تدريبها مُسبقاً على أي نوع من البيانات.
على عكس التَّعلُّم الموجَّه، لا وجود للمشرف في هذه العملية، أي أن الآلة لن تحصل على أي تدريب، وبالتالي فهي مضطرَّة لإيجاد البنية المخفية في البيانات غير المصنفة بنفسها.
مثلاً: نقدّم للآلة صورة تحتوي على مجموعة من الكلاب والقطط لم ترها من قبل.
بما أن الآلة لا تمتلك أدنى فكرة عن صفات الكلاب أو القطط، لا يمكنها تصنيفهم ك “كلاب وقطط” ولكنها تستطيع تصنيفهم بحسب الأنماط والتشابه والاختلاف، أي يمكنها بسهولة تقسيم محتويات الصورة في الأعلى إلى مجموعتين، تحتوي إحداهما جميع الصُّور التي تحوي كلاباً فيها بينما تحتوي الأُخرى صور القطط، ولا وجود هنا لأيّة أمثلة سابقة أو بيانات تدريب أي أن الآلة لم تتعلم شيء من قبل.
يسمح هذا النوع من التعلّم للنموذج بالعمل بنفسه لاكتشاف أنماط ومعلومات لم تكن مكتشفة قبل ذلك، ويتعامل بشكل أساسي مع بيانات غير مصنّفة.
يتألّف التعلّم غير الموجه من مجموعتين من الخوارزميات:
- التجميع (Clustering): نستعمل هذه الخوارزميات عندما نريد اكتشاف المجموعات الكامنة (الأنماط) في البيانات، كتقسيم الزبائن إلى مجموعات بحسب سلوكهم الشرائي.
- الارتباط (Association): نستعمل هذا النوع من التعلّم (تعلّم قواعد الارتباط) عندما نريد اكتشاف القواعد التي تصف الارتباط في جزء كبير من البيانات، مثل: الأشخاص الذين يشترون المنتج “س” يميلون لشراء المنتج “ع” أيضاً.
أنواع التعلّم غير الموجّه:
- الاستثناء أو التقسيم (Exclusive (partitioning)).
- التجميع (Agglomerative).
- التداخل (Overlapping).
- الاحتمالي (Probabilistic).
أنواع التجميع:
- التجميع الهرمي (Hierarchical Clustering).
- تجميـع متجهات البيانات (K-means Clustering)؛ ترمز “k” هنا إلى عدد القيم الوسطى أو عدد المجموعات التي نريد من النموذج إيجادها.
- تحليل المكونات الرئيسية (Principal Component Analysis).
- تحليل القيمة المفردة (Singular Value Decomposition).
- تحليل المكونات المستقلة (Independent Component Analysis).
مقارنة بين التعلّم الموجّه والتعلّم غير الموجّه
التعلّم الموجّه | التعلّم غير الموجّه | |
البيانات المدخلة | تُدرَّب الخوارزميات باستخدام بيانات مصنفة مسبقاً | تستخدم الخوارزميات لتحليل بيانات غير مصنفة |
التعقيد الحسابي | طرقه أبسط نسبياً | معقّد حسابياً |
الدقة | ذو دقة عالية | أقل دقة |
عدد الفئات | معروف | غير معروف |
تحليل البيانات | يحلل بيانات تاريخية موجودة ومصنفة مسبقاً | يحلل البيانات آنياً عند توفرها |
الخوارزميات المستخدمة | الانحدار الخطي واللوجستي، والغابة العشوائية (Random forest)، ودعم الآلات الموجّه، والشبكة العصبية (Neural Network)، الخ. | تجميـع متجهات البيانات، والتجميع الهرمي، وخوارزمية ابريوري (Apriori algorithm) |
المصدر: هنا
ترجمة: علي حمّود، مراجعة: رلا دنورة ، تدقيق لغوي: علي يونس، تصميم: علي العلي، تحرير: معتصم حفيان.