مكتبة سايكت ليرن : الجزء 2

مقدمة

في الجزء الأول تعرفنا على مكتبة سايكت ليرن وأهميتها في مجال تعلم الآلة, وتعلمنا كيفية بناء نموذج بسيط للتصنيف بإستخدام خوارزمية الإنحدار اللوجستي.

في هذا الجزء سنأخذ خطوة أعمق قليلاً ونتعرف على أشهر خوارزميات التصنيف والتجميع في المكتبة مع أمثلة مبسطة.

راجع الجزء الأول من شرح المكتبة

خوارزميات التصنيف - Classification

التصنيف هو أحد أهم أنواع تعلم الآلة المشرف عليه , حيث يكون لدينا بيانات معروفة النتائج ونحاول تدريب النموذج للتنبؤ بالقيم المستقبلية.

من أشهر خوارزميات التصنيف في مكتبة سايكت ليرن :

Logistic Regression
Decision Tree
Random Forest
Support Vector Machine (SVM)
K-Nearest Neighbors (KNN)

مثال

شجرة القرار أو :

Decision Tree

من الخوارزميات البسيطة والمفهومة , حيث تتخذ القرارات بناءً على شروط متفرعة.

تتميز شجرة القرار بسهولتها وسهولة تفسيرها وفهمها لكن فيها عيب قاتل وهو مشكلة إفراط التعلم أو ماتسمى بالـ :

Overfitting

كود تصنيف : from sklearn.tree import DecisionTreeClassifier

model = DecisionTreeClassifier() model.fit(X_train, y_train)

predictions = model.predict(X_test)

خوارزميات التجميع - Clustering

التجميع هو نوع من أنواع تعلم الآلة غير الخاضع للإشراف ,حيث لانملك في التعلم نتائج سابقة وغرض التعلم نفسه هو إيجاد الهدف والتركيبة من دون إعطاء قيم افتراضية وقيمة تنبؤية واضحة للنموذج.

كود تجميع : from sklearn.cluster import KMeans

kmeans = KMeans(n_clusters=3, random_state=42) kmeans.fit(X)

labels = kmeans.labels_

تستخدم خوارزميات التجميع كثيراً في تحليل العملاء وتقسيم المستخدمين وتحليل السلوك.

في مقالة لاحقة سنتحدث عن الخوارزميات الفرعية بوضوح وبشكل كامل وبالتفصيل الممل مثل شجرة القرار والإنحدار الخطي وكذلك النوع الثالث من تعلم الآلة وهو تعلم الآلة التعزيزي الذي هو مزيج بين تعلم الآلة الخاضع للإشراف وغير الخاضع للإشراف.

مصادر ومراجع :

Scikit-learn Documentation
IBM – Machine Learning with Python on Coursera
FreeCodeCamp - Machine Learning with Python and Scikit-Learn
Deep Learning Book - For Dummies