📝 ملخص كورس علم البيانات - 4

هذا الجزء سيكون عن آلة المتجهات الداعمة Support Vector Machines، متى تستخدم، والمتغيرات فيها وطريقة تكوين النموذج الخاص فيها ببايثون.

الفصل الأول - التعلم الموجَّه Supervised Learning

الدرس السادس - آلة المتجهات الداعمة Support Vector Machines ¹

تعتبر من أكثر الخوارزميات استخداماً في التصنيف، وتقوم الخوارزمية بالبحث عن افضل طريقة لتقسيم البيانات. بحيث تحاول تكوين أكبر مسافه بين القيم. سبق أن تحدثت عنها هنا

Error Function

Small margin > large error
Large margin > small error
وللتقليل من الاخطاء نستخدم Gradient Descent

Hyperparameters المتغيرات ²

- The C parameter

Large C: Focus on classifying points.
Small C: Focus on a large margin.

- Kernels ³ ⁴

Polynomial Kernel
RBF Kernel

- Gamma

للبيانات غير الخطية

Large values of gamma tend to overfit.
Small values of gamma tend to underfit.

- Degree

تستخدم فقط في Polynomial Kernel.

مثال بايثون

قبل تشغيل المودل

from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
import pandas as pd
import numpy as np

data = np.asarray(pd.read_csv('data.csv', header=None))
X = data[:,0:2]
y = data[:,2]

model = SVC(kernel='rbf', gamma=10, C=7)

model.fit(X, y)

y_pred = model.predict(X)
acc = accuracy_score(y, y_pred)

بعد التشغيل

العودة إلى ملخص كورس علم البيانات - 3 - الإنتقال إلى ملخص كورس علم البيانات - 5

كُتب في 17/03/2019