📝 ملخص كورس علم البيانات - 2

هذا الجزء سيكون عن خوارزمية بيرسيبترون وشجرة القرار.

الفصل الأول - التعلم الموجَّه Supervised Learning
الدرس الثالث - خوارزمية بيرسيبترون Perceptron Algorithm

تعتبر من أساسيات الشبكات العصبية Neural Networks. وتستخدم الخوارزمية للإجابة على الأسئلة بنعم أو لا، مثلاً هل هذه البريد مزعج أو لا. 1 2


الفصل الأول - التعلم الموجَّه Supervised Learning
الدرس الرابع - شجرة القرار Decision Tree

خوارزمية شجرة القرار ممكن ان تعمل على البيانات الرقمية والفئوية.
تم شرحها بتفصيل اكثر هنا.

متغيرات شجرة القرار Hyperparameters
  • عمق الفصل أو مداه Maximum Depth:
    (max_depth: The maximum number of levels in the tree)

    في المثال السابق Maximum Depth = 2
  • الحد الادنى من البيانات للفصل Minimum number of samples to split:
    (min_samples_leaf: The minimum number of samples allowed in a leaf)
  • الحد الادنى للبيانات لكل ورقة Minimum number of samples per leaf:
    (min_samples_split: The minimum number of samples required to split an internal node)

مصطلحات
  • One-hot encode 3
    تحويل القيم الفئوية في البيانات إلى عواميد، في حال كانت القيمة من تلك الفئة، يوضع 1 عند ذلك العامود وصفر عند بقية العواميد، مثال:

  • train_test_split 4
    تستخدم لتقسيم البيانات إلى بيانات للتدريب وأخرى للإختبار، بعض المتغيرات المهمه فيها:

    • test_size: حجم البيانات المراد إختبارها، اذا اعطيت 0.5، فانها تأخذ 50% من البيانات.
    • train_size: نفس تعريف test_size ولكن لبيانات التدريب، ولا يحتاج لتعريفة وإعطائة قيمة اذا تم تعريف وإعطاء قيمة لحجم البيانات المراد إختبارها.
    • random_state: عند تخصيص هذا المتغير، لا تتغير لدينا البيانات المفصولة في كل مرة نشغل فيها المودل. عندما لا يحدد، في كل مرة نشغل فيها المودل، تتغير لنا البيانات المفصلة لدينا بين البيانات التي تدرب والتي تُختَبر.
      “randomstate is basically used for reproducing your problem the same every time it is run. If you do not use a randomstate in train_test_split, every time you make the split you might get a different set of train and test data points and will not help you in debugging in case you get an issue.” 5

العودة إلى ملخص كورس علم البيانات - 1 - الإنتقال إلى ملخص كورس علم البيانات - 3

كُتب في 15/03/2019