مبادئ وتقنيات علم البيانات
ملحق: المصطلحات العربية وترجمتها
فهرس الفصل:
في هذه الصفحة سيتم كتابة المصطلحات الإنجليزية المستخدمة في الكتاب ومرادفها بالعربية، في كثير من الأحيان لا يوجد مصطلح عربي مناسب وواضح المعنى لكلمة ما، فسيتم استخدام المصطلح العربي الشائع إستخدامة بالإضافة إلى شرح للمعنى أو تعريف إن وجد، إذا أحتاج الأمر سيتم إضافة روابط باللغة العربية أو الإنجليزية للمساعدة لشرح أكثر عن المصطلح ومعناه بشكل صحيح:
المصطلح الإنجليزي | المصطلح العربي | المعنى | روابط مساعدة |
---|---|---|---|
Dataset | البيانات | مجموعة بيانات متكونة على شكل جدول أو قاعدة بيانات | 📝 📝 |
Data Design | تصميم البيانات | كيفية بناء البيانات، تختلف كل قاعدة بيانات عن أخرى حسب مُصممها | |
Series | مجموعة (مصفوفة أحادية البعد) | مجموعة بيانات متكونة على شكل مصفوفة أحادية البعد | 📝 |
Dictionary | قاموس | مشابهة للمصفوفات لكن تحتوي على مفتاح لكل قيمه Key/Value | 📝 |
Vector | متّجه | طريقة لعرض البيانات على شكل مصفوفة بسطر واحد أو عمود واحد | 📝 |
Matrix\Matrices | مصفوفة / مصفوفات | طريقة لعرض البيانات، تستخدم بشكل كثير في العمليات الحسابية وخوارزميات تعلم الآلة وغيرها، تحتوي على أشكال وأحجام مختلفة | 📝 |
Class | الكلاس/الصنف | هي جميع الدوال، المتغيرات، الخصائص التي تتعلق بالكائن Object | 📝 |
Population | المجتمع الإحصائي | مجموعة من البيانات لديها عناصر متشابهه | |
Quota Sampling | عينة الحصة | عينة تحتوي على بعض أو كل صفات و سمات المجتمع الإحصائي | |
Parameter | معْلَمة | في الإحصاء: مقياس إحصائي يحسب من كافة مفردات المجتمع دون استثناء، في البرمجة: قيمة يتم تمريرها للدوال أو العمليات الحسابية | 📝 📝 |
Variable | متغير | في الإحصاء، قيمة متغيرة من شخص لآخر، مثل الطول والوزن | 📝 |
Random variable | متغير عشوائي | متغير ليس له قيمة ثابتة | 📝 |
Sample | عيّنة | جزء من المجتمع الإحصائي يستخدم لتمثيله | 📝 |
Classifier | مُصنف | الخوارزمية التي تقوم بتصنيف البيانات وتقسيمها | 📝 |
Model | نموذج | يطلق على النتيجة بعد تعلم الآلة، النموذج يتعلم عن طريق الخوارزميات، ثم يتم أختبارة على بيانات حقيقية | 📝 |
Features | خصائص/متغيرات | عند تكوين النموذج، نحدد الخصائص التي يعتمد عليها النموذج لإجراء التنبؤات | 📝 |
Fit | ضبط | ضبط النموذج بأفضل المتغيرات لتجهيزه للتدريب | 📝 |
Train | تدريب | تدريب النموذج على البيانات المتوفرة ونتائجها | 📝 |
Predict | التوقع / التنبؤ | النتائج من النموذج بعد تدريبه | 📝 |
Weight | الوزن | متغير قابل للتعلم، يستخدم أرقام عشوائية داخل النموذج حتى يصل لنتيجة مناسبة | 📝📝 |
Noise | التشويش | بيانات عشوائية وغير منتظمة مع بقية البيانات | 📝 📝 |
Bias | تحيز / انحياز | انحياز البيانات لجزء أو قيمه معينة، مدى بعد النتائج من الأجوبة أو التوقعات الصحيحة | 📝 |
Variance | التباين | عندما يؤدي النموذج بشكل جيد فقط على بياناته، عندما يواجه بيانات جديده، لا يؤدي بنفس الجودة التي يؤديها على بيانات التدريب | 📝 |
Bootstrap | بوتستراب | عينة من المجتمع تمثله بشكل جيد | 📝 |
Gradient Descent | نزول اشتقاقي | طريقة لتحسين النتائج، في كل خطوة يتم تكرار العمليات حتى تصل للمتغيرات المثالية والتي تقلل من دالة التكلفة | 📝 📝 |
Cost Function | دالة التكلفة | دالة تقيس مدى سوء نتائج النموذج | 📝 |
Loss Function | دالة الخسارة | دالة تستخدم لقياس النتائج التي تم تصنيفها بشكل خاطئ عن طريق حساب مدى بعدها عن النتائج الحقيقية | 📝 📝 📝 |
Empirical Risk | الخطر التجريبي | دالة نتيجتها تأتي عن طريق إيجاد متوسط دالة الخسارة المستخدمة في البيانات | 📝 |
Activation function | دالة التنشيط | توجد أنواع مختلفة من دوال التنشيط، جميعها هدفها استقبال مدخلات في الشبكات العصبية وإخراجها بعد التعلم منها | 📝 📝 |
Regularization | الضبط | طريقة للتقليل من تباين النموذج والتخلص من فرط التخصيص | 📝 📝 |
Normalization | التسوية | إعادة تعين القيم في الأعمدة الرقمية لتكون بين الرقمين 0 و 1 بشكل مدرج دون التأثير على الفرق بين تلك القيم | 📝 📝 |
Standardization | التوحيد | طريقة أخرى لإعادة تعين القيم في الاعمدة الرقمية لتكون أقرب إلى المتوسط | 📝 📝 |
Supervised learning | التعلم الموجَّه | يعتمد على البيانات المٌعلْمة في التعلم، يتم تقديم هذه البيانات ونتائجها وتدريب الآلة عليها | 📝 |
Unsupervised learning | التعلم غير الموجَّه | عكس التعلم الموجَّه، الآلة تُعطى بيانات وتتعلم من نفسها عن طريق محاولة إيجاد أنماط، يتم ذلك عن طريق تجميع البيانات التي لدينا إلى مجموعات حسب ما تتشابه فيه | 📝 |
Confusion Matrix | مصفوفة الدقة | أداة تستخدم لقياس أداء ودقة نتائج النماذج | 📝 |