مبادئ وتقنيات علم البيانات

ملحق: المصطلحات العربية وترجمتها

فهرس الفصل:


في هذه الصفحة سيتم كتابة المصطلحات الإنجليزية المستخدمة في الكتاب ومرادفها بالعربية، في كثير من الأحيان لا يوجد مصطلح عربي مناسب وواضح المعنى لكلمة ما، فسيتم استخدام المصطلح العربي الشائع إستخدامة بالإضافة إلى شرح للمعنى أو تعريف إن وجد، إذا أحتاج الأمر سيتم إضافة روابط باللغة العربية أو الإنجليزية للمساعدة لشرح أكثر عن المصطلح ومعناه بشكل صحيح:

المصطلح الإنجليزي المصطلح العربي المعنى روابط مساعدة
Dataset البيانات مجموعة بيانات متكونة على شكل جدول أو قاعدة بيانات 📝 📝
Data Design تصميم البيانات كيفية بناء البيانات، تختلف كل قاعدة بيانات عن أخرى حسب مُصممها  
Series مجموعة (مصفوفة أحادية البعد) مجموعة بيانات متكونة على شكل مصفوفة أحادية البعد 📝
Dictionary قاموس مشابهة للمصفوفات لكن تحتوي على مفتاح لكل قيمه Key/Value 📝
Vector متّجه طريقة لعرض البيانات على شكل مصفوفة بسطر واحد أو عمود واحد 📝
Matrix\Matrices مصفوفة / مصفوفات طريقة لعرض البيانات، تستخدم بشكل كثير في العمليات الحسابية وخوارزميات تعلم الآلة وغيرها، تحتوي على أشكال وأحجام مختلفة 📝
Class الكلاس/الصنف هي جميع الدوال، المتغيرات، الخصائص التي تتعلق بالكائن Object 📝
Population المجتمع الإحصائي مجموعة من البيانات لديها عناصر متشابهه  
Quota Sampling عينة الحصة عينة تحتوي على بعض أو كل صفات و سمات المجتمع الإحصائي  
Parameter معْلَمة في الإحصاء: مقياس إحصائي يحسب من كافة مفردات المجتمع دون استثناء، في البرمجة: قيمة يتم تمريرها للدوال أو العمليات الحسابية 📝 📝
Variable متغير في الإحصاء، قيمة متغيرة من شخص لآخر، مثل الطول والوزن 📝
Random variable متغير عشوائي متغير ليس له قيمة ثابتة 📝
Sample عيّنة جزء من المجتمع الإحصائي يستخدم لتمثيله 📝
Classifier مُصنف الخوارزمية التي تقوم بتصنيف البيانات وتقسيمها 📝
Model نموذج يطلق على النتيجة بعد تعلم الآلة، النموذج يتعلم عن طريق الخوارزميات، ثم يتم أختبارة على بيانات حقيقية 📝
Features خصائص/متغيرات عند تكوين النموذج، نحدد الخصائص التي يعتمد عليها النموذج لإجراء التنبؤات 📝
Fit ضبط ضبط النموذج بأفضل المتغيرات لتجهيزه للتدريب 📝
Train تدريب تدريب النموذج على البيانات المتوفرة ونتائجها 📝
Predict التوقع / التنبؤ النتائج من النموذج بعد تدريبه 📝
Weight الوزن متغير قابل للتعلم، يستخدم أرقام عشوائية داخل النموذج حتى يصل لنتيجة مناسبة 📝📝
Noise التشويش بيانات عشوائية وغير منتظمة مع بقية البيانات 📝 📝
Bias تحيز / انحياز انحياز البيانات لجزء أو قيمه معينة، مدى بعد النتائج من الأجوبة أو التوقعات الصحيحة 📝
Variance التباين عندما يؤدي النموذج بشكل جيد فقط على بياناته، عندما يواجه بيانات جديده، لا يؤدي بنفس الجودة التي يؤديها على بيانات التدريب 📝
Bootstrap بوتستراب عينة من المجتمع تمثله بشكل جيد 📝
Gradient Descent نزول اشتقاقي طريقة لتحسين النتائج، في كل خطوة يتم تكرار العمليات حتى تصل للمتغيرات المثالية والتي تقلل من دالة التكلفة 📝 📝
Cost Function دالة التكلفة دالة تقيس مدى سوء نتائج النموذج 📝
Loss Function دالة الخسارة دالة تستخدم لقياس النتائج التي تم تصنيفها بشكل خاطئ عن طريق حساب مدى بعدها عن النتائج الحقيقية 📝 📝 📝
Empirical Risk الخطر التجريبي دالة نتيجتها تأتي عن طريق إيجاد متوسط دالة الخسارة المستخدمة في البيانات 📝
Activation function دالة التنشيط توجد أنواع مختلفة من دوال التنشيط، جميعها هدفها استقبال مدخلات في الشبكات العصبية وإخراجها بعد التعلم منها 📝 📝
Regularization الضبط طريقة للتقليل من تباين النموذج والتخلص من فرط التخصيص 📝 📝
Normalization التسوية إعادة تعين القيم في الأعمدة الرقمية لتكون بين الرقمين 0 و 1 بشكل مدرج دون التأثير على الفرق بين تلك القيم 📝 📝
Standardization التوحيد طريقة أخرى لإعادة تعين القيم في الاعمدة الرقمية لتكون أقرب إلى المتوسط 📝 📝
Supervised learning التعلم الموجَّه يعتمد على البيانات المٌعلْمة في التعلم، يتم تقديم هذه البيانات ونتائجها وتدريب الآلة عليها 📝
Unsupervised learning التعلم غير الموجَّه عكس التعلم الموجَّه، الآلة تُعطى بيانات وتتعلم من نفسها عن طريق محاولة إيجاد أنماط، يتم ذلك عن طريق تجميع البيانات التي لدينا إلى مجموعات حسب ما تتشابه فيه 📝
Confusion Matrix مصفوفة الدقة أداة تستخدم لقياس أداء ودقة نتائج النماذج 📝