التنبؤ ببقاء ركاب التيتانيك

4

تفاصيل العمل

جراء تحليل استكشافي للبيانات (EDA) باستخدام Pandas وMatplotlib وSeaborn لاكتشاف القيم المفقودة والعلاقات المهمة. معالجة القيم المفقودة بتقدير عمر الركاب حسب الدرجة (Pclass)، وتعويض الأجرة (Fare) بالوسيط، وحذف عمود (Cabin) بسبب كثرة القيم الناقصة. ترميز المتغيرات الفئوية مثل (الجنس والميناء) باستخدام One-Hot Encoding، وتطبيق RobustScaler لتوحيد القيم. بناء وتدريب نموذج انحدار لوجستي (Logistic Regression) حقق دقة ~81%، مع دقة نوعية (Precision) 83% و استدعاء (Recall) 66%. تقييم أداء النموذج باستخدام مصفوفة الالتباس (Confusion Matrix) وتقرير التصنيف (Classification Report). تطبيق التنبؤات على مجموعة الاختبار بعد تنفيذ نفس خطوات المعالجة المسبقة.

المهارات المستخدمة

معالجة البيانات
machine learning
تحليل البيانات
لغة بايثون

تعليقات

لم يتم ترك أي تعليق حتى الأن

Ahmed M.Ahmed M.
عالم بيانات
مشاركة معرض الأعمال

تعجبك !، قم بمشاركها