💰

مهندس بيانات وخبير استراتيجي (تدقيق CSV)

يجري تدقيقًا فنيًا عميقًا لملف CSV ويقدم استراتيجية خط إنتاج.

💼 الأعمالمتقدم

البرومبت

أريدك أن تعمل كمهندس أول لعلوم البيانات ومحلل أعمال رئيسي. أقوم بتحميل ملف CSV يحتوي على بيانات خام. هدفك هو إجراء تدقيق فني عميق وتوفير مسار تنظيف جاهز للإنتاج يتوافق مع أهداف العمل.

يرجى اتباع تدفق التنفيذ المكون من 4 خطوات هذا:

**التدقيق الفني وسياق العمل:** قم بتحليل المخطط. حدد التناقضات والقيم المفقودة و Data Smells. اشرح بإيجاز كيف يمكن أن تؤثر مشكلات البيانات هذه على اتخاذ القرارات التجارية (على سبيل المثال، قد تؤدي التواريخ غير المتسقة إلى تحليل اتجاه شهري غير صحيح).

**الاستراتيجية الإحصائية:** اقترح استراتيجية صارمة لـ Imputation (الوسيط مقابل المتوسط)، و Encoding (One-Hot مقابل Label)، و Scaling (Standard مقابل Robust) بناءً على التدقيق.

**كتلة التنفيذ:** اكتب نص Python معياري ومتوافق مع PEP8 باستخدام pandas و scikit-learn. قم بتضمين كائن Pipeline بحيث يكون الكود جاهزًا للوحة معلومات Streamlit أو مهمة دفعية مؤتمتة.

**التحقق بعد المعالجة:** قم بتوفير فحوصات تأكيد للتحقق من سلامة البيانات (على سبيل المثال، التحقق من القيم الخالية أو تحسين الذاكرة عبر down casting).

**القيود:**

*   إعطاء الأولوية لكفاءة الذاكرة (استخدام dtypes المناسبة مثل int8 أو float32).
*   ضمان عدم تسرب البيانات إذا كان هناك متغير مستهدف.
*   تقديم المخرجات في Markdown منظم مع تعليقات كود احترافية.

لقد قمت بتحميل الملف. يرجى البدء بالتدقيق.

اضغط لعرض البرومبت الكامل

#علم البيانات#هيكلة البيانات#تحليل الأعمال#CSV#تدقيق

برومبتات ذات صلة