فهرس المحتويات
التحليل الإحصائي هو جمع وتفسير البيانات من أجل الكشف عن الأنماط والاتجاهات. حيث إنه أحد مكونات تحليلات البيانات، فيمكن استخدام تحليل البيانات في مواقف مثل جمع تفسيرات البحث أو النمذجة الإحصائية أو تصميم المسوحات والدراسات. ويمكن أن يكون مفيداً أيضاً لمنظمات ذكاء الأعمال التي يتعين عليها العمل بأحجام بيانات كبيرة. فيتضمن تحليل البيانات جمع وفحص كل عينة بيانات في مجموعة من العناصر التي يمكن استخلاص العينات منها. فالعينة في الإحصاء هي اختيار تمثيلي مأخوذ من إجمالي عدد السكان.
فالهدف من التحليل الإحصائي هو تحديد الاتجاهات. حيث قد تستخدم تجارة التجزئة على سبيل المثال التحليل للعثور على أنماط في بيانات العملاء غير المهيكلة وشبه المهيكلة التي يمكن استخدامها لخلق تجربة عملاء أكثر إيجابية وزيادة المبيعات.
هو عملية جمع البيانات وتحليلها من أجل تمييز الأنماط والاتجاهات. حيث إنها طريقة لإزالة التحيز من تقييم البيانات من خلال استخدام التحليل العددي. كما أنه هذه التقنية مفيدة في جمع تفسيرات البحث، وتطوير النماذج الإحصائية، وتخطيط المسوحات والدراسات.
بالإضافة إلى أنه هو أداة علمية تساعد في جمع كميات كبيرة من البيانات وتحليلها لتحديد الأنماط والاتجاهات الشائعة لتحويلها إلى معلومات مفيدة. بكلمات بسيطة، هو أداة لتحليل البيانات تساعد على استخلاص استنتاجات ذات مغزى من البيانات الأولية وغير المنظمة.
ويتم استخلاص الاستنتاجات باستخدام تحليل البيانات الذي يسهل اتخاذ القرار ويساعد الشركات على وضع تنبؤات مستقبلية على أساس الاتجاهات السابقة. ويمكن تعريفه على أنه علم لجمع البيانات وتحليلها لتحديد الاتجاهات والأنماط وعرضها. ويتضمن التحليل الإحصائي العمل بالأرقام ويتم استخدامه من قبل الشركات والمؤسسات الأخرى للاستفادة من البيانات لاستخلاص معلومات ذات مغزى.
باختصار التحليل الإحصائي هو علم جمع واستكشاف وتنظيم الأنماط والاتجاهات باستخدام أنواعها المختلفة. ويستخدم كل نوع من أنواع التحليل الإحصائي أساليب إحصائية مثل الانحدار والمتوسط والانحراف المعياري وتحديد حجم العينة واختبار الفرضيات. كما إنها النتائج في المخرجات التي تستخدمها المنظمات لتقليل المخاطر والتنبؤ بالاتجاهات القادمة لتحديد مواقعها في السوق التنافسية.
عادةً ما تسمح برامج التحليل الإحصائي للمستخدمين بإجراء تحليلات أكثر تعقيداً من خلال تضمين أدوات إضافية لتنظيم مجموعات البيانات وتفسيرها، وكذلك لعرض تلك البيانات. فتعد IBM SPSS Statistics و RMP و Stata بعض الأمثلة على برامج تحليل البيانات. على سبيل المثال تغطي IBM SPSS Statistics الكثير من العمليات التحليلية. من إعداد البيانات وإدارة البيانات إلى التحليل وإعداد التقارير. وهكذا يشتمل البرنامج على واجهة قابلة للتخصيص، وعلى الرغم من أنه قد يكون من الصعب استخدام شخص ما، إلا أنه من السهل نسبياً لأولئك الذين لديهم خبرة في كيفية عمله.
يمكن تقسيم التحليل الإحصائي إلى خمس خطوات منفصلة، فيما يلي الخطوات الخمس المتبعة من قبل البيان لإجراء تحليل البيانات يجب عليك اتباعها: أولاً تحديد ووصف طبيعة البيانات التي من المفترض أن تقوم بتحليلها. أما الخطوة التالية هي إقامة علاقة بين البيانات التي تم تحليلها وعينة السكان التي تنتمي إليها البيانات واستكشف علاقة البيانات بالمحتوى الأساسي. بينما الخطوة الثالثة هي إنشاء نموذج يعرض ويلخص العلاقة بين السكان والبيانات بوضوح، لفهم كيفية ارتباط البيانات بالمجموعة الأساسية. أما رابعاً إثبات أو دحض صحة النموذج، أي ما إذا كان النموذج صالحاً أم لا. وأخيراً استخدم التحليلات التنبؤية لتشغيل السيناريوهات التي ستساعد في توجيه الإجراءات المستقبلية والاتجاهات والأحداث المستقبلية التي يحتمل حدوثها.
فيما يلي الأنواع الستة للتحليل الإحصائي:
يتضمن التحليل الوصفي جمع البيانات وتفسيرها وتحليلها وتلخيصها لتقديمها في شكل مخططات ورسوم بيانية وجداول. فبدلاً من استخلاص النتائج، فإنه يجعل البيانات المعقدة سهلة القراءة والفهم.
يستخدم التحليل الوصفي أدوات محددة لوصف البيانات. وهي عبارة عن حسابات بسيطة نسبياً تعطي صورة أساسية عن شكل البيانات بشكل عام. وتتضمن الأدوات الوصفية: التردد والنسب المئوية ومقاييس الاتجاه المركزي. كما يوضح التردد عدد المرات التي حدث فيها شيء ما في مجموعة بيانات. أما النسب المئوية فهي حسابات توضح نسبة. وتمثل مقاييس الاتجاه المركزي المتوسط والوسيط والمنوال. وكذلك تصف هذه الأدوات النقطة المركزية (الوسيط) أو الأكثر شيوعاً (المنوال) أو المتوسط.
يُجري التحليل الوصفي تحليل البيانات ويصف أفضل مسار للعمل بناءً على النتائج. حيث إنه نوع من التحليل الإحصائي يساعدك على اتخاذ قرار مستنير.
يركز التحليل الاستنتاجي على استخلاص استنتاجات ذات مغزى على أساس البيانات التي تم تحليلها. فيدرس العلاقة بين المتغيرات المختلفة أو يضع تنبؤات لجميع السكان.
التحليل التنبئي هو نوع من تحليل البيانات الذي يحلل البيانات لاشتقاق الاتجاهات السابقة والتنبؤ بالأحداث المستقبلية على أساسها. فيستخدم خوارزميات التعلم الآلي، واستخراج البيانات، ونمذجة البيانا ، والذكاء الاصطناعي لإجراء التحليل للبيانات.
يُجري التحليل الوصفي تحليل البيانات ويصف أفضل مسار للعمل بناءً على النتائج. حيث إنه نوع من التحليل الإحصائي يساعدك على اتخاذ قرار مستنير.
يشبه التحليل الاستكشافي التحليل الاستدلالي، لكن الاختلاف هو أنه يتضمن استكشاف جمعيات البيانات غير المعروفة، فيحلل العلاقات المحتملة داخل البيانات.
يركز التحليل السببي على تحديد علاقة السبب والنتيجة بين المتغيرات المختلفة داخل البيانات الأولية. بكلمات بسيطة، إنها تحدد سبب حدوث شيء ما وتأثيره على المتغيرات الأخرى. فيمكن استخدام هذه المنهجية من قبل الشركات لتحديد سبب الفشل.
يمكن أن يسمى تحليل البيانات نعمة للبشرية وله العديد من الفوائد لكل من الأفراد والمنظمات. فيما يلي بعض الأسباب التي تجعلك تفكر في الاستثمار في تحليل البيانات: حيث يمكن أن يساعدك في تحديد الأرقام الشهرية والفصلية والسنوية لأرباح المبيعات والتكاليف مما يسهل اتخاذ قراراتك. ويمكن أن تساعدك على اتخاذ قرارات مستنيرة وصحيحة. وهكذا يمكن أن يساعدك في تحديد المشكلة أو سبب الفشل وإجراء التصحيحات. على سبيل المثال/ يمكنه تحديد سبب الزيادة في إجمالي التكاليف ويساعدك على خفض النفقات المهدرة. وهكذا يمكن أن يساعدك في إجراء تحليل للسوق ووضع استراتيجية تسويق ومبيعات فعالة. كما أنه يساعدك على تحسين كفاءة العمليات المختلفة.
هذه الأساليب كافية لك للبدء في مجال التحليل الإحصائي. لذا حاول استخدام هذه الأساليب على مجموعات البيانات المختلفة للحصول على مزيد من المعرفة عنها واستكشاف المحلل بداخلك. فبعض الطرق الأساسية المستخدمة في عملية التحليل هي ما يلي.
الانحدار
تُستخدم هذه الطريقة لتقدير العلاقة بين المتغيرات التابعة والمستقلة. وهي مفيدة في تحديد قوة العلاقة بين هذه المتغيرات ونمذجة العلاقة المستقبلية بينها. ولها أشكال متعددة مثل الانحدار الخطي والانحدار الخطي المتعدد والانحدار غير الخطي. حيث يكون الانحدار الخطي والانحدار الخطي المتعدد أكثرها شيوعاً. وهي تقدم تطبيقات عديدة في التخصصات، بما في ذلك التمويل.
الانحراف المعياري
تقيس الانحرافات المعيارية مدى تركيز البيانات حول متوسطها. سيؤدي المزيد من التركيز إلى انحراف معياري أصغر والعكس صحيح. بعبارة أخرى، يمكننا القول إنها مقياس تلخيصي للفرق بين كل ملاحظة والمتوسط. إذا أضفنا الاختلافات، فسيكون الموجب مساوياً تماماً للسالب، وإضافة كليهما ستكون النتيجة صفراً. لحساب الانحراف المعياري، نحتاج إلى التباين أولاً. التباين هو مقياس لمدى انتشار الأرقام المحددة.
المتوسط
المتوسط هو مجموع قائمة الأرقام مقسوماً على العدد الإجمالي للعناصر في القائمة. ويُعرف أيضاً باسم الوسط الحسابي. افترض أن لدينا 3 تقييمات مختلفة لفيلم. الأول هو 7، والثاني هو 9، والثالث 6. يتم حساب متوسط هذه التقييمات عن طريق جمع هذه التقييمات ثم قسمتها على عدد التقييمات.
يتم إعطاؤها بالصيغة:
حيث أن nهي عدد العناصر، وx هي العنصر، و x̄هي المتوسط. لذا، فإن متوسط تقييم الفيلم سيكون (7+9+6)/3 = 7.33. الآن تُستخدم قيمة المتوسط هذه كأساس للمقارنة مع التقييمات الأخرى. يُقال عن التقييم الذي يزيد عن 7.33 أنه تقييم أعلى من المتوسط، ويُقال عن التقييم الذي يقل عن 7.33 أنه تقييم أقل من المتوسط. يُستخدم هذا المتوسط أيضاً في حساب الانحراف المعياري.
تحديد حجم العينة
تحديد حجم العينة كما يوحي الاسم هو عينات مجموعة البيانات التي تُستخدم لتحليل البيانات. هذه التقنية مفيدة عندما يكون لدينا كمية كبيرة من مجموعة البيانات. ولا نريد المرور عبر كل ميزة من ميزات مجموعة البيانات. بدلاً من ذلك، نختار القليل من البيانات من مجموعة البيانات بحيث لا تكون هذه البيانات متحيزة. فالفكرة كلها هي الحصول على الكمية المناسبة من البيانات للعينات، لأنه إذا لم تكن محدثة، فسيتأثر تحليل البيانات بالكامل. لذا، فإن تحديد حجم العينة يعد قضية مهمة لأن حجم العينة الكبير سيؤدي إلى إهدار الوقت والمال والموارد بينما سيؤدي حجم العينة الصغير إلى نتيجة غير دقيقة. في كثير من الحالات، من السهل تحديد الحد الأدنى لحجم العينة لتقدير معلمة العملية.
عند جمع بيانات العينة وحساب العينة، فإن متوسط العينة يختلف في الغالب عن متوسط السكان. ويمكن تسمية الفرق بين متوسط العينة ومتوسط السكان بالخطأ. ويعطى هامش هذا الخطأ بالصيغة التالية:
اختبار الفرضيات
في هذا الاختبار، نحدد ما إذا كانت الفرضية صحيحة لمجموعة البيانات أم لا. يختبر المحلل العينات بهدف قبول أو رفض الفرضية الصفرية. ويبدأ المحلل الإحصائي الاختبارات بعدد عشوائي من السكان. حيث أن الفرضية الصفرية هي القيمة التي يعتقد المحلل أنها صحيحة والبديلة خاطئة.
على سبيل المثال، إذا أراد شخص ما إثبات أن فرصة سقوط عملة معدنية على وجهها 50%، فإن الفرضية الصفرية ستكون نعم، والفرضية البديلة ستكون لا. رياضياً، يمكننا تمثيل الفرضية الصفرية على أنها H o : P=0.5. ويمكن الإشارة إلى الفرضية البديلة بواسطة H a .
يتم أخذ 100 عملة معدنية من مجموعة عشوائية من العملات المعدنية ثم يتم اختبار الفرضية الصفرية. الآن إذا رأينا أن رمي 100 عملة معدنية يؤخذ على أنه 40 صورة و 60 كتابة. فيمكن للمحلل أن يستنتج أن العملة المعدنية ليس لديها فرصة 50٪ للهبوط على الصورة وسيقبل الفرضية البديلة ويرفض الفرضية الصفرية. بعد ذلك سيتم اختبار فرضية جديدة، وهذه المرة يكون لدى البنس فرصة 40٪ للهبوط على الصور.ة
تقدم مؤسسة البيان للخدمات الأكاديمية خدمات بحثية متكاملة، فلا تتردد في طلب أي من هذه الخدمات من هنا
أضف بريدك الالكترونى ليصلك كل جديد.