لقد تغير متوسط عملية التحليل الإحصائي بشكل جذري خلال العقد الماضي. سواء كانت المعدات المستخدمة في المكاتب أو البرامج المستخدمة، فإن القليل جدًا من الأشياء تبدو كما كانت من قبل. كما أن هناك شيء آخر مختلف تمامًا هو مقدار البيانات التي لدينا في متناول أيدينا. حيث كانت نادرة في يوم من الأيام، بينما الآن يوجد كمية هائلة من البيانات مقارنة بما كانت تبدو عليه. ولكن، سيكون الأمر مربكًا فقط إذا كنت لا تعرف شيء عن تحليل البيانات للعثور على معنى حقيقي للبيانات.
إذاً لتكون قادرًا على تفسير تلك البيانات بدقة؟ يعود الأمر كله إلى استخدام الأساليب الصحيحة للتحليل الإحصائي. وهي الطريقة التي نعالج بها ونجمع عينات من البيانات للكشف عن الأنماط والاتجاهات. بالنسبة لعملية تحليل البيانات، هناك خمسة للاختيار من بينها: المتوسط والانحراف المعياري والانحدار واختبار الفرضيات وتحديد حجم العينة.
ليس هناك من ينكر أن العالم أصبح مهوسًا بالبيانات الضخمة، بغض النظر عما إذا كنت عالم بيانات أم لا. لهذا السبب، عليك أن تعرف من أين تبدأ؟ هذه الطرق الخمس الأساسية الفعالة في الوصول إلى استنتاجات دقيقة تعتمد على البيانات.
الطريقة الأولى المستخدمة لإجراء التحليل الإحصائي هي المتوسط الحسابي، والتي يشار إليها بشكل أكثر شيوعاً بالوسط. فعندما تبحث لحساب المتوسط، فإنك تضيف قائمة من الأرقام ثم تقسم هذا الرقم على العناصر الموجودة في القائمة. وكذلك عند استخدام هذه الطريقة، فإنها تسمح بتحديد الاتجاه العام لمجموعة البيانات. فضلاً عن القدرة على الحصول على عرض سريع ومختصر للبيانات. فيستفيد مستخدمو هذه الطريقة أيضًا من الحساب المبسط والسريع.
يأتي المتوسط الإحصائي بالنقطة المركزية للبيانات التي تتم معالجتها، تتم الإشارة إلى النتيجة بمتوسط البيانات المقدمة. ففي الحياة الواقعية، عادة ما يستخدم الناس الوسيلة فيما يتعلق بالبحث والأكاديميين.
كيف تجد الوسيلة؟؟ للعثور على متوسط بياناتك، عليك أولاً جمع الأرقام معًا. ومن ثم قسمة المجموع على عدد الأرقام الموجودة ضمن مجموعة البيانات أو القائمة.
كمثال، لإيجاد متوسط 6 و18 و24،عليك أولاً جمعهم معاً، ليساوي 48، ثم اقسم على عدد الأرقام في القائمة أي 3 ومنه المتوسط هو 16.
بينما بخصوص الجانب السلبي لاستخدام المتوسط الحسابي في عملية التحليل الإحصائي. فعندما يكون استخدام الوسيلة أمرًا رائعًا، لا يوصى به كطريقة تحليل إحصائي قائمة بذاتها. وهذا لأن القيام بذلك يمكن أن يفسد الجهود الكاملة وراء الحساب. نظرًا لأنه مرتبط أيضًا بالوضع (القيمة التي تحدث غالبًا) والوسيط في بعض مجموعات البيانات. فعندما تتعامل مع عدد كبير من نقاط البيانات مع عدد كبير من القيم المتطرفة (نقطة بيانات تختلف اختلافًا كبيرًا عن غيرها). أو توزيع غير دقيق للبيانات، فإن المتوسط لا يعطي النتائج الأكثر دقة في التحليلات الإحصائية لقرار محدد.
الانحراف المعياري هو أسلوب التحليل الإحصائي الذي يقيس انتشار البيانات حول المتوسط. فعندما تتعامل مع انحراف معياري مرتفع، فهذا يشير إلى البيانات المنتشرة على نطاق واسع من المتوسط. وبالمثل، يوضح الانحراف المنخفض أن معظم البيانات تتماشى مع المتوسط ويمكن أيضًا تسميتها بالقيمة المتوقعة للمجموعة.
ويستخدم الانحراف المعياري بشكل أساسي عندما تحتاج إلى تحديد تشتت نقاط البيانات (سواء كانت مجمعة أم لا). لنفترض أنك مسوق أجرت مؤخرًا استبيانًا للعملاء. بمجرد حصولك على نتائج الاستطلاع، فأنت مهتم بقياس موثوقية الإجابات من أجل التنبؤ. بما إذا كان لدى مجموعة أكبر من العملاء نفس الإجابات. فإذا حدث انحراف معياري منخفض، فسيظهر أنه يمكن توقع الإجابات على مجموعة أكبر من العملاء.
كيفية إيجاد الانحراف المعياري؟؟ الصيغة لحساب الانحراف المعياري هي: σ2 = Σس - μ) 2 / ن(. ففي هذه الصيغة: رمز الانحراف المعياري هو σ، بينما Σ تعني مجموع البيانات. وتشير x إلى قيمة مجموعة البيانات، و μ تعني متوسط البيانات، و σ2تعني التباين، وأيضاً يشير n إلى عدد نقاط البيانات في المجتمع.
للعثور على الانحراف المعياري، أوجد متوسط الأرقام ضمن مجموعة البيانات. حيث لكل رقم ضمن مجموعة البيانات، واطرح المتوسط وربّع النتيجة وهو هذا الجزء من الصيغة (x - μ) 2)). ومن ثم أوجد متوسط هذه الفروق التربيعية، فخذ الجذر التربيعي للإجابة النهائية.
أما الجانب السلبي لاستخدام الانحراف المعياري، ففي ملاحظة مماثلة للجانب السلبي لاستخدام المتوسط. يمكن أن يكون الانحراف المعياري مضللًا عند استخدامه كأسلوب وحيد في تحليلك الإحصائي. على سبيل المثال، إذا كانت البيانات التي تعمل بها تحتوي على عدد كبير جدًا من القيم المتطرفة. أو نمط غريب مثل منحنى غير عادي، فلن يوفر الانحراف المعياري المعلومات اللازمة لاتخاذ قرار مستنير.
عندما يتعلق الأمر بالإحصاءات، فإن الانحدار هو العلاقة بين المتغير التابع أي البيانات التي تريد قياسها. والمتغير المستقل أي البيانات المستخدمة للتنبؤ بالمتغير التابع. فيمكن تفسيره أيضًا من خلال كيفية تأثير أحد المتغيرات على آخر؟ أو التغييرات في متغير تؤدي إلى تغييرات في آخر، بشكل أساسي السبب والنتيجة. حيث إنه يعني أن النتيجة تعتمد على متغير واحد أو أكثر.
ويشير الخط المستخدم في الرسوم البيانية لتحليل الانحدار إلى ما إذا كانت العلاقات بين المتغيرات قوية أم ضعيفة. بالإضافة إلى إظهار الاتجاهات على مدى فترة زمنية محددة. حيث تُستخدم هذه الدراسات في التحليل الإحصائي لعمل تنبؤات وتوقعات للاتجاهات. على سبيل المثال، يمكنك استخدام الانحدار للتنبؤ بكيفية بيع منتج أو خدمة معينة لعملائك. أو يستخدم الانحدار للتنبؤ بكيفية ظهور حركة المرور العضوية بعد 6 أشهر من الآن.
في حين أن صيغة الانحدار المستخدمة لمعرفة كيف يمكن أن تبدو البيانات في المستقبل هي. y = A + B (X)، حيث في هذه الصيغة يشير A إلى تقاطع y ، قيمة y عندما .x = 0 X هو المتغير التابع، وY هو المتغير المستقل، ويشير B إلى المنحدر، أو الارتفاع على المدى.
بينما الجانب السلبي للانحدار تتمثل إحدى عيوب استخدام الانحدار كجزء من تحليلك الإحصائي في أن الانحدار ليس مميزًا للغاية. مما يعني أنه على الرغم من أهمية القيم المتطرفة في مخطط مبعثر (أو رسم بياني لتحليل الانحدار). فإن أسباب هذه القيم متطرفة، ويمكن أن يكون هذا السبب أي شيء من خطأ في التحليل إلى البيانات التي يتم تحجيمها بشكل غير مناسب.
يمكن أن تمثل نقطة البيانات التي تم تمييزها على أنها خارجية أشياء كثيرة، مثل المنتج الأكثر مبيعًا. فيحثك خط الانحدار على تجاهل هذه القيم المتطرفة ورؤية الاتجاهات في البيانات فقط.
بغض النظر عن طريقة التحليل الإحصائي التي تختارها، تأكد من تدوين ملاحظة خاصة لكل جانب سلبي محتمل، بالإضافة إلى صيغتها الفريدة. بالطبع، لا يوجد معيار ذهبي أو طريقة صحيحة أو خاطئة للاستخدام. حيث سيعتمد ذلك على نوع البيانات التي جمعتها، بالإضافة إلى الأفكار التي تتطلع إلى الحصول عليها كنتيجة نهائية.
تقدم مؤسسة البيان للخدمات الأكاديمية خدمات بحثية متكاملة، فلا تتردد في طلب أي من هذه الخدمات من هنا.
فيديو توضيحي:
أضف بريدك الالكترونى ليصلك كل جديد.