الفرق بين الانحراف المعياري والخطأ القياسي الفرق بين
مقدمة
قياسي D ظهور <سد> و S تاندارد > E رور (سي) هي مصطلحات مماثلة على ما يبدو؛ ومع ذلك، فهي متنوعة من الناحية المفاهيمية بحيث أنها تستخدم بشكل متبادل تقريبا في الأدب الإحصائي. وعادة ما يسبق كلا المصطلحين رمز زائد-ناقص (+/-) مما يدل على حقيقة أنها تحدد قيمة متماثلة أو تمثل مجموعة من القيم. ويظهر المصطلحان دائما بمتوسط (متوسط) لمجموعة من القيم المقاسة. ومن المثير للاهتمام، سي لا علاقة لها بالمعايير، مع الأخطاء، أو مع الاتصالات من البيانات العلمية.
نظرة مفصلة على أصل وشرح سد و سي سوف تكشف، لماذا الإحصائيين المهنيين وأولئك الذين يستخدمونه بشكل مرئي، على حد سواء تميل إلى الخطأ.الانحراف المعياري
سد
وصفي
إحصائية تصف توزيع التوزيع. كمقياس، فإنه من المفيد عندما يتم توزيع البيانات عادة. ومع ذلك، فإنه أقل فائدة عندما تكون البيانات شديدة الانحراف أو ثنائية النسق لأنه لا يصف بشكل جيد جدا شكل التوزيع. عادة، نستخدم سد عند الإبلاغ عن خصائص العينة، لأننا نعتزم وصف كم البيانات تختلف حول المتوسط. وهناك إحصاءات مفيدة أخرى لوصف انتشار البيانات هي المدى الرباعي، والمئينين الخامس والعشرين والسابع والسبعين، ونطاق البيانات.
إحصائية أيضا، ويعرف بأنه مربع الانحراف المعياري. ولا يتم الإبلاغ عنها عادة عند وصف النتائج، وإنما هي صيغة أكثر ترابطيا رياضيا (أ. ك: مجموع الانحرافات التربيعية) وتلعب دورا في حساب الإحصاءات. - <>> على سبيل المثال، إذا كان لدينا إحصائيان
P& Q مع فروق معروفة فار (P) & < فار (Q) ، ثم الفرق بين P + Q يساوي مجموع الفروق: فار (P) + > فار (Q) . ومن الواضح الآن لماذا يرغب الإحصائيون في الحديث عن الفروق. ولكن الانحرافات المعيارية تحمل معنى هاما للانتشار، خاصة عندما تكون البيانات موزعة عادة: يمكن توقع الفاصل الزمني +/- 1 سد لالتقاط 2/3 من العينة، والفاصل الزمني يعني + - 2 سد
يمكن أن يتوقع التقاط 95٪ من العينة. يوفر سد إشارة إلى مدى اختلاف الردود الفردية على السؤال أو "الانحراف" عن المتوسط.سد يروي الباحث كيف انتشرت الإجابات هي - هل تتركز حول المتوسط، أو متناثرة بعيدا وعريضة؟ هل قام كل من المشاركين في تقييم منتجك في منتصف نطاقك، أم أن بعضهم وافق عليه ورفضه بعض الشيء؟ جرب تجربة حيث يطلب من المشاركين تقييم منتج على سلسلة من الصفات على مقياس من 5 نقاط. وكان متوسط مجموعة من عشرة مشاركين (المسمى "A" من خلال "J" أدناه) ل "قيمة جيدة مقابل المال" 3. 2 مع سد من 0. 4 وكان متوسط "موثوقية المنتج" 3. 4 مع سد من 2. 1. للوهلة الأولى (النظر في وسائل فقط) يبدو أن الموثوقية تم تصنيفها أعلى من القيمة. ولكن يمكن أن تشير أعلى درجة من حيث الموثوقية (كما هو مبين في التوزيع أدناه) إلى أن الاستجابات كانت مستقطبة جدا، حيث لم يكن لدى معظم المجيبين أية مشكلات تتعلق بالوثوقية (صنفوا السمة ب "5")، ولكن كان عدد أصغر من المشاركين، مشكلة الموثوقية وتصنيف السمة "1". إن النظر إلى الوسط وحده لا يروي سوى جزء من القصة، ولكن في كثير من الأحيان، وهذا ما يركز عليه الباحثون. توزيع الردود من المهم النظر فيها و سد يوفر قياسا وصفيا قيما لهذا. المستجيب
قيمة جيدة مقابل المال
موثوقية المنتج
A
3 | 1 | B |
3 | 1 | 1 |
D | 3 | 1 |
E | 4 | 5 |
F | 4 | 5 |
G | 3 | 5 |
H | 3 | 5 |
I | 3 | 5 |
J | 3 | 5 |
يعني | 3. 2 | 3. 4 |
الأمراض المنقولة جنسيا. ديف. | 0. 4 | 2. 1 |
أول مسح: يصنف المستجيبون منتجا على مقياس مكون من 5 نقاط | يمكن أن يؤدي توزعان مختلفان جدا للاستجابات إلى مقياس تقييم من 5 نقاط إلى نفس المتوسط. ضع في اعتبارك المثال التالي الذي يعرض قيم الاستجابة لتصنيفين مختلفين. | في المثال الأول (التصنيف "A")، سد هو صفر لأن جميع الردود كانت بالضبط القيمة المتوسطة. ولم تحيد الردود الفردية على الإطلاق عن المتوسط. |
في التقييم "ب"، على الرغم من أن متوسط المجموعة هو نفسه (3. 0) كأول توزيع، فإن الانحراف المعياري أعلى. ويظهر الانحراف المعياري 1. 15 أن الردود الفردية، في المتوسط *، كانت أكثر قليلا من 1 نقطة بعيدا عن المتوسط. | المستجيب | التقييم "أ" |
التقييم "ب"
A
3
1
B | 3 | 2 |
2 | D | |
3 | 3 | E |
3 | 3 | F |
3 | 3 | G |
3 > 3 | H | 3 |
4 | I | 3 |
4 | J | 3 |
5 | يعني | 3. 0 |
3. 0 | الأمراض المنقولة جنسيا. ديف. | 0. 00 |
1. 15 | المسح الثاني: يصنف المستجيبون منتجا على مقياس مكون من 5 نقاط | وهناك طريقة أخرى للنظر في سد وهي رسم التوزيع كرسم بياني للردود. التوزيع مع انخفاض سد يمكن أن تظهر على شكل ضيق طويل القامة، في حين أن سد كبيرة سيشار إليها من قبل شكل أوسع. |
لا يشير مصطلح سد بشكل عام إلى "صواب أو خطأ" أو "أفضل أو أسوأ" - فالسرعة المنخفضة ليست بالضرورة أكثر من المرغوب فيه. ويستخدم فقط كإحصاء وصفي. ويصف التوزيع فيما يتعلق بالمتوسط. | T | إخلاء المسؤولية إكنيكال المتعلقة سد |
التفكير في سد باعتباره "الانحراف المتوسط" هو وسيلة ممتازة لفهم مفاهيمي معناها. ومع ذلك، فإنه لا يحسب في الواقع كمتوسط (إذا كان، ونحن نسميها "الانحراف المتوسط"). بدلا من ذلك، هو "موحدة"، وهي طريقة معقدة إلى حد ما لحساب القيمة باستخدام مجموع المربعات. | لأغراض عملية، الحساب ليس مهما. معظم برامج الجدولة، جداول البيانات أو غيرها من أدوات إدارة البيانات حساب سد بالنسبة لك. والأهم من ذلك هو فهم ما تنقله الإحصاءات. | خطأ قياسي |
خطأ قياسي هو
استنتاجي
إحصائية تستخدم عند مقارنة وسائل العينة (المتوسطات) بين السكان. وهو مقياس
الدقة من متوسط العينة. متوسط العينة هو إحصائية مستمدة من بيانات لها توزيع أساسي. لا يمكننا تصور ذلك بنفس الطريقة التي البيانات، لأننا أجرينا تجربة واحدة ولها قيمة واحدة فقط. وتفيد لنا نظرية إحصائية أن متوسط العينة (لعينة كبيرة "كافية" وتحت ظروف انتظام قليلة) يتم توزيعها بشكل طبيعي تقريبا. الانحراف المعياري لهذا التوزيع الطبيعي هو ما نسميه الخطأ القياسي.
الشكل 2.
توزيع في أسفل ريبري
توزيع البيانات، في حين أن التوزيع في الجزء العلوي هو التوزيع النظري لمتوسط العينة. و سد من 20 هو مقياس لنشر البيانات، في حين أن سي 5 هو مقياس من عدم اليقين حول متوسط العينة.
عندما نرغب في مقارنة وسائل النتائج من تجربة عينة من المعاملة A مقابل العلاج B، فإننا بحاجة إلى تقدير مدى دقة قياسنا للوسائل. في الواقع، نحن مهتمون في كيفية قياسنا بدقة الفرق بين الوسيلتين. ونحن نسمي هذا التدبير الخطأ القياسي للفرق. قد لا تفاجأ لمعرفة أن الخطأ المعياري للفرق في وسيلة العينة هو وظيفة من الأخطاء القياسية للوسائل: الآن بعد أن كنت قد فهمت أن الخطأ القياسي للمتوسط (سي) و الانحراف المعياري للتوزيع (سد) هما وحوش مختلفة، قد تتساءل كيف حصلت على الخلط في المقام الأول. في حين أنها تختلف من الناحية المفاهيمية، لديهم علاقة بسيطة رياضيا: ، حيث n هو عدد من نقاط البيانات. لاحظ أن الخطأ القياسي يعتمد على عنصرين: الانحراف المعياري للعينة، وحجم العينة
n . وهذا يجعل الشعور بديهية: أكبر الانحراف المعياري للعينة، وأقل دقة يمكننا أن نكون عن تقديرنا للمتوسط الحقيقي. أيضا، فإن حجم العينة الكبيرة، والمزيد من المعلومات لدينا عن السكان وبشكل أكثر دقة يمكننا تقدير المتوسط الحقيقي.سي مؤشر على موثوقية المتوسط. سي الصغيرة هو مؤشر على أن متوسط العينة هو انعكاس أكثر دقة من المتوسط السكاني الفعلي.سيؤدي حجم العينة الأكبر عادة إلى سي أصغر (في حين أن سد لا يتأثر مباشرة بحجم العينة).
معظم أبحاث المسح تنطوي على رسم عينة من السكان. ثم نقوم باستنتاجات حول السكان من النتائج التي تم الحصول عليها من تلك العينة. إذا تم سحب عينة ثانية، فإن النتائج على الأرجح لن تتطابق تماما مع العينة الأولى. إذا كانت قيمة متوسط السمة تصنيف 3. 2 لعينة واحدة، قد يكون 3. 4 لعينة ثانية من نفس الحجم. إذا كان لنا أن نرسم عددا لا حصر له من عينات (من حجم متساو) من سكاننا، يمكننا أن عرض وسائل لاحظت كتوزيع. يمكننا بعد ذلك حساب متوسط جميع وسائل العينة لدينا. وهذا يعني أن يساوي المتوسط الحقيقي للسكان. يمكننا أيضا حساب سد من توزيع وسائل العينة. و سد من هذا التوزيع من وسائل العينة هو سي لكل متوسط العينة الفردية.
ونحن، وبالتالي، لدينا أهم ملاحظة:سي هو سد من متوسط السكان.
عينة يعني 1
3. 2
2
3. 4
3 3. 3
4 | 3. 2 |
5 | 3. 1 |
…. | …. |
…. | …. |
…. | …. |
…. | …. |
…. | …. |
يعني | 3. 3 |
الأمراض المنقولة جنسيا. ديف. | 0. 13 |
جدول يوضح العلاقة بين سد و سي | من الواضح الآن أنه إذا كان سد من هذا التوزيع يساعدنا على فهم مدى يعني متوسط العينة من متوسط السكان الحقيقي، ثم يمكننا استخدام هذا لفهم كيف دقيقة أي متوسط العينة الفردية هو بالنسبة إلى المتوسط الحقيقي. هذا هو جوهر سي. |
في الواقع، لقد رسمنا عينة واحدة فقط من سكاننا، ولكن يمكننا استخدام هذه النتيجة لتوفير تقدير لموثوقية لدينا عينة عينة لوحظ. | |
في الواقع، سي يقول لنا أننا يمكن أن يكون 95٪ واثق من أن لدينا عينة عينة لوحظ هو زائد أو ناقص تقريبا 2 (في الواقع 1. 96) أخطاء قياسية من متوسط السكان. | ويبين الجدول أدناه توزيع الردود من أول (وفقط) عينة المستخدمة في أبحاثنا. و سي 13، كونها صغيرة نسبيا، يعطينا مؤشرا على أن متوسطنا قريب نسبيا من المتوسط الحقيقي لسكاننا عموما. هامش الخطأ (عند الثقة 95٪) لمتوسطنا هو (تقريبا) ضعف تلك القيمة (+/- 0. 26)، تقول لنا أن المتوسط الحقيقي هو الأرجح بين 2. 94 و 3. 46. |
|
المدعى |
التقييم
A
3B
3
C
3