Python – انحراف معیار (Standard Deviation)

انحراف معیار چیست؟

انحراف معیار عددی است که نشان می‌دهد مقادیر چقدر پراکنده هستند.

یک انحراف معیار پایین به این معنی است که بیشتر اعداد به مقدار میانگین (متوسط) نزدیک هستند.

یک انحراف معیار بالا به این معنی است که مقادیر در بازه گسترده‌تری پراکنده شده‌اند.

مثال: این بار ما سرعت 7 ماشین را ثبت کرده‌ایم:

speed = [86, 87, 88, 86, 87, 85, 86]

انحراف معیار برابر است با:

0.9

به این معنی که بیشتر مقادیر در محدوده 0.9 از مقدار میانگین، که 86.4 است، قرار دارند.

بیایید همین کار را با انتخابی از اعداد با بازه وسیع‌تر انجام دهیم:

speed = [32, 111, 138, 28, 59, 77, 97]

انحراف معیار برابر است با:

37.85

به این معنی که بیشتر مقادیر در محدوده 37.85 از مقدار میانگین، که 77.4 است، قرار دارند.

همانطور که می‌بینید، یک انحراف معیار بالاتر نشان می‌دهد که مقادیر در بازه گسترده‌تری پراکنده شده‌اند.

ماژول NumPy دارای یک متد برای محاسبه انحراف معیار است.

مثال
از متد std() در NumPy برای یافتن انحراف معیار استفاده کنید:

import numpy

speed = [86, 87, 88, 86, 87, 85, 86]

x = numpy.std(speed)

print(x)

مثال دیگر

import numpy

speed = [32, 111, 138, 28, 59, 77, 97]

x = numpy.std(speed)

print(x)

واریانس

واریانس یک عدد دیگر است که نشان می‌دهد مقادیر چقدر پراکنده هستند.

در واقع، اگر جذر واریانس را بگیرید، انحراف معیار را به دست می‌آورید!

یا به عبارت دیگر، اگر انحراف معیار را در خودش ضرب کنید، واریانس را به دست می‌آورید!

برای محاسبه واریانس باید به ترتیب زیر عمل کنید:

  • میانگین را پیدا کنید:
(32+111+138+28+59+77+97) / 7 = 77.4
  • برای هر مقدار: تفاوت با میانگین را پیدا کنید:
32 - 77.4 = -45.4

111 - 77.4 = 33.6
138 - 77.4 = 60.6
28 - 77.4 = -49.4
59 - 77.4 = -18.4
77 - 77.4 = - 0.4
97 - 77.4 = 19.6
  • برای هر تفاوت: مقدار مربعی را پیدا کنید:
(-45.4)² = 2061.16
 (33.6)² = 1128.96
 (60.6)² = 3672.36
(-49.4)² = 2440.36
(-18.4)² =  338.56
(- 0.4)² =    0.16
 (19.6)² =  384.16
  • واریانس، میانگین این مقادیر مربعی است:
(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2

خوشبختانه، NumPy دارای یک متد برای محاسبه واریانس است:

مثال
از متد var() در NumPy برای یافتن واریانس استفاده کنید:

import numpy

speed = [32, 111, 138, 28, 59, 77, 97]

x = numpy.var(speed)

print(x)

انحراف معیار

همانطور که یاد گرفتیم، فرمول برای یافتن انحراف معیار جذر واریانس است:

√1432.25 = 37.85

یا، همانطور که در مثال قبلی دیدیم، از NumPy برای محاسبه انحراف معیار استفاده کنید:

مثال
از متد std() در NumPy برای یافتن انحراف معیار استفاده کنید:

import numpy

speed = [32, 111, 138, 28, 59, 77, 97]

x = numpy.std(speed)

print(x)

نمادها

انحراف معیار معمولاً با نماد سیگما: σ نمایش داده می‌شود.

واریانس معمولاً با نماد سیگما به توان دو: σ² نمایش داده می‌شود.

خلاصه فصل

انحراف معیار و واریانس اصطلاحاتی هستند که در یادگیری ماشین به طور مکرر استفاده می‌شوند، بنابراین درک چگونگی محاسبه آنها و مفهوم پشت آنها اهمیت دارد.

پست های مرتبط

مطالعه این پست ها رو از دست ندین!
Python - محدود کردن داده (MongoDB Limit)

Python – محدود کردن داده (MongoDB Limit)

Python MongoDB محدود کردن نتایج برای محدود کردن نتایج در MongoDB، از متد limit() استفاده می‌کنیم. متد limit() یک...

بیشتر بخوانید
Python - بروزرسانی (MongoDB Update)

Python – بروزرسانی (MongoDB Update)

به‌روزرسانی یک رکورد برای به‌روزرسانی یک رکورد یا سند در MongoDB، از متد update_one() استفاده می‌کنیم. پارامتر اول متد...

بیشتر بخوانید
Python - حذف کالکشن (MongoDB Drop Collection)

Python – حذف کالکشن (MongoDB Drop Collection)

حذف کالکشن شما می‌توانید یک جدول یا کالکشن در MongoDB را با استفاده از متد drop() حذف کنید. مثالحذف...

بیشتر بخوانید

نظرات

سوالات و نظراتتون رو با ما به اشتراک بذارید

برای ارسال نظر لطفا ابتدا وارد حساب کاربری خود شوید.