Python – انحراف معیار (Standard Deviation)
انحراف معیار چیست؟
انحراف معیار عددی است که نشان میدهد مقادیر چقدر پراکنده هستند.
یک انحراف معیار پایین به این معنی است که بیشتر اعداد به مقدار میانگین (متوسط) نزدیک هستند.
یک انحراف معیار بالا به این معنی است که مقادیر در بازه گستردهتری پراکنده شدهاند.
مثال: این بار ما سرعت 7 ماشین را ثبت کردهایم:
speed = [86, 87, 88, 86, 87, 85, 86]
انحراف معیار برابر است با:
0.9
به این معنی که بیشتر مقادیر در محدوده 0.9 از مقدار میانگین، که 86.4 است، قرار دارند.
بیایید همین کار را با انتخابی از اعداد با بازه وسیعتر انجام دهیم:
speed = [32, 111, 138, 28, 59, 77, 97]
انحراف معیار برابر است با:
37.85
به این معنی که بیشتر مقادیر در محدوده 37.85 از مقدار میانگین، که 77.4 است، قرار دارند.
همانطور که میبینید، یک انحراف معیار بالاتر نشان میدهد که مقادیر در بازه گستردهتری پراکنده شدهاند.
ماژول NumPy دارای یک متد برای محاسبه انحراف معیار است.
مثال
از متد std()
در NumPy برای یافتن انحراف معیار استفاده کنید:
import numpy
speed = [86, 87, 88, 86, 87, 85, 86]
x = numpy.std(speed)
print(x)
مثال دیگر
import numpy
speed = [32, 111, 138, 28, 59, 77, 97]
x = numpy.std(speed)
print(x)
واریانس
واریانس یک عدد دیگر است که نشان میدهد مقادیر چقدر پراکنده هستند.
در واقع، اگر جذر واریانس را بگیرید، انحراف معیار را به دست میآورید!
یا به عبارت دیگر، اگر انحراف معیار را در خودش ضرب کنید، واریانس را به دست میآورید!
برای محاسبه واریانس باید به ترتیب زیر عمل کنید:
- میانگین را پیدا کنید:
(32+111+138+28+59+77+97) / 7 = 77.4
- برای هر مقدار: تفاوت با میانگین را پیدا کنید:
32 - 77.4 = -45.4
111 - 77.4 = 33.6
138 - 77.4 = 60.6
28 - 77.4 = -49.4
59 - 77.4 = -18.4
77 - 77.4 = - 0.4
97 - 77.4 = 19.6
- برای هر تفاوت: مقدار مربعی را پیدا کنید:
(-45.4)² = 2061.16
(33.6)² = 1128.96
(60.6)² = 3672.36
(-49.4)² = 2440.36
(-18.4)² = 338.56
(- 0.4)² = 0.16
(19.6)² = 384.16
- واریانس، میانگین این مقادیر مربعی است:
(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2
خوشبختانه، NumPy دارای یک متد برای محاسبه واریانس است:
مثال
از متد var()
در NumPy برای یافتن واریانس استفاده کنید:
import numpy
speed = [32, 111, 138, 28, 59, 77, 97]
x = numpy.var(speed)
print(x)
انحراف معیار
همانطور که یاد گرفتیم، فرمول برای یافتن انحراف معیار جذر واریانس است:
√1432.25 = 37.85
یا، همانطور که در مثال قبلی دیدیم، از NumPy برای محاسبه انحراف معیار استفاده کنید:
مثال
از متد std()
در NumPy برای یافتن انحراف معیار استفاده کنید:
import numpy
speed = [32, 111, 138, 28, 59, 77, 97]
x = numpy.std(speed)
print(x)
نمادها
انحراف معیار معمولاً با نماد سیگما: σ نمایش داده میشود.
واریانس معمولاً با نماد سیگما به توان دو: σ² نمایش داده میشود.
خلاصه فصل
انحراف معیار و واریانس اصطلاحاتی هستند که در یادگیری ماشین به طور مکرر استفاده میشوند، بنابراین درک چگونگی محاسبه آنها و مفهوم پشت آنها اهمیت دارد.
برای ارسال نظر لطفا ابتدا وارد حساب کاربری خود شوید. صفحه ورود و ثبت نام