انحراف معیار (Standard Deviation)
«انحراف معیار» عددی برای سنجش پخش شدگی داده هاست. اگر انحراف معیار کم باشد، داده ها نزدیک میانگین اند. اگر زیاد باشد، داده ها پراکندگی بیشتری دارند.
انحراف معیار یعنی چه؟
انحراف معیار (Standard Deviation) فاصله معمول هر مقدار تا میانگین است. مقدار کم یعنی بیشتر اعداد نزدیک میانگین اند. مقدار زیاد یعنی مقداری دورتر از میانگین داریم.
محاسبه با NumPy: مثال ساده
از متد std() برای محاسبه استفاده می کنیم. این مثال روی سرعت 7 خودروست.
import numpy
speed = [86, 87, 88, 86, 87, 85, 86]
x = numpy.std(speed)
print(x)
پراکندگی بیشتر، انحراف معیار بزرگ تر
وقتی بازه اعداد بزرگ تر است، انحراف معیار هم بزرگ تر می شود.
import numpy
speed = [32, 111, 138, 28, 59, 77, 97]
x = numpy.std(speed)
print(x)
واریانس (Variance)
«واریانس» میانگینِ مربعِ فاصله اعداد از میانگین است. ریشه دوم واریانس برابر انحراف معیار است.
import numpy
speed = [32, 111, 138, 28, 59, 77, 97]
x = numpy.var(speed)
print(x)
رابطه واریانس و انحراف معیار
انحراف معیار = ریشه دوم واریانس. پس اگر واریانس بزرگ باشد، انحراف معیار هم بزرگ است.
import numpy
speed = [32, 111, 138, 28, 59, 77, 97]
var_value = numpy.var(speed)
std_value = numpy.std(speed)
print(var_value)
print(std_value)
گام های عملی سریع
- میانگین را حساب کن.
- فاصله هر مقدار تا میانگین را بگیر.
- فاصله ها را به توان دو برسان.
- میانگینشان می شود واریانس.
- ریشه دوم بگیر؛ می شود انحراف معیار.
جمع بندی سریع
- انحراف معیار کم یعنی داده ها متمرکزند.
- انحراف معیار زیاد یعنی پراکندگی بالاست.
- ریشه واریانس برابر انحراف معیار است.
- برای محاسبه از
numpy.std()استفاده کن.
ادامه مسیر: فصل میانگین/میانه/نما و بعد صدک ها. برای شروع مسیر، به یادگیری ماشین: شروع برگرد.