میانگین/میانه/نما (Mean Median Mode)
در آمار و یادگیری ماشین، سه عدد مهم داریم: «میانگین»، «میانه»، و «نما». این سه شاخص، خلاصه یک گروه عدد هستند و رفتار داده را سریع نشان می دهند.
تعاریف سریع با مثال سرعت خودروها
میانگین (Mean) برابر میانگین حسابی است. میانه (Median) عدد میانی پس از مرتب سازی است. نما (Mode) پرتکرارترین مقدار است. مثال ما: سرعت 13 خودرو.
speed = [99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86]
print(len(speed))
میانگین (Mean)
برای میانگین، همه اعداد را جمع می کنیم. سپس بر تعداد تقسیم می کنیم. با NumPy، متد mean() همین کار را انجام می دهد.
import numpy
speed = [99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86]
x = numpy.mean(speed)
print(x)
میانه (Median)
میانه، مقدار وسط پس از مرتب سازی است. اگر دو عدد وسط داریم، میانگین آن دو عدد می شود میانه. NumPy متد median() را دارد.
import numpy
speed = [99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86]
x = numpy.median(speed)
print(x)
import numpy
speed = [99, 86, 87, 88, 86, 103, 87, 94, 78, 77, 85, 86]
x = numpy.median(speed)
print(x)
نما (Mode)
نما پرتکرارترین مقدار در داده است. در SciPy، متد mode() آن را برمی گرداند. نما برای دیدن «بیشترین تکرار» عالی است.
from scipy import stats
speed = [99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86]
x = stats.mode(speed)
print(x)
گام های عملی با «میانگین میانه نما»
- داده را بررسی و تمیز کن.
- مرتب سازی را انجام بده.
- میانگین، میانه، و نما را محاسبه کن.
- نتیجه را تفسیر و مقایسه کن.
جمع بندی سریع
- میانگین برای روند کلی خوب است.
- میانه در برابر داده های پرت مقاوم است.
- نما پرتکرارترین مقدار را نشان می دهد.
- ترکیبشان فهم بهتری می دهد.
برای ادامه میانگین میانه نما در عمل، فصل انحراف معیار را ببین. همچنین برای مقدمه قبلی، به شروع یادگیری ماشین برگرد.