نمودار پراکندگی (Scatter Plot)
نمودار پراکندگی یعنی هر داده یک نقطه می شود. محور x یک ویژگی است و محور y ویژگی دیگر.
نمودار پراکندگی چیست؟
در این نمودار، مجموعه داده با نقطه ها نشان داده می شود. این کمک می کند رابطه دو ویژگی را ببینیم.
مثال پایه با مقادیر آماده
import matplotlib.pyplot as plt
x = [5, 7, 8, 7, 2, 17, 2, 9, 4, 11, 12, 9, 6]
y = [99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86]
plt.scatter(x, y)
plt.show()
توضیح نتیجه
اینجا x سن ماشین هاست و y سرعت آن هاست. با دیدن نقاط، رابطه سن و سرعت را حدس می زنیم.
نکته: نتیجه دیداری الزاماً دلیل نیست. داده کم است و ممکن است تصادفی باشد.
داده تصادفی بزرگ با NumPy
می توانیم دو آرایه تصادفی نرمال بسازیم. سپس پراکندگی بزرگ تری رسم کنیم.
مثال: هزار نقطه تصادفی
import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)
plt.scatter(x, y)
plt.show()
گام های عملی
- دو ویژگی مستقل انتخاب کن.
- آرایه x و آرایه y را بساز.
- با
plt.scatterنقاط را رسم کن.
برای یادآوری مفاهیم، صفحه توزیع نرمال را ببین. همچنین خود نمودار پراکندگی بهترین ابزار کشف الگوهاست.
جمع بندی سریع
- هر نقطه یک نمونه است.
- x و y باید هم طول باشند.
- الگو را چشمی تشخیص بده.
- دلیل سازی نیاز به داده بیشتر دارد.