Python – نمودار پراکندگی (Scatter Plot)
نمودار پراکندگی
نمودار پراکندگی یک دیاگرام است که در آن هر مقدار در مجموعه داده با یک نقطه نمایش داده میشود.
ماژول Matplotlib یک متد برای رسم نمودار پراکندگی دارد. این متد به دو آرایه با طول یکسان نیاز دارد؛ یکی برای مقادیر محور x و دیگری برای مقادیر محور y:
x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
آرایه x
نمایانگر سن هر خودرو است و آرایه y
نمایانگر سرعت هر خودرو.
مثال
از متد scatter()
برای رسم یک نمودار پراکندگی استفاده کنید:
import matplotlib.pyplot as plt
x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
plt.scatter(x, y)
plt.show()
توضیح نمودار پراکندگی
محور x نمایانگر سنها و محور y نمایانگر سرعتها است.
از این دیاگرام میتوان فهمید که دو خودرو سریعتر هر دو 2 ساله بودهاند و خودرو کندترین 12 ساله بوده است.
نکته: به نظر میرسد هرچه خودرو جدیدتر باشد، سریعتر حرکت میکند، اما ممکن است این یک تصادف باشد زیرا تنها 13 خودرو ثبت شدهاند.
توزیع دادههای تصادفی
در یادگیری ماشین، مجموعه دادهها ممکن است شامل هزاران یا حتی میلیونها مقدار باشند.
شاید هنگام آزمایش یک الگوریتم، دادههای واقعی نداشته باشید و نیاز به استفاده از مقادیر تولید شده به صورت تصادفی داشته باشید.
همانطور که در فصل قبلی یاد گرفتیم، ماژول NumPy میتواند در این زمینه به ما کمک کند.
بیایید دو آرایه ایجاد کنیم که هر دو با 1000 عدد تصادفی از یک توزیع داده نرمال پر شدهاند.
آرایه اول دارای میانگین 5.0 با انحراف معیار 1.0 خواهد بود.
آرایه دوم دارای میانگین 10.0 با انحراف معیار 2.0 خواهد بود:
مثال
یک نمودار پراکندگی با 1000 نقطه:
import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)
plt.scatter(x, y)
plt.show()
توضیح نمودار پراکندگی
ما میتوانیم ببینیم که نقاط در محور x حول مقدار 5 و در محور y حول مقدار 10 متمرکز شدهاند.
همچنین میتوانیم ببینیم که پراکندگی در محور y گستردهتر از محور x است.
برای ارسال نظر لطفا ابتدا وارد حساب کاربری خود شوید. صفحه ورود و ثبت نام