Python – نمودار پراکندگی (Scatter Plot)

نمودار پراکندگی

نمودار پراکندگی یک دیاگرام است که در آن هر مقدار در مجموعه داده با یک نقطه نمایش داده می‌شود.

ماژول Matplotlib یک متد برای رسم نمودار پراکندگی دارد. این متد به دو آرایه با طول یکسان نیاز دارد؛ یکی برای مقادیر محور x و دیگری برای مقادیر محور y:

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

آرایه x نمایانگر سن هر خودرو است و آرایه y نمایانگر سرعت هر خودرو.

مثال
از متد scatter() برای رسم یک نمودار پراکندگی استفاده کنید:

import matplotlib.pyplot as plt

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

plt.scatter(x, y)
plt.show()

توضیح نمودار پراکندگی

محور x نمایانگر سن‌ها و محور y نمایانگر سرعت‌ها است.

از این دیاگرام می‌توان فهمید که دو خودرو سریع‌تر هر دو 2 ساله بوده‌اند و خودرو کندترین 12 ساله بوده است.

نکته: به نظر می‌رسد هرچه خودرو جدیدتر باشد، سریع‌تر حرکت می‌کند، اما ممکن است این یک تصادف باشد زیرا تنها 13 خودرو ثبت شده‌اند.

توزیع داده‌های تصادفی

در یادگیری ماشین، مجموعه داده‌ها ممکن است شامل هزاران یا حتی میلیون‌ها مقدار باشند.

شاید هنگام آزمایش یک الگوریتم، داده‌های واقعی نداشته باشید و نیاز به استفاده از مقادیر تولید شده به صورت تصادفی داشته باشید.

همانطور که در فصل قبلی یاد گرفتیم، ماژول NumPy می‌تواند در این زمینه به ما کمک کند.

بیایید دو آرایه ایجاد کنیم که هر دو با 1000 عدد تصادفی از یک توزیع داده نرمال پر شده‌اند.

آرایه اول دارای میانگین 5.0 با انحراف معیار 1.0 خواهد بود.

آرایه دوم دارای میانگین 10.0 با انحراف معیار 2.0 خواهد بود:

مثال
یک نمودار پراکندگی با 1000 نقطه:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)

plt.scatter(x, y)
plt.show()

توضیح نمودار پراکندگی

ما می‌توانیم ببینیم که نقاط در محور x حول مقدار 5 و در محور y حول مقدار 10 متمرکز شده‌اند.

همچنین می‌توانیم ببینیم که پراکندگی در محور y گسترده‌تر از محور x است.

پست های مرتبط

مطالعه این پست ها رو از دست ندین!
Python - محدود کردن داده (MongoDB Limit)

Python – محدود کردن داده (MongoDB Limit)

Python MongoDB محدود کردن نتایج برای محدود کردن نتایج در MongoDB، از متد limit() استفاده می‌کنیم. متد limit() یک...

بیشتر بخوانید
Python - بروزرسانی (MongoDB Update)

Python – بروزرسانی (MongoDB Update)

به‌روزرسانی یک رکورد برای به‌روزرسانی یک رکورد یا سند در MongoDB، از متد update_one() استفاده می‌کنیم. پارامتر اول متد...

بیشتر بخوانید
Python - حذف کالکشن (MongoDB Drop Collection)

Python – حذف کالکشن (MongoDB Drop Collection)

حذف کالکشن شما می‌توانید یک جدول یا کالکشن در MongoDB را با استفاده از متد drop() حذف کنید. مثالحذف...

بیشتر بخوانید

نظرات

سوالات و نظراتتون رو با ما به اشتراک بذارید

برای ارسال نظر لطفا ابتدا وارد حساب کاربری خود شوید.