Python – توزیع داده‌ها (Data Distribution)

توزیع داده‌ها

در مراحل قبلی این آموزش، ما با مقادیر کوچکی از داده‌ها کار کردیم تا مفاهیم مختلف را درک کنیم.

در دنیای واقعی، مجموعه داده‌ها بسیار بزرگ‌تر هستند، اما جمع‌آوری داده‌های واقعی می‌تواند دشوار باشد، حداقل در مراحل اولیه یک پروژه.

چگونه می‌توانیم مجموعه داده‌های بزرگ را دریافت کنیم؟

برای ایجاد مجموعه داده‌های بزرگ برای تست، ما از ماژول NumPy پایتون استفاده می‌کنیم که دارای تعداد زیادی متد برای ایجاد مجموعه داده‌های تصادفی به هر اندازه‌ای است.

مثال
ایجاد یک آرایه که شامل 250 عدد اعشاری تصادفی بین 0 و 5 باشد:

import numpy

x = numpy.random.uniform(0.0, 5.0, 250)

print(x)

هیستوگرام

برای بصری‌سازی مجموعه داده می‌توانیم یک هیستوگرام از داده‌های جمع‌آوری شده رسم کنیم.

ما از ماژول Matplotlib پایتون برای رسم هیستوگرام استفاده می‌کنیم.

مثال
رسم یک هیستوگرام:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.uniform(0.0, 5.0, 250)

plt.hist(x, 5)
plt.show()
بصری‌سازی مجموعه داده

توضیح هیستوگرام

ما از آرایه‌ای که در مثال بالا ایجاد کردیم برای رسم یک هیستوگرام با 5 ستون استفاده می‌کنیم.

  • ستون اول نشان می‌دهد که چند مقدار در آرایه بین 0 و 1 هستند.
  • ستون دوم نشان می‌دهد که چند مقدار بین 1 و 2 هستند.
  • و به همین ترتیب.

این نتیجه را به ما می‌دهد:

  • 52 مقدار بین 0 و 1 هستند.
  • 48 مقدار بین 1 و 2 هستند.
  • 49 مقدار بین 2 و 3 هستند.
  • 51 مقدار بین 3 و 4 هستند.
  • 50 مقدار بین 4 و 5 هستند.

نکته: مقادیر آرایه اعداد تصادفی هستند و در نتیجه، در رایانه شما نتایج دقیقا یکسان نخواهند بود.

توزیع‌های داده بزرگ

یک آرایه شامل 250 مقدار به عنوان داده بزرگ در نظر گرفته نمی‌شود، اما اکنون شما می‌دانید چگونه یک مجموعه از مقادیر تصادفی ایجاد کنید، و با تغییر پارامترها، می‌توانید مجموعه داده‌ای به اندازه دلخواه خود ایجاد کنید.

مثال
ایجاد یک آرایه با 100000 عدد تصادفی و نمایش آنها با استفاده از یک هیستوگرام با 100 ستون:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.uniform(0.0, 5.0, 100000)

plt.hist(x, 100)
plt.show()

پست های مرتبط

مطالعه این پست ها رو از دست ندین!
Python - محدود کردن داده (MongoDB Limit)

Python – محدود کردن داده (MongoDB Limit)

Python MongoDB محدود کردن نتایج برای محدود کردن نتایج در MongoDB، از متد limit() استفاده می‌کنیم. متد limit() یک...

بیشتر بخوانید
Python - بروزرسانی (MongoDB Update)

Python – بروزرسانی (MongoDB Update)

به‌روزرسانی یک رکورد برای به‌روزرسانی یک رکورد یا سند در MongoDB، از متد update_one() استفاده می‌کنیم. پارامتر اول متد...

بیشتر بخوانید
Python - حذف کالکشن (MongoDB Drop Collection)

Python – حذف کالکشن (MongoDB Drop Collection)

حذف کالکشن شما می‌توانید یک جدول یا کالکشن در MongoDB را با استفاده از متد drop() حذف کنید. مثالحذف...

بیشتر بخوانید

نظرات

سوالات و نظراتتون رو با ما به اشتراک بذارید

برای ارسال نظر لطفا ابتدا وارد حساب کاربری خود شوید.