Python – توزیع دادهها (Data Distribution)
توزیع دادهها
در مراحل قبلی این آموزش، ما با مقادیر کوچکی از دادهها کار کردیم تا مفاهیم مختلف را درک کنیم.
در دنیای واقعی، مجموعه دادهها بسیار بزرگتر هستند، اما جمعآوری دادههای واقعی میتواند دشوار باشد، حداقل در مراحل اولیه یک پروژه.
چگونه میتوانیم مجموعه دادههای بزرگ را دریافت کنیم؟
برای ایجاد مجموعه دادههای بزرگ برای تست، ما از ماژول NumPy پایتون استفاده میکنیم که دارای تعداد زیادی متد برای ایجاد مجموعه دادههای تصادفی به هر اندازهای است.
مثال
ایجاد یک آرایه که شامل 250 عدد اعشاری تصادفی بین 0 و 5 باشد:
import numpy
x = numpy.random.uniform(0.0, 5.0, 250)
print(x)
هیستوگرام
برای بصریسازی مجموعه داده میتوانیم یک هیستوگرام از دادههای جمعآوری شده رسم کنیم.
ما از ماژول Matplotlib پایتون برای رسم هیستوگرام استفاده میکنیم.
مثال
رسم یک هیستوگرام:
import numpy
import matplotlib.pyplot as plt
x = numpy.random.uniform(0.0, 5.0, 250)
plt.hist(x, 5)
plt.show()
توضیح هیستوگرام
ما از آرایهای که در مثال بالا ایجاد کردیم برای رسم یک هیستوگرام با 5 ستون استفاده میکنیم.
- ستون اول نشان میدهد که چند مقدار در آرایه بین 0 و 1 هستند.
- ستون دوم نشان میدهد که چند مقدار بین 1 و 2 هستند.
- و به همین ترتیب.
این نتیجه را به ما میدهد:
- 52 مقدار بین 0 و 1 هستند.
- 48 مقدار بین 1 و 2 هستند.
- 49 مقدار بین 2 و 3 هستند.
- 51 مقدار بین 3 و 4 هستند.
- 50 مقدار بین 4 و 5 هستند.
نکته: مقادیر آرایه اعداد تصادفی هستند و در نتیجه، در رایانه شما نتایج دقیقا یکسان نخواهند بود.
توزیعهای داده بزرگ
یک آرایه شامل 250 مقدار به عنوان داده بزرگ در نظر گرفته نمیشود، اما اکنون شما میدانید چگونه یک مجموعه از مقادیر تصادفی ایجاد کنید، و با تغییر پارامترها، میتوانید مجموعه دادهای به اندازه دلخواه خود ایجاد کنید.
مثال
ایجاد یک آرایه با 100000 عدد تصادفی و نمایش آنها با استفاده از یک هیستوگرام با 100 ستون:
import numpy
import matplotlib.pyplot as plt
x = numpy.random.uniform(0.0, 5.0, 100000)
plt.hist(x, 100)
plt.show()
برای ارسال نظر لطفا ابتدا وارد حساب کاربری خود شوید. صفحه ورود و ثبت نام