Python – شروع به کار یادگیری ماشین (Getting Started)

یادگیری ماشین به معنی این است که کامپیوتر با مطالعه داده‌ها و آمارها یاد بگیرد.

یادگیری ماشین یک گام به سمت هوش مصنوعی (AI) است.

یادگیری ماشین برنامه‌ای است که داده‌ها را تحلیل می‌کند و یاد می‌گیرد تا نتیجه را پیش‌بینی کند.

کجا شروع کنیم؟ در این آموزش، ما به ریاضیات برمی‌گردیم و به مطالعه آمار و چگونگی محاسبه اعداد مهم بر اساس مجموعه داده‌ها می‌پردازیم.

همچنین یاد خواهیم گرفت که چگونه از ماژول‌های مختلف پایتون برای به دست آوردن پاسخ‌هایی که نیاز داریم استفاده کنیم.

و یاد خواهیم گرفت که چگونه توابعی بنویسیم که بتوانند بر اساس آنچه که یاد گرفته‌ایم، نتیجه را پیش‌بینی کنند.

مجموعه داده‌ها در ذهن یک کامپیوتر، یک مجموعه داده‌ها هر مجموعه‌ای از داده‌ها است. می‌تواند هر چیزی باشد، از یک آرایه تا یک پایگاه داده کامل.

مثال یک آرایه:

[99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86]

مثال یک پایگاه داده:

Carname  | Color  | Age | Speed | AutoPass

------------------------------------------
BMW | red | 5 | 99 | Y
Volvo | black | 7 | 86 | Y
VW | gray | 8 | 87 | N
VW | white | 7 | 88 | Y
Ford | white | 2 | 111 | Y
VW | white | 17 | 86 | Y
Tesla | red | 2 | 103 | Y
BMW | black | 9 | 87 | Y
Volvo | gray | 4 | 94 | N
Ford | white | 11 | 78 | N
Toyota | gray | 12 | 77 | N
VW | white | 9 | 85 | N
Toyota | blue | 6 | 86 | Y

با نگاه به آرایه، می‌توانیم حدس بزنیم که میانگین مقداری احتمالاً حدود 80 یا 90 است و همچنین می‌توانیم بالاترین و پایین‌ترین مقدار را تعیین کنیم، اما چه کار دیگری می‌توانیم انجام دهیم؟

و با نگاه به پایگاه داده می‌توانیم ببینیم که محبوب‌ترین رنگ سفید است و قدیمی‌ترین ماشین 17 سال دارد، اما اگر بتوانیم پیش‌بینی کنیم که آیا یک ماشین AutoPass دارد فقط با نگاه به سایر مقادیر چه؟

این همان چیزی است که یادگیری ماشین برای آن است! تحلیل داده‌ها و پیش‌بینی نتیجه!

در یادگیری ماشین معمول است که با مجموعه داده‌های بسیار بزرگ کار کنیم. در این آموزش سعی می‌کنیم مفاهیم مختلف یادگیری ماشین را به ساده‌ترین شکل ممکن بفهمیم و با مجموعه داده‌های کوچک و آسان‌فهم کار کنیم.

انواع داده‌ها برای تحلیل داده‌ها، مهم است که بدانید با چه نوع داده‌ای سر و کار دارید.

می‌توانیم انواع داده‌ها را به سه دسته اصلی تقسیم کنیم:

  • Numerical (عددی)
  • Categorical (دسته‌بندی‌شده)
  • Ordinal (ترتیبی)

داده‌های عددی، اعداد هستند و می‌توانند به دو دسته عددی تقسیم شوند:

  • داده‌های گسسته (Discrete Data): داده‌های شمارش شده که به اعداد صحیح محدود می‌شوند. مثال: تعداد ماشین‌های عبوری.
  • داده‌های پیوسته (Continuous Data): داده‌های اندازه‌گیری شده که می‌توانند هر عددی باشند. مثال: قیمت یک کالا یا اندازه یک کالا.

داده‌های دسته‌بندی‌شده (Categorical) داده‌هایی هستند که نمی‌توان آنها را با یکدیگر مقایسه کرد. مثال: یک مقدار رنگ یا هر مقدار بله/خیر.

داده‌های ترتیبی (Ordinal) مانند داده‌های دسته‌بندی‌شده هستند، اما می‌توان آنها را با یکدیگر مقایسه کرد. مثال: نمرات مدرسه که در آن A بهتر از B است و به همین ترتیب.

با دانستن نوع داده‌های منبع خود، قادر خواهید بود بدانید از چه تکنیکی برای تحلیل آنها استفاده کنید.

در فصل‌های بعدی درباره آمار و تحلیل داده‌ها بیشتر خواهید آموخت.

پست های مرتبط

مطالعه این پست ها رو از دست ندین!
Python - محدود کردن داده (MongoDB Limit)

Python – محدود کردن داده (MongoDB Limit)

Python MongoDB محدود کردن نتایج برای محدود کردن نتایج در MongoDB، از متد limit() استفاده می‌کنیم. متد limit() یک...

بیشتر بخوانید
Python - بروزرسانی (MongoDB Update)

Python – بروزرسانی (MongoDB Update)

به‌روزرسانی یک رکورد برای به‌روزرسانی یک رکورد یا سند در MongoDB، از متد update_one() استفاده می‌کنیم. پارامتر اول متد...

بیشتر بخوانید
Python - حذف کالکشن (MongoDB Drop Collection)

Python – حذف کالکشن (MongoDB Drop Collection)

حذف کالکشن شما می‌توانید یک جدول یا کالکشن در MongoDB را با استفاده از متد drop() حذف کنید. مثالحذف...

بیشتر بخوانید

نظرات

سوالات و نظراتتون رو با ما به اشتراک بذارید

برای ارسال نظر لطفا ابتدا وارد حساب کاربری خود شوید.