Python – شروع به کار یادگیری ماشین (Getting Started)

یادگیری ماشین به معنی این است که کامپیوتر با مطالعه داده‌ها و آمارها یاد بگیرد.

یادگیری ماشین یک گام به سمت هوش مصنوعی (AI) است.

یادگیری ماشین برنامه‌ای است که داده‌ها را تحلیل می‌کند و یاد می‌گیرد تا نتیجه را پیش‌بینی کند.

کجا شروع کنیم؟ در این آموزش، ما به ریاضیات برمی‌گردیم و به مطالعه آمار و چگونگی محاسبه اعداد مهم بر اساس مجموعه داده‌ها می‌پردازیم.

همچنین یاد خواهیم گرفت که چگونه از ماژول‌های مختلف پایتون برای به دست آوردن پاسخ‌هایی که نیاز داریم استفاده کنیم.

و یاد خواهیم گرفت که چگونه توابعی بنویسیم که بتوانند بر اساس آنچه که یاد گرفته‌ایم، نتیجه را پیش‌بینی کنند.

مجموعه داده‌ها در ذهن یک کامپیوتر، یک مجموعه داده‌ها هر مجموعه‌ای از داده‌ها است. می‌تواند هر چیزی باشد، از یک آرایه تا یک پایگاه داده کامل.

مثال یک آرایه:

[99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86]

مثال یک پایگاه داده:

Carname  | Color  | Age | Speed | AutoPass

------------------------------------------
BMW | red | 5 | 99 | Y
Volvo | black | 7 | 86 | Y
VW | gray | 8 | 87 | N
VW | white | 7 | 88 | Y
Ford | white | 2 | 111 | Y
VW | white | 17 | 86 | Y
Tesla | red | 2 | 103 | Y
BMW | black | 9 | 87 | Y
Volvo | gray | 4 | 94 | N
Ford | white | 11 | 78 | N
Toyota | gray | 12 | 77 | N
VW | white | 9 | 85 | N
Toyota | blue | 6 | 86 | Y

با نگاه به آرایه، می‌توانیم حدس بزنیم که میانگین مقداری احتمالاً حدود 80 یا 90 است و همچنین می‌توانیم بالاترین و پایین‌ترین مقدار را تعیین کنیم، اما چه کار دیگری می‌توانیم انجام دهیم؟

و با نگاه به پایگاه داده می‌توانیم ببینیم که محبوب‌ترین رنگ سفید است و قدیمی‌ترین ماشین 17 سال دارد، اما اگر بتوانیم پیش‌بینی کنیم که آیا یک ماشین AutoPass دارد فقط با نگاه به سایر مقادیر چه؟

این همان چیزی است که یادگیری ماشین برای آن است! تحلیل داده‌ها و پیش‌بینی نتیجه!

در یادگیری ماشین معمول است که با مجموعه داده‌های بسیار بزرگ کار کنیم. در این آموزش سعی می‌کنیم مفاهیم مختلف یادگیری ماشین را به ساده‌ترین شکل ممکن بفهمیم و با مجموعه داده‌های کوچک و آسان‌فهم کار کنیم.

انواع داده‌ها برای تحلیل داده‌ها، مهم است که بدانید با چه نوع داده‌ای سر و کار دارید.

می‌توانیم انواع داده‌ها را به سه دسته اصلی تقسیم کنیم:

  • Numerical (عددی)
  • Categorical (دسته‌بندی‌شده)
  • Ordinal (ترتیبی)

داده‌های عددی، اعداد هستند و می‌توانند به دو دسته عددی تقسیم شوند:

  • داده‌های گسسته (Discrete Data): داده‌های شمارش شده که به اعداد صحیح محدود می‌شوند. مثال: تعداد ماشین‌های عبوری.
  • داده‌های پیوسته (Continuous Data): داده‌های اندازه‌گیری شده که می‌توانند هر عددی باشند. مثال: قیمت یک کالا یا اندازه یک کالا.

داده‌های دسته‌بندی‌شده (Categorical) داده‌هایی هستند که نمی‌توان آنها را با یکدیگر مقایسه کرد. مثال: یک مقدار رنگ یا هر مقدار بله/خیر.

داده‌های ترتیبی (Ordinal) مانند داده‌های دسته‌بندی‌شده هستند، اما می‌توان آنها را با یکدیگر مقایسه کرد. مثال: نمرات مدرسه که در آن A بهتر از B است و به همین ترتیب.

با دانستن نوع داده‌های منبع خود، قادر خواهید بود بدانید از چه تکنیکی برای تحلیل آنها استفاده کنید.

در فصل‌های بعدی درباره آمار و تحلیل داده‌ها بیشتر خواهید آموخت.

پست های مرتبط

مطالعه این پست ها رو از دست ندین!
JavaScript - تاریخ‌ها (Dates)

JavaScript – تاریخ‌ها (Dates)

آبجکت‌های تاریخ (Date) در جاوااسکریپت آبجکت‌های تاریخ در جاوااسکریپت به ما امکان کار با تاریخ و زمان را می‌دهند....

بیشتر بخوانید
JavaScript - آرایه‌های ثابت (Array Const)

JavaScript – آرایه‌های ثابت (Array Const)

جاوااسکریپت: تعریف آرایه با const در سال 2015، جاوااسکریپت کلمه کلیدی مهمی به نام const را معرفی کرد. این...

بیشتر بخوانید
JavaScript - تکرار آرایه‌ها (Array Iteration)

JavaScript – تکرار آرایه‌ها (Array Iteration)

جاوا اسکریپت: تکرار بر روی آرایه‌ها جاوا اسکریپت روش‌های مختلفی برای تکرار (Iteration) بر روی آرایه‌ها ارائه می‌دهد که...

بیشتر بخوانید

نظرات

سوالات و نظراتتون رو با ما به اشتراک بذارید

برای ارسال نظر لطفا ابتدا وارد حساب کاربری خود شوید.