Python – شروع به کار یادگیری ماشین (Getting Started)
یادگیری ماشین به معنی این است که کامپیوتر با مطالعه دادهها و آمارها یاد بگیرد.
یادگیری ماشین یک گام به سمت هوش مصنوعی (AI) است.
یادگیری ماشین برنامهای است که دادهها را تحلیل میکند و یاد میگیرد تا نتیجه را پیشبینی کند.
کجا شروع کنیم؟ در این آموزش، ما به ریاضیات برمیگردیم و به مطالعه آمار و چگونگی محاسبه اعداد مهم بر اساس مجموعه دادهها میپردازیم.
همچنین یاد خواهیم گرفت که چگونه از ماژولهای مختلف پایتون برای به دست آوردن پاسخهایی که نیاز داریم استفاده کنیم.
و یاد خواهیم گرفت که چگونه توابعی بنویسیم که بتوانند بر اساس آنچه که یاد گرفتهایم، نتیجه را پیشبینی کنند.
مجموعه دادهها در ذهن یک کامپیوتر، یک مجموعه دادهها هر مجموعهای از دادهها است. میتواند هر چیزی باشد، از یک آرایه تا یک پایگاه داده کامل.
مثال یک آرایه:
[99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86]
مثال یک پایگاه داده:
Carname | Color | Age | Speed | AutoPass
------------------------------------------
BMW | red | 5 | 99 | Y
Volvo | black | 7 | 86 | Y
VW | gray | 8 | 87 | N
VW | white | 7 | 88 | Y
Ford | white | 2 | 111 | Y
VW | white | 17 | 86 | Y
Tesla | red | 2 | 103 | Y
BMW | black | 9 | 87 | Y
Volvo | gray | 4 | 94 | N
Ford | white | 11 | 78 | N
Toyota | gray | 12 | 77 | N
VW | white | 9 | 85 | N
Toyota | blue | 6 | 86 | Y
با نگاه به آرایه، میتوانیم حدس بزنیم که میانگین مقداری احتمالاً حدود 80 یا 90 است و همچنین میتوانیم بالاترین و پایینترین مقدار را تعیین کنیم، اما چه کار دیگری میتوانیم انجام دهیم؟
و با نگاه به پایگاه داده میتوانیم ببینیم که محبوبترین رنگ سفید است و قدیمیترین ماشین 17 سال دارد، اما اگر بتوانیم پیشبینی کنیم که آیا یک ماشین AutoPass دارد فقط با نگاه به سایر مقادیر چه؟
این همان چیزی است که یادگیری ماشین برای آن است! تحلیل دادهها و پیشبینی نتیجه!
در یادگیری ماشین معمول است که با مجموعه دادههای بسیار بزرگ کار کنیم. در این آموزش سعی میکنیم مفاهیم مختلف یادگیری ماشین را به سادهترین شکل ممکن بفهمیم و با مجموعه دادههای کوچک و آسانفهم کار کنیم.
انواع دادهها برای تحلیل دادهها، مهم است که بدانید با چه نوع دادهای سر و کار دارید.
میتوانیم انواع دادهها را به سه دسته اصلی تقسیم کنیم:
- Numerical (عددی)
- Categorical (دستهبندیشده)
- Ordinal (ترتیبی)
دادههای عددی، اعداد هستند و میتوانند به دو دسته عددی تقسیم شوند:
- دادههای گسسته (Discrete Data): دادههای شمارش شده که به اعداد صحیح محدود میشوند. مثال: تعداد ماشینهای عبوری.
- دادههای پیوسته (Continuous Data): دادههای اندازهگیری شده که میتوانند هر عددی باشند. مثال: قیمت یک کالا یا اندازه یک کالا.
دادههای دستهبندیشده (Categorical) دادههایی هستند که نمیتوان آنها را با یکدیگر مقایسه کرد. مثال: یک مقدار رنگ یا هر مقدار بله/خیر.
دادههای ترتیبی (Ordinal) مانند دادههای دستهبندیشده هستند، اما میتوان آنها را با یکدیگر مقایسه کرد. مثال: نمرات مدرسه که در آن A بهتر از B است و به همین ترتیب.
با دانستن نوع دادههای منبع خود، قادر خواهید بود بدانید از چه تکنیکی برای تحلیل آنها استفاده کنید.
در فصلهای بعدی درباره آمار و تحلیل دادهها بیشتر خواهید آموخت.
برای ارسال نظر لطفا ابتدا وارد حساب کاربری خود شوید. صفحه ورود و ثبت نام