فهرست سرفصل‌های Python
خانه (HOME) مقدمه (Intro) شروع کار (Get Started) ساختار نوشتاری (Syntax) دستورات (Statements) خروجی (Output) چاپ اعداد (Print Numbers) توضیحات (Comments) متغیرها (Variables) نام متغیرها (Variable Names) اختصاص چند مقدار (Assign Multiple Values) نمایش متغیرها (Output Variables) متغیرهای سراسری (Global Variables) تمرین متغیرها (Variable Exercises) نوع داده ها (Data Types) اعداد (Numbers) تبدیل نوع داده (Casting) رشته ها (Strings) برش رشته (Slicing Strings) تغییر رشته (Modify Strings) ترکیب رشته ها (Concatenate Strings) قالب بندی رشته ها (Format Strings) کاراکتر فرار (Escape Characters) متدهای رشته (String Methods) تمرین رشته ها (String Exercises) بولین ها (Booleans) عملگرها (Operators) عملگرهای حسابی (Arithmetic Operators) عملگرهای انتسابی (Assignment Operators) عملگرهای مقایسه ای (Comparison Operators) عملگرهای منطقی (Logical Operators) عملگرهای هویتی (Identity Operators) عملگرهای عضویت (Membership Operators) عملگرهای بیتی (Bitwise Operators) اولویت عملگرها (Operator Precedence) لیست ها (Lists) دسترسی به آیتم ها (Access List Items) تغییر آیتم ها (Change List Items) افزودن آیتم (Add List Items) حذف آیتم (Remove List Items) حلقه روی لیست (Loop Lists) درک لیست (List Comprehension) مرتب سازی لیست (Sort Lists) کپی لیست (Copy Lists) ادغام لیست ها (Join Lists) متدهای لیست (List Methods) تمرین لیست ها (List Exercises) تاپل ها (Tuples) دسترسی به تاپل ها (Access Tuples) به روزرسانی تاپل ها (Update Tuples) باز کردن تاپل ها (Unpack Tuples) حلقه تاپل ها (Loop Tuples) ادغام تاپل ها (Join Tuples) متدهای تاپل (Tuple Methods) تمرین تاپل ها (Tuple Exercises) مجموعه ها (Sets) دسترسی به مجموعه (Access Set Items) افزودن به مجموعه (Add Set Items) حذف از مجموعه (Remove Set Items) حلقه مجموعه ها (Loop Sets) ادغام مجموعه ها (Join Sets) فروزن ست (Frozenset) متدهای مجموعه (Set Methods) تمرین مجموعه ها (Set Exercises) دیکشنری ها (Dictionaries) دسترسی به آیتم ها (Access Items) تغییر آیتم ها (Change Items) افزودن آیتم ها (Add Items) حذف آیتم ها (Remove Items) حلقه دیکشنری ها (Loop Dictionaries) کپی دیکشنری ها (Copy Dictionaries) تو در تو (Nested Dictionaries) متدهای دیکشنری (Dictionary Methods) تمرین دیکشنری (Dictionary Exercises) if elif else شرط کوتاه (Shorthand If) عملگرهای منطقی (Logical Operators) شرط تو در تو (Nested If) pass (Pass Statement) match (Match) حلقه while (While Loops) حلقه for (For Loops) توابع (Functions) آرگومان ها (Arguments) *args / **kwargs حوزه دسترسی (Scope) دکوراتور ها (Decorators) لانبدا (Lambda) بازگشت (Recursion) جنریتور ها (Generators) بازه (Range) آرایه ها (Arrays) ایتریتورها (Iterators) ماژول ها (Modules) تاریخ ها (Dates) ریاضی (Math) جیسون (JSON) عبارات منظم (RegEx) مدیر بسته ها (PIP) try...except قالب بندی رشته (String Formatting) None ورودی کاربر (User Input) محیط مجازی (VirtualEnv) شیءگرایی (OOP) کلاس ها/اشیا (Classes/Objects) متد init (init Method) پارامتر self (self Parameter) خصوصیات کلاس (Class Properties) متدهای کلاس (Class Methods) وراثت (Inheritance) چندریختی (Polymorphism) کپسوله سازی (Encapsulation) کلاس های داخلی (Inner Classes) کار با فایل (File Handling) خواندن فایل (Read Files) نوشتن/ایجاد فایل (Write/Create Files) حذف فایل (Delete Files) آموزش SciPy (SciPy Tutorial) Matplotlib مقدمه (Matplotlib Intro) شروع با Matplotlib (Matplotlib Get Started) Pyplot (Matplotlib Pyplot) نمودارسازی (Matplotlib Plotting) نشانگرها (Matplotlib Markers) خط (Matplotlib Line) برچسب ها (Matplotlib Labels) شبکه (Matplotlib Grid) زیرنمودار (Matplotlib Subplot) پراکندگی (Matplotlib Scatter) میله ای (Matplotlib Bars) هیستوگرام (Matplotlib Histograms) دایره ای (Matplotlib Pie Charts) یادگیری ماشین: شروع (Getting Started) میانگین/میانه/نما (Mean Median Mode) انحراف معیار (Standard Deviation) صدک (Percentile) توزیع داده (Data Distribution) توزیع نرمال (Normal Data Distribution) نمودار پراکندگی (Scatter Plot) رگرسیون خطی (Linear Regression) رگرسیون چندجمله ای (Polynomial Regression) رگرسیون چندمتغیره (Multiple Regression) مقیاس بندی (Scale) آموزش/آزمون (Train/Test) درخت تصمیم (Decision Tree) ماتریس اغتشاش (Confusion Matrix) خوشه بندی سلسله مراتبی (Hierarchical Clustering) رگرسیون لجستیک (Logistic Regression) جست وجوی شبکه ای (Grid Search) پیش پردازش داده های دسته ای (Categorical Data) K-means بگینگ (Bootstrap Aggregation) اعتبارسنجی متقابل (Cross Validation) منحنی AUC-ROC (AUC-ROC Curve) KNN (K-nearest neighbors) DSA: معرفی (Python DSA) لیست ها و آرایه ها (Lists and Arrays) پشته ها (Stacks) صف ها (Queues) لیست های پیوندی (Linked Lists) هش تیبل ها (Hash Tables) درخت ها (Trees) درخت های دودویی (Binary Trees) BST (Binary Search Trees) درخت های AVL (AVL Trees) گراف ها (Graphs) جستجوی خطی (Linear Search) جستجوی دودویی (Binary Search) مرتب سازی حبابی (Bubble Sort) مرتب سازی انتخابی (Selection Sort) مرتب سازی درج (Insertion Sort) مرتب سازی سریع (Quick Sort) مرتب سازی شمارشی (Counting Sort) مرتب سازی رادیکس (Radix Sort) مرتب سازی ادغامی (Merge Sort) MySQL: شروع (MySQL Get Started) ایجاد پایگاه داده (Create Database) ایجاد جدول (Create Table) درج رکورد (Insert) انتخاب (Select) شرط Where مرتب سازی (Order By) حذف (Delete) حذف جدول (Drop Table) به روزرسانی (Update) Limit Join MongoDB: شروع (Get Started) ایجاد پایگاه داده (Create DB) ایجاد کالکشن (Collection) درج (Insert) پیدا کردن (Find) کوئری (Query) مرتب سازی (Sort) حذف (Delete) حذف کالکشن (Drop Collection) به روزرسانی (Update) Limit مرجع: مرور کلی (Overview) توابع درون ساخته (Built-in Functions) متدهای رشته (String Methods) متدهای لیست (List Methods) متدهای دیکشنری (Dictionary Methods) متدهای تاپل (Tuple Methods) متدهای مجموعه (Set Methods) متدهای فایل (File Methods) کلیدواژه ها (Keywords) استثناها (Exceptions) واژه نامه (Glossary) مرجع ماژول ها (Built-in Modules) ماژول random (Random Module) ماژول requests (Requests Module) ماژول statistics (Statistics Module) ماژول math (Math Module) ماژول cmath (cMath Module) حذف موارد تکراری لیست (Remove List Duplicates) برعکس کردن رشته (Reverse a String) جمع دو عدد (Add Two Numbers)
PYTHON

Python — درخت تصمیم (Decision Tree)

آخرین بروزرسانی: 1404/08/09

درخت تصمیم (Decision Tree)

«درخت تصمیم (Decision Tree)» مثل فلوچارت است. با تجربه های قبلی، مسیر تصمیم را نشان می دهد. یعنی از ویژگی ها به پاسخ می رسیم. این مدل برای طبقه بندی خیلی محبوب است.

شروع کار با داده

اول داده را با پانداس بخوان. پانداس (Pandas) کتابخانه کار با جدول است.

import pandas as pd

df = pd.read_csv("data.csv")

print(df)

مشاهده در ادیتور

عددی کردن ستون های متنی

مدل فقط عدد می فهمد. پس ملیت و پاسخ را به عدد تبدیل کن. نگاشت (Map) یعنی جایگزینی متن با عدد.

import pandas as pd

df = pd.read_csv("data.csv")

nat_map = {"UK": 0, "USA": 1, "N": 2}
df["Nationality"] = df["Nationality"].map(nat_map)

go_map = {"YES": 1, "NO": 0}
df["Go"] = df["Go"].map(go_map)

print(df)

مشاهده در ادیتور

جدا کردن ویژگی ها و هدف

ویژگی (Feature) ورودی مدل است. هدف (Target) خروجی مدل است.

import pandas as pd

df = pd.read_csv("data.csv")

nat_map = {"UK": 0, "USA": 1, "N": 2}
df["Nationality"] = df["Nationality"].map(nat_map)

go_map = {"YES": 1, "NO": 0}
df["Go"] = df["Go"].map(go_map)

features = ["Age", "Experience", "Rank", "Nationality"]

X = df[features]
y = df["Go"]

print(X)
print(y)

مشاهده در ادیتور

ساخت و ترسیم درخت تصمیم

از DecisionTreeClassifier استفاده می کنیم. ترسیم، گره ها و شروط را نشان می دهد.

import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn import tree
import matplotlib.pyplot as plt

df = pd.read_csv("data.csv")

nat_map = {"UK": 0, "USA": 1, "N": 2}
df["Nationality"] = df["Nationality"].map(nat_map)

go_map = {"YES": 1, "NO": 0}
df["Go"] = df["Go"].map(go_map)

features = ["Age", "Experience", "Rank", "Nationality"]

X = df[features]
y = df["Go"]

dtree = DecisionTreeClassifier()
dtree = dtree.fit(X, y)

tree.plot_tree(dtree, feature_names=features)
plt.show()

مشاهده در ادیتور

نکته: معیار جینی (Gini) میزان خلوص گره را می سنجد. عدد 0 یعنی کاملاً خالص.

پیش بینی با درخت

حالا نمونه ی تازه بده و خروجی بگیر. ترتیب ویژگی ها مهم است.

from sklearn.tree import DecisionTreeClassifier

# فرض کن dtree از قبل آموزش دیده است

result1 = dtree.predict([[40, 10, 7, 1]])
print(result1)

result2 = dtree.predict([[40, 10, 6, 1]])
print(result2)

مشاهده در ادیتور

هشدار: درخت همیشه قطعی نیست. بر پایه احتمال تصمیم می گیرد.

جمع بندی سریع

  • ستون های متنی را به عدد نگاشت کن.
  • ویژگی ها را از هدف جدا کن.
  • درخت را آموزش بده و ترسیم کن.
  • Gini خلوص گره ها را نشان می دهد.
  • پیش بینی کن و نتیجه را تفسیر کن.

برای مرور درخت تصمیم این صفحه را نگه دار. همچنین قبل اش آموزش/آزمون را بخوان و بعدش به ماتریس درهم ریختگی برو.