فهرست سرفصل‌های Python
خانه (HOME) مقدمه (Intro) شروع کار (Get Started) ساختار نوشتاری (Syntax) دستورات (Statements) خروجی (Output) چاپ اعداد (Print Numbers) توضیحات (Comments) متغیرها (Variables) نام متغیرها (Variable Names) اختصاص چند مقدار (Assign Multiple Values) نمایش متغیرها (Output Variables) متغیرهای سراسری (Global Variables) تمرین متغیرها (Variable Exercises) نوع داده ها (Data Types) اعداد (Numbers) تبدیل نوع داده (Casting) رشته ها (Strings) برش رشته (Slicing Strings) تغییر رشته (Modify Strings) ترکیب رشته ها (Concatenate Strings) قالب بندی رشته ها (Format Strings) کاراکتر فرار (Escape Characters) متدهای رشته (String Methods) تمرین رشته ها (String Exercises) بولین ها (Booleans) عملگرها (Operators) عملگرهای حسابی (Arithmetic Operators) عملگرهای انتسابی (Assignment Operators) عملگرهای مقایسه ای (Comparison Operators) عملگرهای منطقی (Logical Operators) عملگرهای هویتی (Identity Operators) عملگرهای عضویت (Membership Operators) عملگرهای بیتی (Bitwise Operators) اولویت عملگرها (Operator Precedence) لیست ها (Lists) دسترسی به آیتم ها (Access List Items) تغییر آیتم ها (Change List Items) افزودن آیتم (Add List Items) حذف آیتم (Remove List Items) حلقه روی لیست (Loop Lists) درک لیست (List Comprehension) مرتب سازی لیست (Sort Lists) کپی لیست (Copy Lists) ادغام لیست ها (Join Lists) متدهای لیست (List Methods) تمرین لیست ها (List Exercises) تاپل ها (Tuples) دسترسی به تاپل ها (Access Tuples) به روزرسانی تاپل ها (Update Tuples) باز کردن تاپل ها (Unpack Tuples) حلقه تاپل ها (Loop Tuples) ادغام تاپل ها (Join Tuples) متدهای تاپل (Tuple Methods) تمرین تاپل ها (Tuple Exercises) مجموعه ها (Sets) دسترسی به مجموعه (Access Set Items) افزودن به مجموعه (Add Set Items) حذف از مجموعه (Remove Set Items) حلقه مجموعه ها (Loop Sets) ادغام مجموعه ها (Join Sets) فروزن ست (Frozenset) متدهای مجموعه (Set Methods) تمرین مجموعه ها (Set Exercises) دیکشنری ها (Dictionaries) دسترسی به آیتم ها (Access Items) تغییر آیتم ها (Change Items) افزودن آیتم ها (Add Items) حذف آیتم ها (Remove Items) حلقه دیکشنری ها (Loop Dictionaries) کپی دیکشنری ها (Copy Dictionaries) تو در تو (Nested Dictionaries) متدهای دیکشنری (Dictionary Methods) تمرین دیکشنری (Dictionary Exercises) if elif else شرط کوتاه (Shorthand If) عملگرهای منطقی (Logical Operators) شرط تو در تو (Nested If) pass (Pass Statement) match (Match) حلقه while (While Loops) حلقه for (For Loops) توابع (Functions) آرگومان ها (Arguments) *args / **kwargs حوزه دسترسی (Scope) دکوراتور ها (Decorators) لانبدا (Lambda) بازگشت (Recursion) جنریتور ها (Generators) بازه (Range) آرایه ها (Arrays) ایتریتورها (Iterators) ماژول ها (Modules) تاریخ ها (Dates) ریاضی (Math) جیسون (JSON) عبارات منظم (RegEx) مدیر بسته ها (PIP) try...except قالب بندی رشته (String Formatting) None ورودی کاربر (User Input) محیط مجازی (VirtualEnv) شیءگرایی (OOP) کلاس ها/اشیا (Classes/Objects) متد init (init Method) پارامتر self (self Parameter) خصوصیات کلاس (Class Properties) متدهای کلاس (Class Methods) وراثت (Inheritance) چندریختی (Polymorphism) کپسوله سازی (Encapsulation) کلاس های داخلی (Inner Classes) کار با فایل (File Handling) خواندن فایل (Read Files) نوشتن/ایجاد فایل (Write/Create Files) حذف فایل (Delete Files) آموزش SciPy (SciPy Tutorial) Matplotlib مقدمه (Matplotlib Intro) شروع با Matplotlib (Matplotlib Get Started) Pyplot (Matplotlib Pyplot) نمودارسازی (Matplotlib Plotting) نشانگرها (Matplotlib Markers) خط (Matplotlib Line) برچسب ها (Matplotlib Labels) شبکه (Matplotlib Grid) زیرنمودار (Matplotlib Subplot) پراکندگی (Matplotlib Scatter) میله ای (Matplotlib Bars) هیستوگرام (Matplotlib Histograms) دایره ای (Matplotlib Pie Charts) یادگیری ماشین: شروع (Getting Started) میانگین/میانه/نما (Mean Median Mode) انحراف معیار (Standard Deviation) صدک (Percentile) توزیع داده (Data Distribution) توزیع نرمال (Normal Data Distribution) نمودار پراکندگی (Scatter Plot) رگرسیون خطی (Linear Regression) رگرسیون چندجمله ای (Polynomial Regression) رگرسیون چندمتغیره (Multiple Regression) مقیاس بندی (Scale) آموزش/آزمون (Train/Test) درخت تصمیم (Decision Tree) ماتریس اغتشاش (Confusion Matrix) خوشه بندی سلسله مراتبی (Hierarchical Clustering) رگرسیون لجستیک (Logistic Regression) جست وجوی شبکه ای (Grid Search) پیش پردازش داده های دسته ای (Categorical Data) K-means بگینگ (Bootstrap Aggregation) اعتبارسنجی متقابل (Cross Validation) منحنی AUC-ROC (AUC-ROC Curve) KNN (K-nearest neighbors) DSA: معرفی (Python DSA) لیست ها و آرایه ها (Lists and Arrays) پشته ها (Stacks) صف ها (Queues) لیست های پیوندی (Linked Lists) هش تیبل ها (Hash Tables) درخت ها (Trees) درخت های دودویی (Binary Trees) BST (Binary Search Trees) درخت های AVL (AVL Trees) گراف ها (Graphs) جستجوی خطی (Linear Search) جستجوی دودویی (Binary Search) مرتب سازی حبابی (Bubble Sort) مرتب سازی انتخابی (Selection Sort) مرتب سازی درج (Insertion Sort) مرتب سازی سریع (Quick Sort) مرتب سازی شمارشی (Counting Sort) مرتب سازی رادیکس (Radix Sort) مرتب سازی ادغامی (Merge Sort) MySQL: شروع (MySQL Get Started) ایجاد پایگاه داده (Create Database) ایجاد جدول (Create Table) درج رکورد (Insert) انتخاب (Select) شرط Where مرتب سازی (Order By) حذف (Delete) حذف جدول (Drop Table) به روزرسانی (Update) Limit Join MongoDB: شروع (Get Started) ایجاد پایگاه داده (Create DB) ایجاد کالکشن (Collection) درج (Insert) پیدا کردن (Find) کوئری (Query) مرتب سازی (Sort) حذف (Delete) حذف کالکشن (Drop Collection) به روزرسانی (Update) Limit مرجع: مرور کلی (Overview) توابع درون ساخته (Built-in Functions) متدهای رشته (String Methods) متدهای لیست (List Methods) متدهای دیکشنری (Dictionary Methods) متدهای تاپل (Tuple Methods) متدهای مجموعه (Set Methods) متدهای فایل (File Methods) کلیدواژه ها (Keywords) استثناها (Exceptions) واژه نامه (Glossary) مرجع ماژول ها (Built-in Modules) ماژول random (Random Module) ماژول requests (Requests Module) ماژول statistics (Statistics Module) ماژول math (Math Module) ماژول cmath (cMath Module) حذف موارد تکراری لیست (Remove List Duplicates) برعکس کردن رشته (Reverse a String) جمع دو عدد (Add Two Numbers)
PYTHON

Python — جست وجوی شبکه ای (Grid Search)

آخرین بروزرسانی: 1404/08/09

جست وجوی شبکه ای (Grid Search)

«جست وجوی شبکه ای» برای پیدا کردن بهترین «ابرپارامتر (Hyperparameter)» است. ابرپارامتر، تنظیمات مدل است؛ مثلا C در رگرسیون لجستیک. ما چند مقدار را امتحان می کنیم و بهترین امتیاز را برمی داریم.

چطور کار می کند؟

ایده ساده است: یک فهرست از مقادیر بساز. سپس همه را تست کن. در پایان، بیشترین امتیاز را انتخاب کن.

نکته: مقدار بزرگ تر C یعنی تکیه بیشتر به داده های آموزش. مقدار کوچک تر یعنی منظم سازی بیشتر و مدل ساده تر.

شروع با تنظیمات پیش فرض

ابتدا دیتاست آیریس را لود کن.

from sklearn import datasets
iris = datasets.load_iris()

مشاهده در ادیتور

سپس X و y را از دیتاست جدا کن.

X = iris['data']
y = iris['target']

مشاهده در ادیتور

مدل رگرسیون لجستیک را می سازیم و max_iter را بالا می بریم.

from sklearn.linear_model import LogisticRegression

logit = LogisticRegression(max_iter = 10000)
logit.fit(X, y)
print(logit.score(X, y))

مشاهده در ادیتور

با C پیش فرض یعنی 1، امتیاز حدود 0.973 می شود.

اجرای جست وجوی شبکه ای روی C

حالا یک رِنج از مقادیر C می دهیم و همه را امتحان می کنیم.

from sklearn import datasets
from sklearn.linear_model import LogisticRegression

iris = datasets.load_iris()
X = iris['data']
y = iris['target']

logit = LogisticRegression(max_iter = 10000)

C = [0.25, 0.5, 0.75, 1, 1.25, 1.5, 1.75, 2]

scores = []

for choice in C:
  logit.set_params(C = choice)
  logit.fit(X, y)
  scores.append(logit.score(X, y))

print(scores)

مشاهده در ادیتور

نتیجه نشان می دهد مقادیر خیلی کوچک C بدترند. نزدیک 1.75 بهتر می شود. افزایش بیشتر سودی ندارد.

گام های عملی

  1. داده را لود کن و X، y بساز.
  2. مدل پایه را با C پیش فرض بسنج.
  3. فهرست مقادیر C را تعریف کن.
  4. یک حلقه بزن، fit و score را ذخیره کن.
  5. بهترین C را با بیشترین امتیاز انتخاب کن.

نکته های حرفه ای

اگر روی همان داده آموزش امتیاز بگیری، ممکن است «بیش برازش (Overfitting)» شود. پس داده را به آموزش/آزمون تقسیم کن.

هشدار: امتیاز روی آموزش ملاک نهایی نیست. همیشه روی داده دیده نشده بسنج.

جمع بندی سریع

  • جست وجوی شبکه ای همه ترکیب ها را تست می کند.
  • C بزرگ تر، تکیه بیشتر بر داده آموزش است.
  • فقط به امتیاز آموزش اعتماد نکن.
  • گام های ساده: تعریف رِنج، حلقه، سنجش، انتخاب.

ادامه مسیر: برای مدل پایه به رگرسیون لجستیک برو. سپس برای آماده سازی داده، پیش پردازش را ببین.