مرجع دیتافریم ها (DataFrames Reference)
اینجا یک مرجع سریع برای تمام ویژگی ها و متدهای DataFrame در پانداس داری. این صفحه مثل یک برگه تقلب مرتب است که هر وقت اسم یک متد یادت رفت، سریع به آن نگاه می کنی و توضیح کوتاهش را می خوانی. در واقع اینجا همان چیزی است که از یک مرجع دیتافریم ها انتظار داریم.
مرجع دیتافریم ها دقیقا چه چیزی نشان می دهد؟
در منبع، یک جدول بزرگ دیده می شود که دو ستون دارد. ستون اول نام ویژگی یا متد DataFrame است؛ مثل head()، dropna()، merge()، sum()، shape. ستون دوم توضیح خیلی کوتاه همان متد است؛ مثلا برای drop_duplicates() نوشته «Drops duplicate values from the DataFrame».
برای بسیاری از متدها، نام در جدول به شکل لینک است. وقتی روی لینک کلیک می کنی، در سایت W3Schools به صفحه ای جدا می روی که همان متد را با توضیح بیشتر و مثال کامل نشان می دهد.
ساختار جدول مرجع دیتافریم ها
این جدول با سرفصل «All properties and methods of the DataFrame object, with explanations and examples» شروع می شود. یعنی قرار است همه ویژگی ها و متدهای مهم DataFrame را کنار هم ببینی. هر ردیف فقط یک متد یا ویژگی را پوشش می دهد؛ مثل info()، columns، index، values، groupby()، sort_values() و ده ها مورد دیگر.
به خاطر همین ساختار، وقتی نام متد را یادت نیست، اما تقریبا می دانی دنبال چه کاری هستی، می توانی بین توضیحات انگلیسی کوتاه بگردی و گزینه مناسب را پیدا کنی.
چطور با مرجع دیتافریم ها کار کنیم؟
برای استفاده بهتر از این مرجع، می توانی یک فرآیند سه مرحله ای ساده داشته باشی؛ مثل وقتی در مدرسه دنبال یک کلمه در فرهنگ لغت می گردی.
- اول مشکل را دقیق بگو؛ مثلا «می خواهم سطرهای خالی حذف شوند».
- بعد در ستون توضیحات، دنبال جمله ای بگرد که همین کار را می گوید؛ مثلا توضیح
dropna()نوشته «Drops all rows that contains NULL values». - در نهایت، اگر نیاز داشتی، روی نام متد کلیک کن تا صفحه آموزشی جداگانه را در W3Schools ببینی.
نکته: همین روش را می توانی برای کارهای دیگر هم تکرار کنی؛ مثلا پیدا کردن متدی برای ادغام جدول ها با merge() یا مرتب سازی با sort_values().
نمونه دسته بندی ذهنی متدهای دیتافریم
اگرچه جدول منبع الفبایی است، اما بهتر است در ذهن خودت آن را به چند گروه تبدیل کنی. این کار پیدا کردن متد مناسب را سریع تر می کند؛ درست شبیه مرتب کردن پوشه های فایل روی کامپیوتر.
- مرتب سازی و انتخاب:
head()،tail()،sample()،sort_values()،sort_index()،query()،filter(). - پاک سازی داده:
dropna()،fillna()،drop_duplicates()،replace()،isnull()،notnull(). - آمار و محاسبات:
sum()،mean()،median()،std()،var()،max()،min()،corr()،cov(). - ساختار و فرم دیتافریم:
index،columns،shape،size،ndim،set_index()،reset_index()،rename()،rename_axis(). - ادغام و گروه بندی:
merge()،join()،groupby()،combine()،combine_first().
نکته: همه نام هایی که اینجا می بینی، همان هایی هستند که در جدول منبع آمده اند؛ ما فقط آن ها را به خانواده های ساده تر تقسیم کردیم.
ارتباط مرجع دیتافریم ها با بقیه مباحث پانداس
این صفحه بیشتر برای وقتی است که در وسط کار گیر کرده ای و فقط نام یا توضیح یک متد را می خواهی. برای یادگیری عمیق تر خود پانداس، بهتر است اول سراغ آموزش های اصلی بروی؛ مثلا چیزی شبیه صفحه «default.asp» در منبع که نقش خانه آموزش پانداس را دارد.
در سایت UnderDevelops می توانی از بخش آموزش اصلی پانداس شروع کنی و هر زمان لازم شد، دوباره به همین مرجع دیتافریم ها برگردی و متد موردنیاز را سریع پیدا کنی.
جمع بندی سریع
- این صفحه یک جدول مرجع برای متدها و ویژگی های DataFrame است.
- ستون اول نام متدها را نشان می دهد و ستون دوم توضیح کوتاه آن ها را.
- برای جزئیات بیشتر هر متد، روی لینک همان ردیف کلیک می کنی.
- بهتر است متدها را در ذهن خودت به چند گروه ساده تقسیم کنی.
- برای آموزش عمیق، سراغ صفحات آموزشی برو و برای مرور سریع، از این مرجع کمک بگیر.