شروع کار (Getting Started)
در این صفحه، شروع کار با pandas را قدم به قدم می بینیم. این بخش کمک می کند از نصب pandas تا اجرای اولین مثال، همه چیز را ساده و مدرسه ای یاد بگیری.
نصب pandas با pip
در منبع گفته شده اگر پایتون (Python) و ابزار pip را روی سیستم نصب کرده ای، نصب pandas خیلی آسان است. pip یک ابزار خط فرمان برای نصب کتابخانه های پایتون است؛ مثل نصب اپ از مارکت.
برای نصب، باید یک دستور در خط فرمان اجرا کنی. خط فرمان همان پنجره سیاه است که دستورات متنی می گیری.
pip install pandas
در منبع نوشته شده اگر این دستور درست اجرا نشد، می توانی از توزیع هایی مثل Anaconda یا محیط هایی مثل Spyder استفاده کنی که pandas را از قبل نصب دارند.
- پایتون و pip را روی سیستم نصب کن.
- خط فرمان را باز کن و دستور نصب را بنویس.
- اگر خطا داشتی، یکی از توزیع های آماده مثل Anaconda را امتحان کن.
نکته: برای ادامه آموزش و شروع کار با pandas لازم است نصب بدون خطا انجام شده باشد.
وارد کردن pandas در کد (import)
بعد از نصب، باید pandas را داخل برنامه پایتون وارد کنی. در منبع گفته شده این کار با کلمه کلیدی import انجام می شود. import یعنی به پایتون بگوییم این کتابخانه را در این فایل فعال کن.
import pandas
از این لحظه، پایتون pandas را می شناسد و می توانی از امکاناتش استفاده کنی. اگر صفحه معرفی pandas را خوانده ای، حالا زمان شروع کار با pandas در عمل است.
اولین مثال: ساخت DataFrame ساده
در منبع یک مثال ساده نشان داده شده است. در این مثال یک دیکشنری (Dictionary) از داده ماشین ها ساخته می شود و بعد با pandas آن را به یک جدول DataFrame تبدیل می کنند. DataFrame یعنی جدول سطر و ستون، شبیه جدول دفتر نمره.
import pandas
mydataset = {
"cars": ["BMW", "Volvo", "Ford"],
"passings": [3, 7, 2]
}
myvar = pandas.DataFrame(mydataset)
print(myvar)
در این کد، mydataset یک دیکشنری ساده است؛ شبیه جدولی که یک ستون نام ماشین ها و یک ستون تعداد عبور دارد. بعد با pandas.DataFrame آن را به یک جدول واقعی تبدیل می کنیم و با print همه جدول را چاپ می کنیم.
- یک فایل پایتون جدید بساز.
- کد بالا را در آن کپی کن.
- فایل را اجرا کن و خروجی جدولی را ببین.
استفاده از نام مستعار pd برای pandas
در منبع نوشته شده معمول است که pandas را با نام مستعار (Alias) وارد کنیم. alias در پایتون یعنی یک اسم کوتاه برای اشاره به همان چیز. این کار نوشتن کد را سریع تر و خواناتر می کند.
برای ساخت نام مستعار از کلمه as استفاده می کنیم. این کلمه یعنی «از این به بعد، این کتابخانه را با این اسم صدا بزن».
import pandas as pd
حالا به جای pandas می توانیم از pd استفاده کنیم. در منبع یک مثال دیگر برای ساخت DataFrame با همین روش آورده شده است.
import pandas as pd
mydataset = {
"cars": ["BMW", "Volvo", "Ford"],
"passings": [3, 7, 2]
}
myvar = pd.DataFrame(mydataset)
print(myvar)
کد تقریباً همان است، فقط به جای pandas از pd استفاده کرده ایم. این روش در تمام آموزش pandas رایج است، پس از همین الگو استفاده کن تا کدهایت شبیه بقیه منابع باشد.
بررسی نسخه pandas
گاهی لازم است بدانی کدام نسخه pandas روی سیستم نصب شده است. در منبع گفته شده رشته نسخه در ویژگی (Attribute) به نام __version__ ذخیره می شود. Attribute یعنی یک مقدار وابسته به شیء؛ مثل ویژگی سن برای یک دانش آموز.
import pandas as pd
print(pd.__version__)
این کد نسخه pandas را در خروجی چاپ می کند. اگر در آموزش ها به نسخه خاصی اشاره شد، می توانی با این دستور چک کنی نسخه روی سیستم تو نزدیک همان نسخه است یا نه.
گام های عملی برای شروع کار با pandas
- پایتون و pip را نصب و تست کن.
- با دستور pip install pandas، کتابخانه را نصب کن.
- یک فایل بساز، کد import pandas as pd را بنویس.
- مثال DataFrame ماشین ها را اجرا کن و خروجی را ببین.
- با دستور pd.__version__ نسخه pandas را بررسی کن.
اگر این گام ها را انجام دادی، یعنی شروع کار با pandas را واقعاً انجام داده ای و آماده ای به سراغ بخش بعدی یعنی Series در pandas بروی.
جمع بندی سریع
- برای شروع کار با pandas باید اول آن را با pip نصب کنی.
- با import pandas یا import pandas as pd آن را وارد برنامه کن.
- با DataFrame می توانی دیکشنری ها را به جدول های قابل چاپ تبدیل کنی.
- نام مستعار pd نوشتن کد را کوتاه و تمیزتر می کند.
- با pd.__version__ همیشه می توانی نسخه نصب شده pandas را ببینی.