Manipulasi Data dengan Pandas: Panduan Dasar Membaca, Menulis, Memilih, Memfilter, dan Mengurutkan Data

Manipulasi Data dengan Pandas: Panduan Dasar Membaca, Menulis, Memilih, Memfilter, dan Mengurutkan Data

1. Membaca Data

Pandas merupakan salah satu library Python yang digunakan untuk manipulasi dan analisis data. Salah satu fitur dari Pandas adalah kemampuannya dalam membaca berbagai jenis file, seperti CSV, Excel, dan SQL. Berikut adalah contoh membaca file CSV menggunakan Pandas:

import pandas as pd

df = pd.read_csv('nama_file.csv')
print(df.head())

Hasil output dari code di atas adalah 5 baris pertama dari data yang dibaca.

2. Menulis Data

Setelah data berhasil dibaca, selanjutnya kita dapat menulisnya ke dalam format file yang berbeda-beda. Contoh penggunaan Pandas untuk menulis file CSV adalah sebagai berikut:

import pandas as pd

df = pd.read_csv('nama_file.csv')
df.to_csv('nama_file_baru.csv', index=False)

Perintah index=False digunakan untuk menghilangkan kolom indeks saat data ditulis ke dalam file CSV baru.

3. Memilih Data

Kita dapat memilih kolom atau baris tertentu dari suatu DataFrame Pandas menggunakan perintah loc dan iloc. Perintah loc digunakan untuk memilih baris atau kolom berdasarkan label, sedangkan iloc digunakan untuk memilih baris atau kolom berdasarkan posisi.

import pandas as pd

df = pd.read_csv('nama_file.csv')

#Memilih kolom tertentu
df['nama_kolom']

#Memilih beberapa kolom
df[['kolom_1', 'kolom_2']]

#Memilih baris tertentu
df.loc[1]

#Memilih beberapa baris
df.loc[1:3]

#Memilih baris dan kolom tertentu
df.loc[1, 'nama_kolom']

#Memilih baris dan beberapa kolom
df.loc[1, ['kolom_1', 'kolom_2']]

#Memilih baris dan kolom berdasarkan posisi
df.iloc[1, 0]

4. Memfilter Data

Kita dapat melakukan filter pada suatu DataFrame Pandas dengan menggunakan operator logika (& untuk AND dan | untuk OR) dan perintah isin. Contoh penggunaannya sebagai berikut:

import pandas as pd

df = pd.read_csv('nama_file.csv')

Filter berdasarkan kondisi
df[df['kolom_1'] > 0]

Filter dengan operator logika
df[(df['kolom_1'] > 0) & (df['kolom_2'] < 10)]

Filter dengan perintah isin
df[df['nama_kolom'].isin(['nilai_1', 'nilai_2'])]

Kesimpulan

Pandas merupakan salah satu library Python yang sangat berguna dalam melakukan manipulasi dan analisis data. Beberapa operasi dasar yang dapat dilakukan dengan Pandas adalah membaca data, menulis data, memilih data, memfilter data, dan mengurutkan data. Dengan menguasai operasi-operasi dasar ini, kita dapat memanfaatkan seluruh potensi dari Pandas dalam mengolah data.



Posting Komentar untuk "Manipulasi Data dengan Pandas: Panduan Dasar Membaca, Menulis, Memilih, Memfilter, dan Mengurutkan Data"