Basic Pandas Operations: Membuat, Mengambil, Mengganti, dan Menghitung Statistik Data dengan Contoh

Artikel berikut memuat Basic Pandas Operations: Membuat, Mengambil, Mengganti, dan Menghitung Statistik Data dengan Contoh
Basic Pandas Operations: Membuat, Mengambil, Mengganti, dan Menghitung Statistik Data dengan Contoh

Pendahuluan 

Pandas adalah salah satu library Python yang paling populer dan berguna untuk mengolah data. Dalam Pandas, terdapat beberapa operasi dasar yang dapat dilakukan untuk memanipulasi data dengan mudah. Salah satu operasi dasar tersebut adalah menciptakan data atau membuat DataFrame dan Series. Membuat DataFrame DataFrame adalah struktur data tabular yang terdiri dari baris dan kolom, mirip dengan tabel database. Untuk membuat DataFrame kosong, Anda dapat menggunakan kode berikut:
import pandas as pd

df = pd.DataFrame()
Anda juga dapat membuat DataFrame dari sebuah dictionary, di mana setiap pasangan kunci-nilai dalam dictionary akan menjadi sebuah kolom dalam DataFrame. Contoh:
data = {'nama': ['Budi', 'Siti', 'Ani', 'Dedi'],
        'umur': [21, 22, 23, 24],
        'gender': ['L', 'P', 'P', 'L']}

df = pd.DataFrame(data)

Membuat Series 

Series adalah struktur data satu dimensi yang mirip dengan array atau list. Namun, Series memiliki indeks, sehingga setiap elemen dalam Series dapat diakses menggunakan indeksnya. Untuk membuat Series kosong, Anda dapat menggunakan kode berikut:
import pandas as pd

s = pd.Series()
Anda juga dapat membuat Series dari sebuah list atau array. Contoh:
data = [10, 20, 30, 40, 50]

s = pd.Series(data)

Mengambil Data 

Anda dapat mengambil data dari DataFrame atau Series menggunakan indeks atau label. Contoh:
# mengambil data dari kolom 'nama'
df['nama']

# mengambil data dari baris pertama
df.loc[0]

# mengambil data dari baris kedua dan kolom 'umur'
df.loc[1, 'umur']

# mengambil data dari indeks ke-2 hingga ke-4
s[2:5]
Menghapus Data Anda dapat menghapus data dari DataFrame atau Series menggunakan fungsi drop(). Contoh:
# menghapus kolom 'gender' dari DataFrame
df = df.drop('gender', axis=1)

# menghapus baris pertama dari DataFrame
df = df.drop(0)

# menghapus elemen ke-3 dari Series
s = s.drop(2)
Mengganti Data Anda dapat mengganti data dalam DataFrame atau Series menggunakan fungsi replace(). Contoh:
# mengganti nilai 'P' menjadi 'Perempuan' dalam kolom 'gender' dari DataFrame
df = df.replace('P', 'Perempuan')

# mengganti nilai 30 menjadi 35 dalam Series
s = s.replace(30, 35)
Menambah Data Anda dapat menambah data ke dalam DataFrame atau Series menggunakan fungsi append(). Contoh:
# menambahkan baris baru ke dalam DataFrame
new_data = {'nama new_data = {'nama': 'Eka', 'umur': 25, 'gender': 'Perempuan'}
df = df.append(new_data, ignore_index=True)#menambahkan elemen baru ke dalam Series
new_data = pd.Series([60])
s = s.append(new_data, ignore_index=True)
# menghitung rata-rata umur dalam DataFrame
df['umur'].mean()

# menghitung nilai maksimum dalam Series
s.max()

Menghitung Statistik Data 

Menghitung statistik data dalam Pandas menggunakan beberapa fungsi: Mean
import pandas as pd

data = {'nilai': [70, 80, 90, 85, 95]}
df = pd.DataFrame(data)

mean = df['nilai'].mean()
print(mean) # Output: 84.0

Median

import pandas as pd

data = {'nilai': [70, 80, 90, 85, 95]}
df = pd.DataFrame(data)

median = df['nilai'].median()
print(median) # Output: 85.0

Mode

import pandas as pd

data = {'nilai': [70, 80, 90, 85, 95, 85, 85]}
df = pd.DataFrame(data)

mode = df['nilai'].mode()
print(mode) # Output: 0    85
            #         dtype: int64

Minimum

import pandas as pd

data = {'nilai': [70, 80, 90, 85, 95]}
df = pd.DataFrame(data)

minimum = df['nilai'].min()
print(minimum) # Output: 70

Maximum

import pandas as pd

data = {'nilai': [70, 80, 90, 85, 95]}
df = pd.DataFrame(data)

maximum = df['nilai'].max()
print(maximum) # Output: 95

Sum

import pandas as pd

data = {'nilai': [70, 80, 90, 85, 95]}
df = pd.DataFrame(data)

sum = df['nilai'].sum()
print(sum) # Output: 420

Kesimpulan 

Pandas menyediakan operasi dasar yang mudah dan berguna untuk memanipulasi data, termasuk membuat DataFrame dan Series, mengambil data, menghapus data, mengganti data, menambah data, dan menghitung statistik data. Dalam artikel ini, telah dijelaskan bagaimana cara melakukan operasi dasar tersebut beserta contoh penggunaannya. Dengan menguasai operasi dasar ini, Anda akan lebih mudah dalam memanipulasi dan menganalisis data menggunakan Pandas.

Dukung Kami