Belajar DataFrames pada Python: Panduan Lengkap untuk Manipulasi Data dalam Tabel

Artikel berikut memuat Belajar DataFrames pada Python: Panduan Lengkap untuk Manipulasi Data dalam Tabel
Belajar DataFrames pada Python: Panduan Lengkap untuk Manipulasi Data dalam Tabel

1. Pengertian DataFrames pada Python

DataFrames pada Python adalah struktur data berupa tabel dua dimensi yang terdiri dari baris dan kolom. DataFrames merupakan salah satu fitur yang disediakan oleh library Pandas yang banyak digunakan dalam analisis data. Dalam DataFrames, baris dapat merepresentasikan data yang terkait dengan objek tertentu, sementara kolom merepresentasikan jenis data yang berbeda seperti string, numerik, atau tanggal.

2. Manfaat DataFrames pada Python

DataFrames pada Python memiliki manfaat yang sangat besar dalam analisis data. Beberapa manfaat tersebut antara lain:

  • Memudahkan dalam mengakses dan memanipulasi data
  • Membuat analisis data menjadi lebih efisien dan cepat
  • Memungkinkan penggunaan beberapa jenis data dalam satu tabel
  • Membuat visualisasi data menjadi lebih mudah

3. Cara Belajar DataFrames pada Python

Belajar DataFrames pada Python dapat dilakukan dengan beberapa cara, antara lain:

3.1 Menggunakan Library Pandas

Library Pandas merupakan library yang sering digunakan dalam analisis data pada Python. Dalam library ini terdapat fitur DataFrames yang dapat digunakan untuk mengolah data secara efisien. Untuk dapat menggunakan library Pandas, pengguna harus melakukan instalasi terlebih dahulu. Setelah itu, pengguna dapat mempelajari dasar-dasar DataFrames pada Pandas dan melakukan beberapa contoh analisis data.

3.2 Menampilkan DataFrames pada Python

Setelah memahami dasar-dasar DataFrames pada Pandas, pengguna dapat melakukan tampilan data menggunakan DataFrames. Berikut adalah contoh kode untuk menampilkan DataFrames pada Python:


import pandas as pd
data = {'nama': ['John', 'Sarah', 'Peter', 'Alice'],
        'usia': [25, 28, 21, 23],
        'pekerjaan': ['Programmer', 'Analyst', 'Manager', 'Designer']}
df = pd.DataFrame(data)
print(df)

Output:


    nama  usia    pekerjaan
0   John    25  Programmer
1  Sarah    28     Analyst
2  Peter    21      Manager
3  Alice    23     Designer

Contoh di atas menunjukkan sebuah DataFrame dengan tiga kolom: nama, usia, dan pekerjaan. DataFrame tersebut menunjukkan informasi tentang empat orang dengan data yang berbeda-beda.

3.3 Mengubah DataFrames pada Python

Selain menampilkan data, pengguna juga dapat melakukan pengubahan data pada DataFrames. Pengubahan data pada DataFrames dapat dilakukan dengan beberapa cara, antara lain:

3.3.1 Mengganti Nama Kolom

Untuk mengganti nama kolom pada DataFrames, pengguna dapat menggunakan fungsi rename(). Berikut adalah contoh kode untuk mengganti nama kolom:


import pandas as pd
data = {'nama': ['John', 'Sarah', 'Peter', 'Alice'],
        'usia': [25, 28, 21, 23],
        'pekerjaan': ['Programmer', 'Analyst', 'Manager', 'Designer']}
df = pd.DataFrame(data)
df = df.rename(columns={'nama': 'nama_lengkap'})
print(df)

Output:


  nama_lengkap  usia    pekerjaan
0         John    25  Programmer
1        Sarah    28     Analyst
2        Peter    21      Manager
3        Alice    23     Designer

3.3.2 Mengganti Nilai Data

Untuk mengganti nilai data pada DataFrames, pengguna dapat menggunakan fungsi at[]. Berikut adalah contoh kode untuk mengganti nilai data:


import pandas as pd
data = {'nama': ['John', 'Sarah', 'Peter', 'Alice'],
        'usia': [25, 28, 21, 23],
        'pekerjaan': ['Programmer', 'Analyst', 'Manager', 'Designer']}
df = pd.DataFrame(data)
df.at[1, 'pekerjaan'] = 'Engineer'
print(df)

Output:


    nama  usia   pekerjaan
0   John    25  Programmer
1  Sarah    28    Engineer
2  Peter    21     Manager
3  Alice    23    Designer

3.4 Menambah DataFrames pada Python

Pengguna juga dapat menambahkan data baru pada DataFrames. Pengguna dapat melakukan penambahan databaru pada DataFrames dengan menggunakan beberapa metode, antara lain:

3.4.1 Menambahkan Baris

Untuk menambahkan baris pada DataFrames, pengguna dapat menggunakan fungsi append(). Berikut adalah contoh kode untuk menambahkan baris:


import pandas as pd
data = {'nama': ['John', 'Sarah', 'Peter', 'Alice'],
        'usia': [25, 28, 21, 23],
        'pekerjaan': ['Programmer', 'Analyst', 'Manager', 'Designer']}
df = pd.DataFrame(data)
new_data = {'nama': 'Bob', 'usia': 30, 'pekerjaan': 'Engineer'}
df = df.append(new_data, ignore_index=True)
print(df)

Output:


    nama  usia    pekerjaan
0   John    25  Programmer
1  Sarah    28     Analyst
2  Peter    21      Manager
3  Alice    23     Designer
4    Bob    30     Engineer

3.4.2 Menambahkan Kolom

Untuk menambahkan kolom pada DataFrames, pengguna dapat menggunakan operasi seperti pada dictionary. Berikut adalah contoh kode untuk menambahkan kolom:

import pandas as pd
data = {'nama': ['John', 'Sarah', 'Peter', 'Alice'],
        'usia': [25, 28, 21, 23],
        'pekerjaan': ['Programmer', 'Analyst', 'Manager', 'Designer']}
df = pd.DataFrame(data)
df['gaji'] = [5000000, 6000000, 7000000, 8000000]
print(df)

Output:

    nama  usia    pekerjaan      gaji
0   John    25  Programmer   5000000
1  Sarah    28     Analyst   6000000
2  Peter    21      Manager   7000000
3  Alice    23     Designer   8000000

3.5 Menghapus DataFrames pada Python

Selain menambahkan data, pengguna juga dapat menghapus data pada DataFrames. Penghapusan data pada DataFrames dapat dilakukan dengan beberapa cara, antara lain:

3.5.1 Menghapus Baris

Untuk menghapus baris pada DataFrames, pengguna dapat menggunakan fungsi

drop(). Berikut adalah contoh kode untuk menghapus baris:
import pandas as pd
data = {'nama': ['John', 'Sarah', 'Peter', 'Alice'],
        'usia': [25, 28, 21, 23],
        'pekerjaan': ['Programmer', 'Analyst', 'Manager', 'Designer']}
df = pd.DataFrame(data)
df = df.drop(1)
print(df)

Output:

    nama  usia   pekerjaan
0   John    25  Programmer
2  Peter    21     Manager
3  Alice    23    Designer

3.5.2 Menghapus Kolom

Untuk menghapus kolom pada DataFrames, pengguna dapat menggunakan fungsi

drop(). Berikut adalah contoh kode untuk menghapus kolom:
import pandas as pd
data = {'nama': ['John', 'Sarah', 'Peter', 'Alice'],
        'usia': [25, 28, 21, 23],
        'pekerjaan': ['Programmer', 'Analyst', 'Manager', 'Designer']}
df = pd.DataFrame(data)
df = df.drop('pekerjaan', axis=1)
print(df)

Output:

    nama  usia
0   John    25
1  Sarah    28
2  Peter    21
3  Alice    23

3.6 Menyimpan DataFrames pada Python

Setelah melakukan manipulasi data pada DataFrames, pengguna dapat menyimpan DataFrames dalam berbagai format, seperti csv, excel, sql, dan lain-lain. Pengguna dapat menggunakan metode

to_csv()
untuk menyimpan DataFrames ke dalam format csv, atau metode
to_excel()
untuk menyimpan DataFrames ke dalam format excel.

import pandas as pd
data = {'nama': ['John', 'Sarah', 'Peter', 'Alice'],
        'usia': [25, 28, 21, 23],
        'pekerjaan': ['Programmer', 'Analyst', 'Manager', 'Designer']}
df = pd.DataFrame(data)
df.to_csv('data.csv', index=False)

Metode

to_csv()
memiliki parameter index yang dapat diatur menjadi False untuk menghilangkan penulisan index pada file csv.

4. Kesimpulan

DataFrames merupakan struktur data pada pandas yang digunakan untuk menyimpan data dalam bentuk tabel. DataFrames dapat digunakan untuk melakukan manipulasi data, seperti menambahkan data, menghapus data, dan menyimpan data ke dalam berbagai format file. Dalam artikel ini, telah dijelaskan tentang penggunaan DataFrames pada Python, seperti pembuatan DataFrames, indexing, manipulasi data, dan penyimpanan data. Diharapkan artikel ini dapat membantu pembaca dalam memahami penggunaan DataFrames pada Python.

Dukung Kami