Skip to content Skip to sidebar Skip to footer

Tutorial Data Science Dengan Pyhton : Cara Menggabungkan dan Mengelompokkan Data di Python

Cara Menggabungkan dan Mengelompokkan Data di Python



Perselisihan data melibatkan pemrosesan data dalam berbagai format seperti - penggabungan, pengelompokan, penggabungan, dll. Untuk tujuan menganalisis atau menyiapkannya untuk digunakan dengan kumpulan data lain. Python memiliki fitur bawaan untuk menerapkan metode perselisihan ini ke berbagai kumpulan data untuk mencapai tujuan analitis. Dalam bab ini kita akan melihat beberapa contoh yang menjelaskan metode ini.

Menggabungkan Data

Pustaka Pandas di python menyediakan satu fungsi, gabungan , sebagai titik masuk untuk semua operasi gabungan database standar antara objek DataFrame -

pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,
left_index=False, right_index=False, sort=True)

Mari kita sekarang membuat dua DataFrames berbeda dan melakukan operasi penggabungan di atasnya.

# import the pandas library
import pandas as pd
left = pd.DataFrame({
         'id':[1,2,3,4,5],
         'Name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'],
         'subject_id':['sub1','sub2','sub4','sub6','sub5']})
right = pd.DataFrame(
         {'id':[1,2,3,4,5],
         'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'],
         'subject_id':['sub2','sub4','sub3','sub6','sub5']})
print left
print right

Its keluaran adalah sebagai berikut -

    Name  id   subject_id
0   Alex   1         sub1
1    Amy   2         sub2
2  Allen   3         sub4
3  Alice   4         sub6
4  Ayoung  5         sub5

    Name  id   subject_id
0  Billy   1         sub2
1  Brian   2         sub4
2  Bran    3         sub3
3  Bryce   4         sub6
4  Betty   5         sub5

Pengelompokan Data

Pengelompokan kumpulan data adalah kebutuhan yang sering terjadi dalam analisis data di mana kami membutuhkan hasil dalam hal berbagai kelompok yang ada dalam kumpulan data. Panadas memiliki metode bawaan yang dapat menggulung data ke dalam berbagai kelompok.

Dalam contoh di bawah ini kami mengelompokkan data berdasarkan tahun dan kemudian mendapatkan hasilnya untuk tahun tertentu.

# import the pandas library
import pandas as pd

ipl_data = {'Team': ['Riders', 'Riders', 'Devils', 'Devils', 'Kings',
         'kings', 'Kings', 'Kings', 'Riders', 'Royals', 'Royals', 'Riders'],
         'Rank': [1, 2, 2, 3, 3,4 ,1 ,1,2 , 4,1,2],
         'Year': [2014,2015,2014,2015,2014,2015,2016,2017,2016,2014,2015,2017],
         'Points':[876,789,863,673,741,812,756,788,694,701,804,690]}
df = pd.DataFrame(ipl_data)

grouped = df.groupby('Year')
print grouped.get_group(2014)

Its keluaran adalah sebagai berikut -

   Points  Rank     Team    Year
0     876     1   Riders    2014
2     863     2   Devils    2014
4     741     3   Kings     2014
9     701     4   Royals    2014

Menggabungkan Data

Panda menyediakan berbagai fasilitas untuk menggabungkan objek Seri, DataFrame , dan Panel dengan mudah . Dalam contoh di bawah ini, fungsi concat melakukan operasi penggabungan sepanjang sumbu. Mari kita buat objek yang berbeda dan lakukan penggabungan.

import pandas as pd
one = pd.DataFrame({
         'Name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'],
         'subject_id':['sub1','sub2','sub4','sub6','sub5'],
         'Marks_scored':[98,90,87,69,78]},
         index=[1,2,3,4,5])
two = pd.DataFrame({
         'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'],
         'subject_id':['sub2','sub4','sub3','sub6','sub5'],
         'Marks_scored':[89,80,79,97,88]},
         index=[1,2,3,4,5])
print pd.concat([one,two])

Its keluaran adalah sebagai berikut -

    Marks_scored     Name   subject_id
1             98     Alex         sub1
2             90      Amy         sub2
3             87    Allen         sub4
4             69    Alice         sub6
5             78   Ayoung         sub5
1             89    Billy         sub2
2             80    Brian         sub4
3             79     Bran         sub3
4             97    Bryce         sub6
5             88    Betty         sub5

Post a Comment for "Tutorial Data Science Dengan Pyhton : Cara Menggabungkan dan Mengelompokkan Data di Python"

close