Tutorial Data Science Dengan Pyhton : Cara Menggabungkan dan Mengelompokkan Data di Python
Perselisihan data melibatkan pemrosesan data dalam berbagai format seperti - penggabungan, pengelompokan, penggabungan, dll. Untuk tujuan menganalisis atau menyiapkannya untuk digunakan dengan kumpulan data lain. Python memiliki fitur bawaan untuk menerapkan metode perselisihan ini ke berbagai kumpulan data untuk mencapai tujuan analitis. Dalam bab ini kita akan melihat beberapa contoh yang menjelaskan metode ini.
Menggabungkan Data
Pustaka Pandas di python menyediakan satu fungsi, gabungan , sebagai titik masuk untuk semua operasi gabungan database standar antara objek DataFrame -
pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True)
Mari kita sekarang membuat dua DataFrames berbeda dan melakukan operasi penggabungan di atasnya.
# import the pandas library import pandas as pd left = pd.DataFrame({ 'id':[1,2,3,4,5], 'Name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'], 'subject_id':['sub1','sub2','sub4','sub6','sub5']}) right = pd.DataFrame( {'id':[1,2,3,4,5], 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5']}) print left print right
Its keluaran adalah sebagai berikut -
Name id subject_id 0 Alex 1 sub1 1 Amy 2 sub2 2 Allen 3 sub4 3 Alice 4 sub6 4 Ayoung 5 sub5 Name id subject_id 0 Billy 1 sub2 1 Brian 2 sub4 2 Bran 3 sub3 3 Bryce 4 sub6 4 Betty 5 sub5
Pengelompokan Data
Pengelompokan kumpulan data adalah kebutuhan yang sering terjadi dalam analisis data di mana kami membutuhkan hasil dalam hal berbagai kelompok yang ada dalam kumpulan data. Panadas memiliki metode bawaan yang dapat menggulung data ke dalam berbagai kelompok.
Dalam contoh di bawah ini kami mengelompokkan data berdasarkan tahun dan kemudian mendapatkan hasilnya untuk tahun tertentu.
# import the pandas library import pandas as pd ipl_data = {'Team': ['Riders', 'Riders', 'Devils', 'Devils', 'Kings', 'kings', 'Kings', 'Kings', 'Riders', 'Royals', 'Royals', 'Riders'], 'Rank': [1, 2, 2, 3, 3,4 ,1 ,1,2 , 4,1,2], 'Year': [2014,2015,2014,2015,2014,2015,2016,2017,2016,2014,2015,2017], 'Points':[876,789,863,673,741,812,756,788,694,701,804,690]} df = pd.DataFrame(ipl_data) grouped = df.groupby('Year') print grouped.get_group(2014)
Its keluaran adalah sebagai berikut -
Points Rank Team Year 0 876 1 Riders 2014 2 863 2 Devils 2014 4 741 3 Kings 2014 9 701 4 Royals 2014
Menggabungkan Data
Panda menyediakan berbagai fasilitas untuk menggabungkan objek Seri, DataFrame , dan Panel dengan mudah . Dalam contoh di bawah ini, fungsi concat melakukan operasi penggabungan sepanjang sumbu. Mari kita buat objek yang berbeda dan lakukan penggabungan.
import pandas as pd one = pd.DataFrame({ 'Name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print pd.concat([one,two])
Its keluaran adalah sebagai berikut -
Marks_scored Name subject_id 1 98 Alex sub1 2 90 Amy sub2 3 87 Allen sub4 4 69 Alice sub6 5 78 Ayoung sub5 1 89 Billy sub2 2 80 Brian sub4 3 79 Bran sub3 4 97 Bryce sub6 5 88 Betty sub5
Post a Comment for "Tutorial Data Science Dengan Pyhton : Cara Menggabungkan dan Mengelompokkan Data di Python"