Tutorial Data Science Dengan Pyhton : Cara Membaca File Json dan Memproses Data di Python
File JSON menyimpan data sebagai teks dalam format yang dapat dibaca manusia. JSON adalah singkatan dari JavaScript Object Notation. Panda dapat membaca file JSON menggunakan fungsi read_json .
Memasukan data
Buat file JSON dengan menyalin data di bawah ini ke editor teks seperti notepad. Simpan file dengan ekstensi .json dan pilih jenis file sebagai semua file (*. *) .
{ "ID":["1","2","3","4","5","6","7","8" ], "Name":["Rick","Dan","Michelle","Ryan","Gary","Nina","Simon","Guru" ] "Salary":["623.3","515.2","611","729","843.25","578","632.8","722.5" ], "StartDate":[ "1/1/2012","9/23/2013","11/15/2014","5/11/2014","3/27/2015","5/21/2013", "7/30/2013","6/17/2014"], "Dept":[ "IT","Operations","IT","HR","Finance","IT","Operations","Finance"] }
Baca File JSON
Fungsi read_json pustaka pandas dapat digunakan untuk membaca file JSON menjadi DataFrame pandas.
import pandas as pd data = pd.read_json('path/input.json') print (data)
Ketika kita mengeksekusi kode di atas, hasilnya adalah sebagai berikut.
Dept ID Name Salary StartDate 0 IT 1 Rick 623.30 1/1/2012 1 Operations 2 Dan 515.20 9/23/2013 2 IT 3 Tusar 611.00 11/15/2014 3 HR 4 Ryan 729.00 5/11/2014 4 Finance 5 Gary 843.25 3/27/2015 5 IT 6 Rasmi 578.00 5/21/2013 6 Operations 7 Pranab 632.80 7/30/2013 7 Finance 8 Guru 722.50 6/17/2014
Membaca Kolom dan Baris Tertentu
Mirip dengan apa yang telah kita lihat di bab sebelumnya untuk membaca file CSV, fungsi read_json pustaka pandas juga dapat digunakan untuk membaca beberapa kolom dan baris tertentu setelah file JSON dibaca ke DataFrame. Kami menggunakan metode pengindeksan multi-sumbu yang disebut .loc () untuk tujuan ini. Kami memilih untuk menampilkan kolom Gaji dan Nama untuk beberapa baris.
import pandas as pd data = pd.read_json('path/input.xlsx') # Use the multi-axes indexing funtion print (data.loc[[1,3,5],['salary','name']])
Ketika kita mengeksekusi kode di atas, hasilnya adalah sebagai berikut.
salary name 1 515.2 Dan 3 729.0 Ryan 5 578.0 Rasmi
Membaca file JSON sebagai Record
Kita juga dapat menerapkan fungsi to_json bersama dengan parameter untuk membaca konten file JSON ke dalam catatan individu.
import pandas as pd data = pd.read_json('path/input.xlsx') print(data.to_json(orient='records', lines=True))
Ketika kita mengeksekusi kode di atas, hasilnya adalah sebagai berikut.
{"Dept":"IT","ID":1,"Name":"Rick","Salary":623.3,"StartDate":"1\/1\/2012"} {"Dept":"Operations","ID":2,"Name":"Dan","Salary":515.2,"StartDate":"9\/23\/2013"} {"Dept":"IT","ID":3,"Name":"Tusar","Salary":611.0,"StartDate":"11\/15\/2014"} {"Dept":"HR","ID":4,"Name":"Ryan","Salary":729.0,"StartDate":"5\/11\/2014"} {"Dept":"Finance","ID":5,"Name":"Gary","Salary":843.25,"StartDate":"3\/27\/2015"} {"Dept":"IT","ID":6,"Name":"Rasmi","Salary":578.0,"StartDate":"5\/21\/2013"} {"Dept":"Operations","ID":7,"Name":"Pranab","Salary":632.8,"StartDate":"7\/30\/2013"} {"Dept":"Finance","ID":8,"Name":"Guru","Salary":722.5,"StartDate":"6\/17\/2014"}
Post a Comment for "Tutorial Data Science Dengan Pyhton : Cara Membaca File Json dan Memproses Data di Python"