Tutorial R : Cara Memasukan Data XML dan Membaca File XML di Pemrograman R
XML adalah format file yang berbagi format file dan data di World Wide Web, intranet, dan di tempat lain menggunakan teks ASCII standar. Itu singkatan dari Extensible Markup Language (XML). Mirip dengan HTML, ini berisi tag markup. Tetapi tidak seperti HTML dimana tag markup menggambarkan struktur halaman, dalam xml tag markup menggambarkan arti dari data yang terkandung ke dalam file he.
Anda dapat membaca file xml dalam R menggunakan paket "XML". Paket ini dapat diinstal menggunakan perintah berikut.
install.packages("XML")
Memasukan data
Buat file XMl dengan menyalin data di bawah ini ke editor teks seperti notepad. Simpan file dengan ekstensi .xml dan pilih jenis file sebagai semua file (*. *) .
<RECORDS> <EMPLOYEE> <ID>1</ID> <NAME>Rick</NAME> <SALARY>623.3</SALARY> <STARTDATE>1/1/2012</STARTDATE> <DEPT>IT</DEPT> </EMPLOYEE> <EMPLOYEE> <ID>2</ID> <NAME>Dan</NAME> <SALARY>515.2</SALARY> <STARTDATE>9/23/2013</STARTDATE> <DEPT>Operations</DEPT> </EMPLOYEE> <EMPLOYEE> <ID>3</ID> <NAME>Michelle</NAME> <SALARY>611</SALARY> <STARTDATE>11/15/2014</STARTDATE> <DEPT>IT</DEPT> </EMPLOYEE> <EMPLOYEE> <ID>4</ID> <NAME>Ryan</NAME> <SALARY>729</SALARY> <STARTDATE>5/11/2014</STARTDATE> <DEPT>HR</DEPT> </EMPLOYEE> <EMPLOYEE> <ID>5</ID> <NAME>Gary</NAME> <SALARY>843.25</SALARY> <STARTDATE>3/27/2015</STARTDATE> <DEPT>Finance</DEPT> </EMPLOYEE> <EMPLOYEE> <ID>6</ID> <NAME>Nina</NAME> <SALARY>578</SALARY> <STARTDATE>5/21/2013</STARTDATE> <DEPT>IT</DEPT> </EMPLOYEE> <EMPLOYEE> <ID>7</ID> <NAME>Simon</NAME> <SALARY>632.8</SALARY> <STARTDATE>7/30/2013</STARTDATE> <DEPT>Operations</DEPT> </EMPLOYEE> <EMPLOYEE> <ID>8</ID> <NAME>Guru</NAME> <SALARY>722.5</SALARY> <STARTDATE>6/17/2014</STARTDATE> <DEPT>Finance</DEPT> </EMPLOYEE> </RECORDS>
Membaca File XML
File xml dibaca oleh R menggunakan fungsi xmlParse () . Itu disimpan sebagai daftar di R.
# Load the package required to read XML files. library("XML") # Also load the other required package. library("methods") # Give the input file name to the function. result <- xmlParse(file = "input.xml") # Print the result. print(result)
Ketika kita menjalankan kode di atas, hasilnya adalah sebagai berikut -
1 Rick 623.3 1/1/2012 IT 2 Dan 515.2 9/23/2013 Operations 3 Michelle 611 11/15/2014 IT 4 Ryan 729 5/11/2014 HR 5 Gary 843.25 3/27/2015 Finance 6 Nina 578 5/21/2013 IT 7 Simon 632.8 7/30/2013 Operations 8 Guru 722.5 6/17/2014 Finance
Dapatkan Jumlah Node yang Ada di File XML
# Load the packages required to read XML files. library("XML") library("methods") # Give the input file name to the function. result <- xmlParse(file = "input.xml") # Exract the root node form the xml file. rootnode <- xmlRoot(result) # Find number of nodes in the root. rootsize <- xmlSize(rootnode) # Print the result. print(rootsize)
Ketika kita menjalankan kode di atas, hasilnya adalah sebagai berikut -
output [1] 8
Rincian Node Pertama
Mari kita lihat record pertama dari file yang diurai. Ini akan memberi kita gambaran tentang berbagai elemen yang ada di node tingkat atas.
# Load the packages required to read XML files. library("XML") library("methods") # Give the input file name to the function. result <- xmlParse(file = "input.xml") # Exract the root node form the xml file. rootnode <- xmlRoot(result) # Print the result. print(rootnode[1])
Ketika kita menjalankan kode di atas, hasilnya adalah sebagai berikut -
$EMPLOYEE 1 Rick 623.3 1/1/2012 IT attr(,"class") [1] "XMLInternalNodeList" "XMLNodeList"
Dapatkan Elemen Berbeda dari sebuah Node
# Load the packages required to read XML files. library("XML") library("methods") # Give the input file name to the function. result <- xmlParse(file = "input.xml") # Exract the root node form the xml file. rootnode <- xmlRoot(result) # Get the first element of the first node. print(rootnode[[1]][[1]]) # Get the fifth element of the first node. print(rootnode[[1]][[5]]) # Get the second element of the third node. print(rootnode[[3]][[2]])
Ketika kita menjalankan kode di atas, hasilnya adalah sebagai berikut -
1 IT Michelle
XML ke Data Frame
Untuk menangani data secara efektif dalam file besar, kami membaca data di file xml sebagai bingkai data. Kemudian memproses kerangka data untuk analisis data.
# Load the packages required to read XML files. library("XML") library("methods") # Convert the input xml file to a data frame. xmldataframe <- xmlToDataFrame("input.xml") print(xmldataframe)
Ketika kita menjalankan kode di atas, hasilnya adalah sebagai berikut -
ID NAME SALARY STARTDATE DEPT 1 1 Rick 623.30 2012-01-01 IT 2 2 Dan 515.20 2013-09-23 Operations 3 3 Michelle 611.00 2014-11-15 IT 4 4 Ryan 729.00 2014-05-11 HR 5 NA Gary 843.25 2015-03-27 Finance 6 6 Nina 578.00 2013-05-21 IT 7 7 Simon 632.80 2013-07-30 Operations 8 8 Guru 722.50 2014-06-17 Finance
Karena data sekarang tersedia sebagai kerangka data, kita dapat menggunakan fungsi terkait bingkai data untuk membaca dan memanipulasi file.
Post a Comment for "Tutorial R : Cara Memasukan Data XML dan Membaca File XML di Pemrograman R"