Tutorial Data Science Dengan Pyhton : Cara Menggunakan P Value di Python
Nilai p adalah tentang kekuatan hipotesis. Kami membangun hipotesis berdasarkan beberapa model statistik dan membandingkan validitas model menggunakan nilai-p. Salah satu cara untuk mendapatkan nilai p adalah dengan menggunakan uji-T.
Ini adalah pengujian dua sisi untuk hipotesis nol bahwa nilai yang diharapkan (mean) dari sampel observasi independen 'a' sama dengan mean populasi tertentu, popmean . Mari kita perhatikan contoh berikut.
from scipy import stats rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2)) print stats.ttest_1samp(rvs,5.0)
Program di atas akan menghasilkan keluaran sebagai berikut.
Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]), pvalue = array([ 0.16726344, 0.00945234]))
Membandingkan dua sampel
Dalam contoh berikut, ada dua sampel, yang dapat berasal dari distribusi yang sama atau berbeda, dan kami ingin menguji apakah sampel ini memiliki properti statistik yang sama.
ttest_ind - Menghitung uji-T untuk mean dari dua sampel skor independen. Ini adalah pengujian dua sisi untuk hipotesis nol bahwa dua sampel independen memiliki nilai rata-rata (yang diharapkan) yang identik. Tes ini mengasumsikan bahwa populasi memiliki varian identik secara default.
Kami dapat menggunakan tes ini, jika kami mengamati dua sampel independen dari populasi yang sama atau berbeda. Mari kita perhatikan contoh berikut.
from scipy import stats rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500) rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500) print stats.ttest_ind(rvs1,rvs2)
Program di atas akan menghasilkan keluaran sebagai berikut.
Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)
Anda dapat menguji hal yang sama dengan array baru dengan panjang yang sama, tetapi dengan mean yang bervariasi. Gunakan nilai yang berbeda di loc dan uji yang sama.
Post a Comment for "Tutorial Data Science Dengan Pyhton : Cara Menggunakan P Value di Python"