Tulisan kali ini menyambung tulisan sebelumnya: “Mengenal Boxplot”. Oleh karenanya, untuk memahami bagian ini silakan baca terlebih dahulu tulisan tersebut.
Pada bagian ini kita akan mencoba membuat boxplot secara manual, agar ketika mengaplikasikan pada software-software statistik bisa lebih memahami prosedur nya.
Sebagai latihan, misalnya kita punya sekumpulan data berikut:
10 12 16 18 20 21 22 22 23 27 32
Data tersebut telah diurut dari nilai terkecil ke nilai terbesar. Banyaknya data (n) = 11, nilai data terkecil adalah 10 dan nilai data terbesar adalah 32.
Selanjutnya tentukan letak kuartil pertama (Q1), kuartil kedua (Q2 = median) dan kuartil ketiga (Q3), yang akan membagi kelompok data tersebut atas empat bagian sama besar.
Cara menentukan letak kuartil adalah:
Q1 = 1(n+1)/4 = 1(11+1)/4 = 3
Q2 = 2 (n+1)/4 = 2(11+1)/4 = 6
Q3 = 3(n+1)/4 = 3(11+1)/4 = 9
Letak Q1 adalah pada data urutan ke 3 yaitu 16. Letak Q2 adalah pada data urutan ke 6 yaitu 21 dan letak Q3 pada data urutan ke 9 yaitu 23.
Berdasarkan nilai Q1 dan Q3, kita bisa mendapatkan interquartile range (IQR) atau simpangan kuartil dengan rumus Q3 – Q1 = 23 – 16 = 7
Setelah mengetahui nilai minimum, nilai maksimum, Q1, Q2, Q3 dan IQR, selanjutnya kita akan mendeteksi apakah terdapat nilai outlier atau nilai ekstrim dari data tersebut.
Sebagaimana yang dijelaskan pada tulisan sebelumnya, suatu nilai dikatakan outlier jika:
Q3 + (1.5 x IQR) < outlier ≤ Q3 + (3 x IQR)
Atau
Q1 - (1.5 x IQR) > outlier ≥ Q1 - (3 x IQR)
Selanjutnya, suatu nilai dikatakan ekstrim jika lebih besar dari Q3 + (3 x IQR) atau lebih kecil dari Q1 – (3 x IQR)
Oleh karenanya, nilai outlier dalam kasus kita adalah jika:
33.5 < outlier ≤ 44 Atau 5.5 > outlier ≥ -5
Dan dikatakan memiliki nilai ekstrim jika ada nilai lebih besar dari 44 atau ada nilai yang lebih kecil dari -5.
Berdasarkan pengamatan terlihat bahwa data contoh kita tidak memiliki nilai outlier maupun nilai ekstrim.
Dari informasi yang telah didapatkan, selanjutnya kita buat boxplotnya sebagai berikut:
Ok. Kita cukupkan dulu bagian ini. Pada bagian berikutnya akan dibahas aplikasi boxplot pada software-software statistik.
Pada bagian ini kita akan mencoba membuat boxplot secara manual, agar ketika mengaplikasikan pada software-software statistik bisa lebih memahami prosedur nya.
Sebagai latihan, misalnya kita punya sekumpulan data berikut:
10 12 16 18 20 21 22 22 23 27 32
Data tersebut telah diurut dari nilai terkecil ke nilai terbesar. Banyaknya data (n) = 11, nilai data terkecil adalah 10 dan nilai data terbesar adalah 32.
Selanjutnya tentukan letak kuartil pertama (Q1), kuartil kedua (Q2 = median) dan kuartil ketiga (Q3), yang akan membagi kelompok data tersebut atas empat bagian sama besar.
Cara menentukan letak kuartil adalah:
Q1 = 1(n+1)/4 = 1(11+1)/4 = 3
Q2 = 2 (n+1)/4 = 2(11+1)/4 = 6
Q3 = 3(n+1)/4 = 3(11+1)/4 = 9
Letak Q1 adalah pada data urutan ke 3 yaitu 16. Letak Q2 adalah pada data urutan ke 6 yaitu 21 dan letak Q3 pada data urutan ke 9 yaitu 23.
Berdasarkan nilai Q1 dan Q3, kita bisa mendapatkan interquartile range (IQR) atau simpangan kuartil dengan rumus Q3 – Q1 = 23 – 16 = 7
Setelah mengetahui nilai minimum, nilai maksimum, Q1, Q2, Q3 dan IQR, selanjutnya kita akan mendeteksi apakah terdapat nilai outlier atau nilai ekstrim dari data tersebut.
Sebagaimana yang dijelaskan pada tulisan sebelumnya, suatu nilai dikatakan outlier jika:
Q3 + (1.5 x IQR) < outlier ≤ Q3 + (3 x IQR)
Atau
Q1 - (1.5 x IQR) > outlier ≥ Q1 - (3 x IQR)
Selanjutnya, suatu nilai dikatakan ekstrim jika lebih besar dari Q3 + (3 x IQR) atau lebih kecil dari Q1 – (3 x IQR)
Oleh karenanya, nilai outlier dalam kasus kita adalah jika:
33.5 < outlier ≤ 44 Atau 5.5 > outlier ≥ -5
Dan dikatakan memiliki nilai ekstrim jika ada nilai lebih besar dari 44 atau ada nilai yang lebih kecil dari -5.
Berdasarkan pengamatan terlihat bahwa data contoh kita tidak memiliki nilai outlier maupun nilai ekstrim.
Dari informasi yang telah didapatkan, selanjutnya kita buat boxplotnya sebagai berikut:
Ok. Kita cukupkan dulu bagian ini. Pada bagian berikutnya akan dibahas aplikasi boxplot pada software-software statistik.
No comments:
Post a Comment