Peluang Usaha Mandiri

Friday, May 29, 2009

Mengenal Boxplot

Langkah awal dalam menganalisis data adalah mempelajari karakteristik dari data tersebut. Untuk itu, kita perlu mengetahui misalnya pemusatan dan penyebaran data dari nilai tengahnya, nilai ekstrim atau outliernya, dan beberapa pengukuran lainnya.
Terdapat beberapa teknik untuk mempelajari karakteristik dan distribusi data tersebut. Diantaranya adalah stem-leaf plot, histogram, density trace, probability plot dan box plot. Namun, pada seri tulisan ini, kita akan membahas terlebih dahulu mengenai boxplot.
Box plot atau boxplot (juga dikenal sebagai diagram box-and-whisker) merupakan suatu box (kotak berbentuk bujur sangkar). Boxplot adalah salah satu cara dalam statistik deskriptif untuk menggambarkan secara grafik dari data numeris melalui lima ukuran sebagai berikut:
  • nilai observasi terkecil,
  • kuartil terendah atau kuartil pertama (Q1), yang memotong 25 % dari data terendah
  • median (Q2) atau nilai pertengahan
  • kuartil tertinggi atau kuartil ketiga (Q3), yang memotong 25 % dari data tertinggi
  • nilai observasi terbesar.
Dalam boxplot juga ditunjukkan, jika ada, nilai outlier dari observasi.
Boxplot dapat digunakan untuk menunjukkan perbedaan antara populasi tanpa menggunakan asumsi distribusi statistik yang mendasarinya. Karenanya, boxplot tergolong dalam statistik non-parametrik. Jarak antara bagian-bagian dari box menunjukkan derajat dispersi (penyebaran) dan skewness (kecondongan) dalam data. Dalam penggambarannya, boxplot dapat digambarkan secara horizontal maupun vertikal.
Untuk memperjelas, dibawah ini diperlihatkan contoh dari boxplot.


  • Garis horizontal bagian bawah box menyajikan kuartil pertama (Q1), sementara bagian atas menyajikan kuartil ketiga (Q3). Bagian dari box adalah bidang yang menyajikan interquartile range (IQR), atau bagian pertengahan dari 50 % observasi. Panjang box ditentukan oleh IQR ini. IQR adalah ukuran yang terkenal untuk mengukur penyebaran data. Semakin tinggi (jika boxplot vertikal) atau semakin lebar (jika boxplot horizontal) bidang IQR ini, menunjukkan data semakin menyebar.
  • Garis tengah yang melewati box menyajikan median dari data. Median adalah ukuran yang terkenal untuk lokasi variabel (nilai pusat atau rata-rata)
  • Garis yang memperpanjang box dinamakan dengan whiskers. Whiskers menunjukkan nilai yang lebih rendah dan lebih tinggi dari kumpulan data yang berada dalam IQR (kecuali outlier). Panjang garis Whisker bagian atas ini adalah kurang dari atau sama dengan Q3 + (1.5 x IQR). Panjang garis Whisker bagian bawah ini adalah lebih besar atau sama dengan Q1 – (1.5 x IQR). Masing-masing garis whisker dimulai dari akhir box.
  • Nilai yang berada di atas atau dibawah whisker dinamakan nilai outlier atau ekstrim.
Suatu nilai dikatakan outlier jika:
Q3 + (1.5 x IQR) < outlier ≤ Q3 + (3 x IQR)
Atau
Q1 - (1.5 x IQR) > outlier ≥ Q1 - (3 x IQR)

Selanjutnya, suatu nilai dikatakan ekstrim jika lebih besar dari Q3 + (3 x IQR) atau lebih kecil dari Q1 – (3 x IQR)

Sebagaimana yang dikemukakan sebelumnya, selain untuk melihat derajat penyebaran data (yang dapat dilihat dari tinggi/lebar box), boxplot juga dapat digunakan untuk menilai kesimetrisan data. Jika data simetris, garis median akan berada di tengah box dan whisker pada bagian atas dan bagian bawah akan memiliki panjang yang sama. Jika data tidak simetris (condong), median tidak akan berada di tengah box dan salah satu dari whisker lebih panjang dari yang lainnya.
Ok cukup sekian dulu untuk seri pertama atau pengantar dari tulisan mengenai boxplot ini. Seri berikutnya, silakan lihat tulisan ini mengenai cara membuat boxplot secara manual. Mudah-mudahan kedepan akan kita bahas cara perhitungannya menggunakan software statistik.

No comments:

Post a Comment

 
(c) free template