Excel dan SPSS adalah dua program yang sering digunakan dalam analisis data. Salah satu masalah umum dalam analisis data adalah keberadaan outlier atau data yang jauh dari nilai-nilai data lain. Outlier dapat memengaruhi analisis data karena dapat menyebabkan nilai-nilai rata-rata serta varians menjadi tidak tepat dan menghasilkan kesalahan interpretasi. Berikut ini adalah cara menentukan outlier dengan Excel dan SPSS:
Cara Menentukan Data Outlier Dengan Excel
Excel memiliki dua metode untuk mengidentifikasi outlier – metode z-score dan metode IQR (interquartile range). Berikut ini adalah langkah-langkah untuk menggunakan keduanya:
Metode Z-Score
Z-score adalah sebuah skor standar yang menunjukkan berapa banyak standar deviasi sebuah pengamatan berada dari rata-rata. Nilai z-score yang melebihi batas tertentu dianggap sebagai outlier. Batas umum yang digunakan adalah 2 atau 3. Pendekatan 2 adalah yang lebih umum.
Langkah-langkah untuk menentukan outlier dengan metode z-score adalah sebagai berikut:
- Hitung rata-rata dan standar deviasi dari data Anda.
- Hitung z-score dari setiap pengamatan menggunakan rumus berikut: z = (x – μ) / σ
- Tentukan batas z-score. Jika Anda menggunakan pendekatan 2, maka batasnya adalah 2. Jika sebuah pengamatan memiliki z-score lebih besar dari 2 atau kurang dari -2, maka dianggap sebagai outlier.
- Buatlah grafik pencaran dan lingkari outlier.
Berikut ini adalah contoh penggunaan metode z-score:
Metode IQR
IQR adalah jarak antara kuartil pertama dan ketiga. Metode ini menganggap sebuah pengamatan sebagai outlier jika nilainya melebihi batas atas atau lebih rendah dari batas bawah. Batas atas dihitung dengan rumus Q3 + 1,5 (IQR) dan batas bawah dengan rumus Q1 – 1,5 (IQR).
Langkah-langkah untuk menentukan outlier dengan metode IQR adalah sebagai berikut:
- Susunlah data Anda dari terendah ke tertinggi.
- Hitunglah kuartil pertama (Q1), kuartil kedua (Q2) atau median, dan kuartil ketiga (Q3).
- Hitung IQR (kuartil ketiga – kuartil pertama).
- Buat batas atas dan bawah IQR dengan rumus Q1 – 1,5 (IQR) dan Q3 + 1,5 (IQR).
- Lingkari data yang melebihi batas atas atau lebih rendah dari batas bawah sebagai outlier.
Berikut ini adalah contoh penggunaan metode IQR:
Cara Menguji Data Outlier Dengan SPSS
SPSS memiliki dua metode untuk mengidentifikasi outlier – metode z-score dan metode Mahalanobis. Berikut ini adalah langkah-langkah untuk menggunakan keduanya:
Metode Z-Score
SPSS menyediakan fitur yang memungkinkan penghitungan z-score serta nilai kritis untuk batas ukuran signifikansi. Berikut ini adalah langkah-langkah untuk menentukan outlier menggunakan metode z-score di SPSS:
- Buka program SPSS dan masuklah pada dataset Anda.
- Pilih menu “Analyze” dan pilih “Descriptive Statistics” dari submenu.
- Pilih kolom yang ingin Anda uji dan masukkan pada kolom “Variable(s)”.
- Kliklah pada “Options” untuk memasukkan nilai kritis z-score yang ingin Anda gunakan. Nilai defaultnya adalah 1,96.
- Kliklah “OK” untuk menutup jendela Options dan kliklah “OK” lagi untuk menutup jendela pilihan Anda.
- Buka output dan lihatlah hasilnya. Outlier akan diberi tanda bintang di kolom “Case Processing Summary”.
Berikut ini adalah contoh penggunaan metode z-score di SPSS:
Metode Mahalanobis
Metode Mahalanobis adalah sebuah teknik yang menghitung jarak pengamatan dari titik-titik pusat data. Hal ini memungkinkan Anda untuk mengidentifikasi pengamatan yang jauh dari kelompok atau pengamatan yang ada. Berikut ini adalah langkah-langkah untuk menentukan outlier menggunakan metode Mahalanobis di SPSS:
- Buka program SPSS dan masuklah pada dataset Anda.
- Pilih menu “Analyze” dan pilih “Descriptive Statistics” dari submenu.
- Pilih kolom yang ingin Anda uji dan masukkan pada kolom “Variable(s)”.
- Kliklah pada “Options” dan centangkanlah pada “Mahalanobis”.
- Masukkan nilai batas signifikansi yang Anda inginkan. Nilai defaultnya adalah 0,001.
- Kliklah “OK” untuk menutup jendela Options dan kliklah “OK” lagi untuk menutup jendela pilihan Anda.
- Buka output dan lihatlah hasilnya. Outlier akan diberi tanda bintang di kolom “Case Processing Summary”.
Berikut ini adalah contoh penggunaan metode Mahalanobis di SPSS:
FAQ
1. Apa yang harus saya lakukan jika saya menemukan outlier dalam data saya?
Jawaban: Ada beberapa hal yang dapat Anda lakukan ketika menemukan outlier di dalam data Anda. Pertama, Anda dapat memeriksa ulang data untuk memastikan tidak ada kesalahan dalam pengumpulan data. Kedua, Anda dapat mencoba mengisi nilai yang hilang atau menghapus outlier jika Anda yakin bahwa mereka salah. Namun, Anda harus berhati-hati dalam menghapus outlier karena mereka dapat memiliki pengaruh yang signifikan pada analisis data Anda.
2. Apa yang harus saya lakukan jika saya tidak yakin apakah sebuah nilai adalah outlier atau tidak?
Jawaban: Jika Anda tidak yakin apakah sebuah nilai adalah outlier atau tidak, pertama-tama, Anda harus mencari tahu apakah data Anda memiliki distribusi normal atau tidak. Jika distribusinya normal, maka Anda dapat mengikuti langkah-langkah yang telah dijelaskan dalam artikel ini untuk menentukan outlier. Namun, jika distribusi data Anda tidak normal, Anda harus mencari tahu tentang teknik-teknik yang digunakan dalam analisis data non-parametrik. Anda juga dapat berkonsultasi dengan pakar statistik atau meminta bantuan dari sumber lain dalam menentukan apakah sebuah nilai adalah outlier atau tidak.