Pada kesempatan kali ini, kami ingin membahas tentang uji ANOVA atau Analysis of Variance, yang merupakan salah satu teknik analisis statistik untuk mengetahui apakah rata-rata dari beberapa kelompok yang berbeda signifikan atau tidak. Uji ini sering digunakan dalam penelitian sosial, ekonomi, dan ilmiah lainnya.
Contoh Soal ANOVA Satu Arah
Misalkan kita ingin mengetahui apakah terdapat perbedaan rata-rata pengeluaran antara tiga kelompok yang berbeda, yaitu kelompok A, B, dan C. Untuk itu, kita mengambil sampel sebanyak 10 orang dari masing-masing kelompok tersebut dan mengukur pengeluaran mereka dalam satu minggu.
Berikut merupakan data pengeluaran dalam satu minggu yang telah diukur:
Kelompok A | Kelompok B | Kelompok C |
---|---|---|
520 | 480 | 580 |
530 | 490 | 590 |
540 | 500 | 600 |
550 | 510 | 610 |
560 | 520 | 620 |
570 | 530 | 630 |
580 | 540 | 640 |
590 | 550 | 650 |
600 | 560 | 660 |
610 | 570 | 670 |
Langkah pertama dalam melakukan uji ANOVA satu arah adalah dengan menghitung rata-rata pengeluaran dari masing-masing kelompok:
- Rata-rata kelompok A: (520+530+540+550+560+570+580+590+600+610)/10 = 570
- Rata-rata kelompok B: (480+490+500+510+520+530+540+550+560+570)/10 = 520
- Rata-rata kelompok C: (580+590+600+610+620+630+640+650+660+670)/10 = 620
Selanjutnya, kita dapat menghitung nilai rata-rata total dari semua data:
Rata-rata total: (520+530+540+550+560+570+580+590+600+610+480+490+500+510+520+530+540+550+560+570+580+590+600+610+620+630+640+650+660+670)/30 = 570
Dari hasil perhitungan tersebut, dapat dilihat bahwa rata-rata pengeluaran total dari ketiga kelompok adalah sama, yaitu sebesar 570. Namun, untuk mengetahui apakah terdapat perbedaan signifikan antara rata-rata pengeluaran dari ketiga kelompok tersebut, kita perlu melakukan uji ANOVA.
Langkah selanjutnya dalam melakukan uji ANOVA adalah dengan menghitung:
- Variasi antara kelompok (between-group variation)
- Variasi dalam kelompok (within-group variation)
Variasi antara kelompok merupakan ukuran seberapa besar perbedaan rata-rata antara kelompok tersebut. Semakin besar perbedaan rata-rata, maka semakin besar juga variansi antara kelompok. Sedangkan, variasi dalam kelompok merupakan ukuran seberapa besar variasi data di dalam kelompok tersebut.
Untuk menghitung variasi antara kelompok, kita dapat menggunakan rumus:
$SS_between = \sum_i=1^k n_i (\barX_i – \barX)^2$
dimana:
- k = jumlah kelompok
- $n_i$ = jumlah data dalam kelompok ke-i
- $\barX_i$ = rata-rata data dalam kelompok ke-i
- $\barX$ = rata-rata dari semua data
Maka, dapat dihitung:
- SSbetween = 10(570-570)^2 + 10(520-570)^2 + 10(620-570)^2 = 60,000
Untuk menghitung variasi dalam kelompok, kita dapat menggunakan rumus:
$SS_within = \sum_i=1^k \sum_j=1^n_i (X_ij – \barX_i)^2$
dimana:
- k = jumlah kelompok
- $n_i$ = jumlah data dalam kelompok ke-i
- $X_ij$ = data ke-j dalam kelompok ke-i
- $\barX_i$ = rata-rata data dalam kelompok ke-i
Maka, dapat dihitung:
- SSwithin = (520-570)^2 + (530-570)^2 + (540-570)^2 + (550-570)^2 + (560-570)^2 + (570-570)^2 + (580-570)^2 + (590-570)^2 + (600-570)^2 + (610-570)^2 + (480-520)^2 + (490-520)^2 + (500-520)^2 + (510-520)^2 + (520-520)^2 + (530-520)^2 + (540-520)^2 + (550-520)^2 + (560-520)^2 + (570-520)^2 + (540-620)^2 + (550-620)^2 + (560-620)^2 + (570-620)^2 + (580-620)^2 + (590-620)^2 + (600-620)^2 + (610-620)^2 + (620-620)^2 + (630-620)^2 + (640-620)^2 + (650-620)^2 + (660-620)^2 + (670-620)^2 = 22,800
Selanjutnya, kita dapat menghitung derajat kebebasan antara kelompok (dfbetween) dan derajat kebebasan dalam kelompok (dfwithin):
- dfbetween = k-1 = 3-1 = 2
- dfwithin = N-k = 30-3 = 27
Kita dapat menggunakan nilai SSbetween dan SSwithin untuk menghitung variansi antara kelompok (MSbetween) dan variansi dalam kelompok (MSwithin):
- MSbetween = SSbetween/dfbetween = 60,000/2 = 30,000
- MSwithin = SSwithin/dfwithin = 22,800/27 = 844.44
Selanjutnya, kita dapat menghitung nilai statistik F dengan menggunakan rumus:
$F = \fracMS_betweenMS_within$
Maka, dapat dihitung:
- F = 30,000/844.44 = 35.51
Untuk mengetahui apakah perbedaan rata-rata tersebut signifikan atau tidak, kita perlu melihat nilai p-value dari uji F. P-value merupakan nilai yang menunjukkan probabilitas terjadinya perbedaan rata-rata antara kelompok yang diuji jika hipotesis nol (null hypothesis) benar.
Secara umum, jika p-value < alpha (tingkat signifikansi yang ditentukan), maka hipotesis nol ditolak dan terdapat perbedaan signifikan antara rata-rata pengeluaran dari ketiga kelompok yang diuji. Sebaliknya, jika p-value > alpha, maka hipotesis nol diterima dan tidak terdapat perbedaan signifikan.
Untuk uji ANOVA, tingkat signifikansi yang umum digunakan adalah alpha = 0.05. Maka, dapat ditemukan p-value dari uji F pada tabel distribusi F dengan derajat kebebasan antara kelompok (dfbetween) dan derajat kebebasan dalam kelompok (dfwithin) yang telah dihitung sebelumnya.
Berdasarkan tabel distribusi F, ditemukan bahwa p-value dari uji F sebesar kurang dari 0.001. Artinya, terdapat perbedaan signifikan antara rata-rata pengeluaran dari ketiga kelompok yang diuji.
Contoh Soal ANOVA Dua Arah
Selain ANOVA satu arah, terdapat juga ANOVA dua arah atau two-way ANOVA. Uji ini digunakan untuk mengetahui apakah terdapat interaksi antara dua faktor atau lebih pada suatu populasi.
Contoh kasus yang dapat diselesaikan menggunakan ANOVA dua arah adalah ketika kita ingin mengetahui apakah terdapat perbedaan pengaruh jenis pupuk dan jenis tanaman terhadap produksi padi di suatu daerah.
Misalkan kita melakukan uji ANOVA pada dua faktor, yaitu jenis pupuk (A, B, C) dan jenis tanaman (1, 2, 3). Data yang dikumpulkan adalah hasil produksi padi per hektar dari masing-masing kombinasi faktor, sebanyak 5 kali pengamatan. Berikut merupakan data yang diperoleh:
Jenis Tanaman | |||
---|---|---|---|
Jenis Pupuk | 1 | 2 | 3 |
A | 5.8 | 6.0 | 5.9 |
B | 5.7 | 6.2 | 5.8 |
C | 6.1 | 6.3 | 6.0 |
Langkah pertama yang dilakukan dalam uji ANOVA dua arah adalah dengan menghitung:
- Rata-rata dari masing-masing kombinasi faktor
- Rata-rata total dari semua data
Langkah selanjutnya adalah menghitung variasi antara kelompok (between-group variation) dan variasi dalam kelompok (within-group variation) dari masing-masing faktor:
Untuk faktor pupuk:
- Variasi antara kelompok: $SS_between, pupuk = n \sum_i=1^g (\barX_i. – \barX_..)^2$
- Variasi dalam kelompok: $SS_within, pupuk = \sum_i=1^g\sum_j=1^n (X_ij – \barX_i.)^2$
Untuk faktor tanaman:
- Variasi antara kelompok: $SS_between, tanaman = n \sum_i=1^h (\barX_.i – \barX_..)^2$
- Variasi dalam kelompok: $SS_within, tanaman = \sum_i=1^h\sum_j=1^n (X_ij – \barX_.i)^2$
dimana:
- n = jumlah pengamatan pada tiap kombinasi faktor (sejauh ini sama)
- g = jumlah kombinasi faktor pupuk
- h = jumlah kombinasi faktor tanaman
- $\barX_i.$ = rata-rata hasil pengamatan pada faktor pupuk ke-i
- $\barX_.i$ = rata-rata hasil pengamatan pada faktor tan