BAB 11
Analisis
Data Katagorik (B)
2. Keterkaitan Antara Dua Peubah Katagorik
Andaikan
contoh berukuran n. Pada masing–masing pengamatan tersebut dicatat dua peubah
kategorik P dan Q. Peubah P meliputi p
macam nilai, yaitu P1,P2,P3,...,Pp,
dan peubah Q mempunyai q macam nilai, yaitu Q1,Q2,Q3,...,Qq.
Tabel kontingensi dua arah pxq
menampilkan banyaknya pengamatan yang termasuk dalam silang peubah kategorik, nij
(tabel 1).
Tabel
1. Tabel kontingensi dua arah p x q
P
|
Q
|
Total
|
|||
Q1
|
Q2
|
...
|
Qq
|
||
P1
|
n11
|
n12
|
...
|
n1q
|
n1.
|
P2
|
n21
|
n22
|
...
|
n2q
|
n2.
|
...
|
...
|
...
|
...
|
...
|
...
|
Pp
|
np1
|
np2
|
...
|
npq
|
np.
|
Total
|
n.1
|
n.2
|
...
|
n.q
|
N
|
Apabila
katagori P dan katagori Q saling bebas maka peluang suatu pengamatan termasuk
pada sel PpQq, sebut saja πpq adalah :
Untuk
pengamatan sebanyak n, peluang masing masing nilai katagori P dan Q adalah
Sehingga
peluang bahwa suatu pengamatan termasuk pada suatu katagori P dan Q adalah
Selanjutnya, frekuensi harapan pada sel
PpQq, yaitu banyaknya pengamatan yang termasuk pada sel PpQq
seandainya P dan Q saling bebas, adalah :
Banyaknya
pengamatan yang senyatanya diperoleh dari contoh, nij, selanjutnya
dinamakan frekuensi pengamatan.
2.1 Uji Khi-kuadrat
Jika
P dan Q saling bebas, nilai Khi-kuadrat untuk tabel kontingensi pxq untuk banyak pengamatan yang
termasuk pada katagori silang P dan Q adalah :
Menyebar
menurut sebaran khi-kuadrat berderajat bebas v = (p-1)(q-1). Dengan demikian,
untuk uji dengan taraf nyata α atas hipotesis
H0:
P dan Q saling bebas
H1:
P dan Q tidak saling bebas
Adalah
“tolak
H0 apabila x2 lebih dari atau sama dengan x2 α,(p-1)(q-1)”.
x2
α,(p-1)(q-1) adalah angka khi-kuadrat berderajat bebas v =
(p-1)(q-1) sedemikian sehingga
P
(x2 > x2 α,(p-1)(q-1)) = α
Uji
Khi-kuadrat ini dikenal pula sebagai uji kebaikan pengepasan (goodness of fit test). Perhatikan bahwa
statistik uji untuk uji ini menghitung jumlah kuadrat selisih antara frekuensi
harapan dengan frekuensi pengamatan; jika frekuensi pengamatan dan frekuensi
harapan pada setiap sel pada tabel kontingensi tersebut akan bernilai sama
sehingga nilai untuk tabel tersebut adalah nol. Nilai x2 yang kecil
menunjukan kesesuaian yang tinggi antara frekuensi pengamatan dengan frekuensi
harapan, dan semakin besar nilai x2 menunjukan ketaksesuaian antara
frekuensi pengamatan dengan frekuensi harapan, yang berarti tertolaknyya H0.
Contoh 1
Tabel berikut menyajikan tabel
kontingensi antara kebiasaan merokok pada malam hari dan kejadian serangan
kanker paruu-paru dari 56 orang perokok berat. Dihipotesiskan bahwa serangan
kanker paru-paru berkaitan dengan kebiasaan merokok pada malam hari.
Kanker paru –paru
|
Kebiasaan merokok
malam hari
|
Total
|
|
ya
|
Tidak
|
||
Ya
|
20
|
16
|
36
|
Tidak
|
6
|
14
|
20
|
Total
|
26
|
30
|
56
|
Berdasarkan
data tersebut, apakah hipotesis tersebut dapat diterima?
Jawab :
Tabel
berikut menyajikan frekuensi harapan katagori kebiasaan merokok malam dan
serangan kanker paru-paru apabila keduanya saling bebas.
Merokok malam hari
|
Mengalami kanker paru-paru
|
Total
|
|
Ya
|
Tidak
|
||
Ya
|
16.7143
|
19.2857
|
36
|
Tidak
|
9.2857
|
10.7143
|
20
|
Total
|
26
|
30
|
56
|
Dengan
demikian
= 3.376
X20.05,1
=
3.841 (tabel chi-kuadrat)
Karena
X2 tidak lebih besar dari X20.05,1, maka
keputusan ujinya adalah “tidak tolak H0”. Berdasarkan uji ini, belum dapat
disimpulkan mengenai adanya keterkaitan antara kebiasaan-kebiasaan merokok pada
malam hari dengan serangan kanker paru-paru.
2.2 Tabel Kontingensi 2x2
Peubah
katagorik yang hanya meliputi dua kategori dinamakan peubah biner, misalnya
terserangnya kanker paru-paru seperti pada contoh 1 (terserang atau tidak),
hasil dari suatu tindakan (berhasil atau tidak). Sehubungan dengan peubah biner
ini seringkali diperbandingkan antara beberapa kelompok individu; pada contoh 1
misalnya, ingin dibandingkan antara proporsi serangan kanker pada kelompok yang
memiliki kebiasaan merokok malam dan yang tidak memiliki kebiasaan tersebut.
Jika ada 2 kelompok, sebaran nilai peubah biner ini dapat disajikan pada suatu
tabel kontingensi 2x2. Nilai peubah biner dapat dinyatakan sebagai 1 untuk
nilai kategori yang satu, dan 2 untuk nilai katagori yang lainnya; misalnya 1
untuk terserang dan 2 untuk tidak terserang, 1 untuk berhasil dan 2 untuk tidak
berhasil tabel 2.
Tabel
2. Tabel 2x2
P
|
Q
|
Total
|
|
1
|
2
|
||
1
|
a = n11
|
b = n12
|
a + b = n1.
|
2
|
c = n21
|
d = n22
|
c + d = n2.
|
Total
|
a + c = n.1
|
b + d = n.2
|
a + b + c + d = N
|
Untuk
tabel kontingensi 2x2, statistik uji x2 dapat dihitung dengan
persamaan
Contoh 2
Nilai statistik uji untuk tabel kontingensi 2x2 pada contoh 1 dapat dihitung
dengan persamaan yang lebih sederhana:
2.3 Nilai Q-Yule
Untuk
tabel kontingensi 2x2, nilai Q menunjukkan kuatnya keterkaitan. Nilai Q ini
dikenal juga sebagai nilai Q-Yule, diajukan oleh Yule (1900; dalam
Daniel,1990).
Nilai
Q-Yule merentang dari -1 sampai +1, dengan 0 berarti antara kedua katagori
saling bebas. Nilai Q-Yule yang semakin dekat dengan -1 atau +1 menunjukkan
keterkaitan yang semakin kuat.
Contoh 3
Nilai
Q-Yule untuk tabel kontingensi 2x2 pada contoh 1:
2.4 Angka Odds
Untuk
individu-individu yang berada pada baris i, nyatakan π1|j sebagai
peluang bahwa individu tersebut terkatagori 1, dan (π1|j , π2|j)
= (π1|j, 1 - π1|j) sebagai sebaran peluang bersyarat
peubah biner tersebut. Pembandingan antara kedua baris, baris 1 dengan baris 2,
dapat dinyatakan sebagai selisih proporsi katagori 1, π1|j - π2|j.
Pembandingan proporsi katagori 2 adalah ekivalen, yaitu
Selisih proporsi ini
nilainya akan berkisar antara -1 dan +1, bernilai 0 jika baris 1 dan baris 2
identik. Peubah katagorik tersebut dikatakan bebas sehubungan dengan
pengelompokan menurut baris jika π1|j - π2|j
= 0.
Rasio odds.
Odds adalah ukuran yang menunjukkan perbandingan peluang munculnya suatu
kejadian dengan peluang tidak munculnya kejadian tersebut. Odds suatu kejadian
A misalnya dihitung dengan membagi peluang kejadian A dengan peluang kejadian
bukan A.
Untuk
tabel kontingensi 2x2, Odds katagori 1 pada baris 1 dan baris 2 masing-masing
dihitung sebagai
Apabila
kedua katagori, baris dan kolom, berupa peubah acak, odds kategori 1 pada baris
1 dan baris 2 masing masing adalah
Selanjutnya,
rasio antara odds Ω1 dan odds Ω2,
dinamakan
rasio odds.
Nilai rasio odds
berkisar antara 0 dan ∞. Apabila katagori baris dan katagori kolom saling
bebas, maka nilai rasio odds adalah 1. Apabila nilai rasio odds lebih dari 1,
1< θ < ∞., berarti individu-individu pada baris pertama lebih besar
kemungkinannya bernilai katagori 1 dari pada baris kedua; yaitu π1|1
> π1|2. Apabila rasio odds kurang dari 1, 0 < θ < 1,
berarti individu-individu pada baris pertama lebih kecil kemungkinannya bernilai
katagori 1 daripada individu-individu pada baris kedua; yaitu π1|1 <
π1|2. Rasio odds tidak berubah apabila baris dan kolom tabel
kontingensi dipertukarkan.
Semakin jauh nilai
rasio odds, θ, dari angka 1 pada arah tertentu berarti keterkaitan antara
katagori baris dan kolom semakin kuat. Dua nilai rasio odds, θ1 dan
θ2, menunjukkan tingkat keterkaitan yang sama
apabila nilai yang satu merupakan kebalikan dari nilai kedua, θ1
= 1/ θ2; θ1 = 0.25 dan θ2
= 4.0 misalnya menunjukkan tingkat keterkaitan yang sama. Jika urutan
baris atau urutan kolom dipertukarkan, nilai rasio odds yang baru akan sama
dengan seper nilai rasio odds yang lama. Jika diambil nilai logaritma dari
rasio odds, ln(θ), logaritma rasio odds untuk dua rasio odds yang memiliki
tingkat keterkaitan yang sama ini memiliki angka yang sama hanya berbeda tanda;
ln(0.25) = -1.39, ln(4) = 1.39. ln(1) =
0 menunjukkan kebebasan antara katagori baris dan katagori kolom.
Untuk
frekuensi contoh, statistik rasio odds dihitung sebagai
. Rasio odds contoh ini tidak berubah
apabila kedua sel dalam baris dikalikan dengan suatu bilangan tidak nol.
Demikian pula apabila kedua sel dalam kolom dikalikan dengan bilangan tak nol.
Hal ini menunjukkan sifat invarian atas perkalian, sehinggga rasio odds contoh
tetap merupakan penduga bagi parameter θ meskipun contoh yang digunakan tidak
proporsional. Untuk percontohan retrospektif untuk keterkaitan antara aplikasi
vaksin dengan keterserangan penyakit misalnya, rasio odds tetap merupakan
penduga bagi θ, meskipun misalnya untuk keperluan tersebut dipilih
masing-masing 100 orang yang mendapat serangan dan tidak mendapat serangan
untuk kemudian ditetapkan memakai atau tidak memakai vaksin, atau dipilih 150
pengamatan untuk terserang dan 50 untuk yang tidak terserang. Selanjutnya,
rasio odds sama baiknya, baik percontohannya retrospektif, atau prospektif, yaitu
dengan memilih 100 yang menggunakan vaksin dan 100 yang tidak menggunakan untuk
kemudian diperiksa apakah terserang atau tidak terserang, atau kros seksi,
yaitu dengan memilih 200 orang yang kemudian diperiksa apakah ia menggunakan
vaksin dan apakah ia terserang penyakit.
Contoh 3
Untuk
tabel kontingensi pada contoh 1, odds baris 1, odds baris 2,dan rasio odds
baris 1 pada odds baris 2 masing-masing adalah :
Ω1
= 1.25 menunjukkan bahwa pada kelompok yang merokok malam hari, peluang
terserang kanker paru-paru adalah 1.25 kali peluang tidak terserang. Ω2=
0.43 menunjukkan bahwa kelompok yang tidak merokok dimalam hari, peluang
terserang kanker paru-paru adalah 0.43 kali peluang tidak terserang.
Dengan
nilai rasio odds θ = Ω1/ Ω2
lebih dari 1, menunjukkan bahwa individu-individu yang biasa
merokok malam hari lebih besar kemungkinannya bernilai terserang kanker
paru-paru daripada individu-individu
yang tidak biasa merokok malam hari.
ln
θ = ln (2.92) = 1.072.
Harinaldi. 2005. Prinsip-prinsip Statistik untuk Teknik dan
Sains. Jakarta: Erlangga.
Martiningtyas,
Nining. 2011. Teori, Soal dan Pembahasan
Statistika. Jakarta : Prestasi Pustakaraya
Nugroho, Sigit. 2007. Dasar-Dasar Metode Statistika. Bengkulu:
Grasindo
Saefudin, Asep. 2009. Statistika Dasar. Bogor: Grasindo.
Supranto, J. 2008. Statistik: Teori dan Aplikasi Edisi Ketujuh.
Jakarta: Erlangga.