Senin, 19 Desember 2011

BAB 11 Analisis Data Katagorik (B)


BAB 11
Analisis Data Katagorik (B)

2. Keterkaitan Antara Dua Peubah Katagorik

Andaikan contoh berukuran n. Pada masing–masing pengamatan tersebut dicatat dua peubah kategorik P dan Q. Peubah P meliputi p macam nilai, yaitu P1,P2,P3,...,Pp, dan peubah Q mempunyai q macam nilai, yaitu Q1,Q2,Q3,...,Qq. Tabel kontingensi dua arah pxq menampilkan banyaknya pengamatan yang termasuk dalam silang peubah kategorik, nij (tabel 1).
Tabel 1. Tabel kontingensi dua arah p x q
P
Q
Total
Q1
Q2
...
Qq
P1
n11
n12
...
n1q
n1.
P2
n21
n22
...
n2q
n2.
...
...
...
...
...
...
Pp
np1
np2
...
npq
np.
Total
n.1
n.2
...
n.q
N

Apabila katagori P dan katagori Q saling bebas maka peluang suatu pengamatan termasuk pada sel PpQq, sebut saja πpq adalah :
Untuk pengamatan sebanyak n, peluang masing masing nilai katagori P dan Q adalah
Sehingga peluang bahwa suatu pengamatan termasuk pada suatu katagori P dan Q adalah
Selanjutnya, frekuensi harapan pada sel PpQq, yaitu banyaknya pengamatan yang termasuk pada sel PpQq seandainya P dan Q saling bebas, adalah :
Banyaknya pengamatan yang senyatanya diperoleh dari contoh, nij, selanjutnya dinamakan frekuensi pengamatan.

2.1 Uji Khi-kuadrat

Jika P dan Q saling bebas, nilai Khi-kuadrat untuk tabel kontingensi pxq untuk banyak pengamatan yang termasuk pada katagori silang P dan Q adalah :
Menyebar menurut sebaran khi-kuadrat berderajat bebas v = (p-1)(q-1). Dengan demikian, untuk uji dengan taraf nyata α atas hipotesis
H0: P dan Q saling bebas
H1: P dan Q tidak saling bebas
Adalah
“tolak H0 apabila x2 lebih dari atau sama dengan x2 α,(p-1)(q-1)”.
x2 α,(p-1)(q-1) adalah angka khi-kuadrat berderajat bebas v = (p-1)(q-1) sedemikian sehingga
P (x2 > x2 α,(p-1)(q-1)) = α
Uji Khi-kuadrat ini dikenal pula sebagai uji kebaikan pengepasan (goodness of fit test). Perhatikan bahwa statistik uji untuk uji ini menghitung jumlah kuadrat selisih antara frekuensi harapan dengan frekuensi pengamatan; jika frekuensi pengamatan dan frekuensi harapan pada setiap sel pada tabel kontingensi tersebut akan bernilai sama sehingga nilai untuk tabel tersebut adalah nol. Nilai x2 yang kecil menunjukan kesesuaian yang tinggi antara frekuensi pengamatan dengan frekuensi harapan, dan semakin besar nilai x2 menunjukan ketaksesuaian antara frekuensi pengamatan dengan frekuensi harapan, yang berarti tertolaknyya H0.

Contoh 1
Tabel berikut menyajikan tabel kontingensi antara kebiasaan merokok pada malam hari dan kejadian serangan kanker paruu-paru dari 56 orang perokok berat. Dihipotesiskan bahwa serangan kanker paru-paru berkaitan dengan kebiasaan merokok pada malam hari.
Kanker paru –paru
Kebiasaan merokok malam hari
Total
ya
Tidak
Ya
20
16
36
Tidak
6
14
20
Total
26
30
56

Berdasarkan data tersebut, apakah hipotesis tersebut dapat diterima?
Jawab :
Tabel berikut menyajikan frekuensi harapan katagori kebiasaan merokok malam dan serangan kanker paru-paru apabila keduanya saling bebas.
Merokok malam hari
Mengalami kanker paru-paru
Total
Ya
Tidak
Ya
16.7143
19.2857
36
Tidak
9.2857
10.7143
20
Total
26
30
56
Dengan demikian
  = 3.376
X20.05,1 = 3.841 (tabel chi-kuadrat)
Karena X2 tidak lebih besar dari X20.05,1, maka keputusan ujinya adalah “tidak tolak H0”. Berdasarkan uji ini, belum dapat disimpulkan mengenai adanya keterkaitan antara kebiasaan-kebiasaan merokok pada malam hari dengan serangan kanker paru-paru.

2.2 Tabel Kontingensi 2x2

Peubah katagorik yang hanya meliputi dua kategori dinamakan peubah biner, misalnya terserangnya kanker paru-paru seperti pada contoh 1 (terserang atau tidak), hasil dari suatu tindakan (berhasil atau tidak). Sehubungan dengan peubah biner ini seringkali diperbandingkan antara beberapa kelompok individu; pada contoh 1 misalnya, ingin dibandingkan antara proporsi serangan kanker pada kelompok yang memiliki kebiasaan merokok malam dan yang tidak memiliki kebiasaan tersebut. Jika ada 2 kelompok, sebaran nilai peubah biner ini dapat disajikan pada suatu tabel kontingensi 2x2. Nilai peubah biner dapat dinyatakan sebagai 1 untuk nilai kategori yang satu, dan 2 untuk nilai katagori yang lainnya; misalnya 1 untuk terserang dan 2 untuk tidak terserang, 1 untuk berhasil dan 2 untuk tidak berhasil tabel 2.
Tabel 2.  Tabel 2x2
P
Q
Total
1
2
1
a = n11
b = n12
a + b = n1.
2
c = n21
d = n22
c + d = n2.
Total
a + c = n.1
b + d = n.2
a + b + c + d = N

Untuk tabel kontingensi 2x2, statistik uji x2 dapat dihitung dengan persamaan
Contoh 2
Nilai statistik uji untuk tabel  kontingensi 2x2 pada contoh 1 dapat dihitung dengan persamaan yang lebih sederhana:

2.3 Nilai Q-Yule

Untuk tabel kontingensi 2x2, nilai Q menunjukkan kuatnya keterkaitan. Nilai Q ini dikenal juga sebagai nilai Q-Yule, diajukan oleh Yule (1900; dalam Daniel,1990).
Nilai Q-Yule merentang dari -1 sampai +1, dengan 0 berarti antara kedua katagori saling bebas. Nilai Q-Yule yang semakin dekat dengan -1 atau +1 menunjukkan keterkaitan yang semakin kuat.
Contoh 3
Nilai Q-Yule untuk tabel kontingensi 2x2 pada contoh 1:

2.4 Angka Odds

Untuk individu-individu yang berada pada baris i, nyatakan π1|j sebagai peluang bahwa individu tersebut terkatagori 1, dan (π1|j , π2|j) = (π1|j, 1 - π1|j) sebagai sebaran peluang bersyarat peubah biner tersebut. Pembandingan antara kedua baris, baris 1 dengan baris 2, dapat dinyatakan sebagai selisih proporsi katagori 1, π1|j - π2|j. Pembandingan proporsi katagori 2 adalah ekivalen, yaitu
Selisih proporsi ini nilainya akan berkisar antara -1 dan +1, bernilai 0 jika baris 1 dan baris 2 identik. Peubah katagorik tersebut dikatakan bebas sehubungan dengan pengelompokan menurut baris jika π1|j - π2|j = 0.
Rasio odds. Odds adalah ukuran yang menunjukkan perbandingan peluang munculnya suatu kejadian dengan peluang tidak munculnya kejadian tersebut. Odds suatu kejadian A misalnya dihitung dengan membagi peluang kejadian A dengan peluang kejadian bukan A.
Untuk tabel kontingensi 2x2, Odds katagori 1 pada baris 1 dan baris 2 masing-masing dihitung sebagai
Apabila kedua katagori, baris dan kolom, berupa peubah acak, odds kategori 1 pada baris 1 dan baris 2 masing masing adalah
Selanjutnya, rasio antara odds Ω1 dan odds Ω2,
dinamakan rasio odds.
Nilai rasio odds berkisar antara 0 dan ∞. Apabila katagori baris dan katagori kolom saling bebas, maka nilai rasio odds adalah 1. Apabila nilai rasio odds lebih dari 1, 1< θ < ∞., berarti individu-individu pada baris pertama lebih besar kemungkinannya bernilai katagori 1 dari pada baris kedua; yaitu π1|1 > π1|2. Apabila rasio odds kurang dari 1, 0 < θ < 1, berarti individu-individu pada baris pertama lebih kecil kemungkinannya bernilai katagori 1 daripada individu-individu pada baris kedua; yaitu π1|1 < π1|2. Rasio odds tidak berubah apabila baris dan kolom tabel kontingensi dipertukarkan.
Semakin jauh nilai rasio odds, θ, dari angka 1 pada arah tertentu berarti keterkaitan antara katagori baris dan kolom semakin kuat. Dua nilai rasio odds, θ1 dan θ2, menunjukkan tingkat keterkaitan yang sama apabila nilai yang satu merupakan kebalikan dari nilai kedua, θ1 = 1/ θ2; θ1 = 0.25 dan θ2 = 4.0 misalnya menunjukkan tingkat keterkaitan yang sama. Jika urutan baris atau urutan kolom dipertukarkan, nilai rasio odds yang baru akan sama dengan seper nilai rasio odds yang lama. Jika diambil nilai logaritma dari rasio odds, ln(θ), logaritma rasio odds untuk dua rasio odds yang memiliki tingkat keterkaitan yang sama ini memiliki angka yang sama hanya berbeda tanda; ln(0.25) =  -1.39, ln(4) = 1.39. ln(1) = 0 menunjukkan kebebasan antara katagori baris dan katagori kolom.
Untuk frekuensi contoh, statistik rasio odds dihitung sebagai . Rasio odds contoh ini tidak berubah apabila kedua sel dalam baris dikalikan dengan suatu bilangan tidak nol. Demikian pula apabila kedua sel dalam kolom dikalikan dengan bilangan tak nol. Hal ini menunjukkan sifat invarian atas perkalian, sehinggga rasio odds contoh tetap merupakan penduga bagi parameter θ meskipun contoh yang digunakan tidak proporsional. Untuk percontohan retrospektif untuk keterkaitan antara aplikasi vaksin dengan keterserangan penyakit misalnya, rasio odds tetap merupakan penduga bagi θ, meskipun misalnya untuk keperluan tersebut dipilih masing-masing 100 orang yang mendapat serangan dan tidak mendapat serangan untuk kemudian ditetapkan memakai atau tidak memakai vaksin, atau dipilih 150 pengamatan untuk terserang dan 50 untuk yang tidak terserang. Selanjutnya, rasio odds sama baiknya, baik percontohannya retrospektif, atau prospektif, yaitu dengan memilih 100 yang menggunakan vaksin dan 100 yang tidak menggunakan untuk kemudian diperiksa apakah terserang atau tidak terserang, atau kros seksi, yaitu dengan memilih 200 orang yang kemudian diperiksa apakah ia menggunakan vaksin dan apakah ia terserang penyakit.

Contoh 3
Untuk tabel kontingensi pada contoh 1, odds baris 1, odds baris 2,dan rasio odds baris 1 pada odds baris 2 masing-masing adalah :
Ω1 = 1.25 menunjukkan bahwa pada kelompok yang merokok malam hari, peluang terserang kanker paru-paru adalah 1.25 kali peluang tidak terserang. Ω2= 0.43 menunjukkan bahwa kelompok yang tidak merokok dimalam hari, peluang terserang kanker paru-paru adalah 0.43 kali peluang tidak terserang.
Dengan nilai rasio odds θ = Ω1/ Ω2  lebih dari 1, menunjukkan bahwa individu-individu yang biasa merokok malam hari lebih besar kemungkinannya bernilai terserang kanker paru-paru daripada individu-individu  yang tidak biasa merokok malam hari.
ln θ = ln (2.92) = 1.072.

 DAFTAR PUSTAKA

Harinaldi. 2005. Prinsip-prinsip Statistik untuk Teknik dan Sains. Jakarta: Erlangga.
Martiningtyas, Nining. 2011. Teori, Soal dan Pembahasan Statistika. Jakarta : Prestasi Pustakaraya
Nugroho, Sigit. 2007. Dasar-Dasar Metode Statistika. Bengkulu: Grasindo
Saefudin, Asep. 2009. Statistika Dasar. Bogor: Grasindo.
Supranto, J. 2008. Statistik: Teori dan Aplikasi Edisi Ketujuh. Jakarta: Erlangga.