Sabtu, 19 Oktober 2013

Bagian II : Statistika Deskriptif II (Pengukuran Penyimpangan / range-deviasi-varians)


Pengukuran Penyimpangan


Pengukuran penyimpangan adalah suatu ukuran yang menunjukkan tinggi  rendahnya perbedaan data yang diperoleh dari rata-ratanya. Ukuran penyimpangan digunakan untuk mengetahui luas penyimpangan data atau homogenitas data. Dua variabel data yang memiliki mean sama belum tentu memiliki kualitas yang sama, tergantung dari besar atau kecil ukuran penyebaran datanya. Ada bebarapa macam ukuran penyebaran data, namun yang umum digunakan adalah standar deviasi.

Ukuran penyebaran (Measures of Dispersion) atau ukuran keragaman pengamatan dari nilai rata-ratanya disebut simpangan (deviation/dispersi). Terdapat beberapa ukuran untuk menentukan dispersi data pengamatan, seperti jangkauan/rentang (range), simpangan kuartil (quartile deviation), simpangan rata-rata (mean deviation), dan simpangan baku (standard deviation).



1. Jangkauan (range)
Range adalah salah satu ukuran statistik yang menunjukan jarak penyebaran data antara nilai terendah (Xmin) dengan nilai tertinggi (Xmax). Ukuran ini sudah digunakan pada pembahasan daftar distribusi frekuensi. Adapun rumusnya adalah

1

3

Contoh : 
Berikut ini nilai ujian semester dari 3 mahasiswa
A = 60 55 70 65 50 80 40
B = 50 55 60 65 70 65 55
C = 60 60 60 60 60 60 60
Dari data diatas dapat diketahui bahwa
A = memiliki Xmax=80, Xmin= 40 , R = 40 , meanya 60
B = memiliki Xmax=70, Xmin= 50 , R = 20 , meanya 60
C = memiliki Xmax=60, Xmin= 60 , R = 0 , meanya 60
Dari contoh di atas dapat disimpulkan bahwa :
a. Semakin kecil rangenya maka semakin homogen distribusinya
b. Semakin besar rangenya maka semakin heterogen distribusinya
c. Semakin kecil rangenya, maka meannya merupakan wakil yang representatif
d. Semakin besar rangenya maka meannya semakin kurang representatif

 
2.  Simpangan kuartil (Quartile Deviation)
Simpangan kuartil dihitung dengan cara menghapus nilai-nilai yang terletak di bawah kuartil pertama dan nilai-nilai di atas kuartil ketiga, sehingga nilai-nilai ekstrem, baik yang berada di bawah ataupun di atas distribusi data, dihilangkan.
Simpangan kuartil didapatkan dengan cara menghitung nilai rata-rata dari kedua kuartil tersebut, Q1 dan Q3.

  \dfrac{\left(Q_3-Q_2\right)+(Q_2-Q_1)}{2}=\dfrac{(Q_3-Q_1)}{2}

Simpangan kuartil lebih stabil dibandingkan dengan Range karena tidak dipengaruhi oleh nilai ekstrem. Nilai-nilai ekstrim sudah dihapus. Meskipun demikian, sama seperti Range, simpangan kuartil juga tetap tidak memperhatikan dan memperhitungkan penyimpangan semua gugus datanya. Simpangan kuartil hanya memperhitungkan nilai pada kuartil pertama dan kuartil ketiga saja.

contoh : 
Berikut ini adalah nilai Quiz ke-1 dan ke-2 Matakuliah Statistik.
Quiz ke-1: 1 20 20 20 20 20 20 20 20 20 20
Quiz ke-2: 2 3 4 5 6 14 15 16 17 18 19   
 Tentukan nilai simpangan kuartil

jawab : 
Untuk menentukan nilai kuartil, terlebih dahulu sampel data harus diurutkan. Kebetulan pada contoh ini, data sudah terurut.
Selanjutnya tentukan letak dari kuartil tersebut dan terakhir tentukan nilai kuartilnya.


1 2 3 4 5 6 7 8 9 10 11
Quiz 1: 1 20 20 20 20 20 20 20 20 20 20
Quiz 2: 2 3 4 5 6 14 15 16 17 18 19
n = 11


 Letak\ Q_i=\dfrac{i}{4}(n+1)

Quiz 1:

Letak Q1 = ¼(11+1) = 3 sehingga nilai Q1 adalah data yang terletak pada urutan ke-3, yaitu 20
Letak Q3 = ¾(11+1) = 9 sehingga nilai Q1 adalah data yang terletak pada urutan ke-9, yaitu 20
 simpangan\ kuartil=\dfrac{(Q_3-Q_1)}{2}=\dfrac{(20-20)}{2}=0

Quiz 2:

Letak Q1 = ¼(11+1) = 3 sehingga nilai Q1 adalah data yang terletak pada urutan ke-3, yaitu 5
Letak Q3 = ¾(11+1) = 9 sehingga nilai Q1 adalah data yang terletak pada urutan ke-3, yaitu 17
 simpangan\ kuartil=\dfrac{(Q_3-Q_1)}{2}=\dfrac{(17-5)}{2}=6

Kesimpulan:

Berdasarkan simpangan kuartil, Quiz ke-2 lebih bervariasi dibandingkan dengan Quiz ke-1. (kesimpulannya berbeda dengan kesimpulan berdasarkan range)


3. Simpangan Rata-rata (Mean Deviation)
Simpangan rata-rata merupakan penyimpangan nilai-nilai individu dari nilai rata-ratanya. Rata-rata bisa berupa mean atau median. Untuk data mentah simpangan rata-rata dari median cukup kecil sehingga simpangan ini dianggap paling sesuai untuk data mentah. Namun pada umumnya, simpangan rata-rata yang dihitung dari mean yang sering digunakan untuk nilai simpangan rata-rata. Simpangan rata-rata dihitung dengan formula berikut:
 
 Simpangan\ rata-rata=\dfrac{\Sigma (x_i-\overline{x})}{n}

Formula tersebut tentu memenuhi dua kriteria sebelumnya, dihitung dari semua data dan menunjukkan dispersi rata-rata dari mean, tetapi tidak memenuhi kriteria ketiga. Bagaimanapun dispersi dari data, semua perhitungan dengan rumus ini akan selalu menghasilkan nilai nol. Hal ini karena pembilang dari rumus di atas  \Sigma (x_i-x) menunjukkan bahwa hasil penjumlahannya akan selalu sama dengan nol.
Terdapat dua cara untuk mengantisipasi masalah ini, keduanya akan menghilangkan tanda-tanda negatif dari perhitungan.
Cara pertama adalah dengan menggunakan formula berikut:
Sampel:
 Simpangan\ rata-rata=\dfrac{\Sigma |x_i-\overline{x}|}{n}

Populasi:
 Simpangan\ rata-rata=\dfrac{\Sigma |x_i-\mu |}{N}


Untuk data yang sudah disusun dalam bentuk tabel frekuensi:
Data Tunggal (tidak di grupkan berdasarkan selang kelas):

 Simpangan\ rata-rata=\dfrac{\sum^{{\rm k}}_{{\rm  i=1}}{f_i|x_i-\overline{x}|}}{\Sigma f_i}=\dfrac{\sum^{{\rm k}}_{{\rm  i=1}}{f_i|x_i-\overline{x}|}}{n}

Data kelompok (sudah digrupkan berdasarkan selang tertentu):
Simpangan rata-rata yang dihitung dari distribusi frekuensi data yang dikelompokkan menggunakan nilai data perkiraan, bukan data aslinya. Data pewakil tersebut disimbolkan dengan m. Untuk membuat perhitungan dari data yang sudah dikelompokkan kita harus menganggap, bahwa semua nilai dalam sebuah kelas, sama dengan nilai pewakilnya (tanda kelasnya, mi). Selanjutnya, nilai perkiraan simpangan rata-rata dapat dihitung dengan menggunakan rumus:

 Simpangan\ rata-rata\approx \dfrac{\sum^{{\rm k}}_{{\rm  i=1}}{f_i|m_i-\overline{x}|}}{\Sigma f_i}=\dfrac{\sum^{{\rm k}}_{{\rm  i=1}}{f_i|m_i-\overline{x}|}}{n}

Pada formula di atas, pembilangnya akan selalu bernilai positif, karena yang diambil adalah nilai mutlaknya, perhatikan tanda modulus || yang berarti baik hasilnya negatif ataupun positif akan selalu diperlakukan sebagai data positif.
Cara kedua adalah dengan menggunakan jumlah kuadrat dari semua nilai simpangan datanya. Cara ini dikenal dengan istilah Ragam (varians) dan standar deviasi.

contoh :
Berikut ini adalah nilai Quiz ke-1 dan ke-2 Matakuliah Statistik.
Quiz ke-1: 1 20 20 20 20 20 20 20 20 20 20
Quiz ke-2: 2 3 4 5 6 14 15 16 17 18 19 
Tentukan nilai simpangan rata-rata 

jawab :
Quiz I: rata-rata =18.27
Quiz 2: rata-rata = 10.82

No Quiz 1 (xi)
 x_i-\overline{x}  \left|x_i-\overline{x}\right|
Quiz 2
(xi)
 x_i-\overline{x}  \left|x_i-\overline{x}\right|
1 1 -17.27 17.27
2 -8.82 8.82
2 20 1.73 1.73
3 -7.82 7.82
3 20 1.73 1.73
4 -6.82 6.82
4 20 1.73 1.73
5 -5.82 5.82
5 20 1.73 1.73
6 -4.82 4.82
6 20 1.73 1.73
14 3.18 3.18
7 20 1.73 1.73
15 4.18 4.18
8 20 1.73 1.73
16 5.18 5.18
9 20 1.73 1.73
17 6.18 6.18
10 20 1.73 1.73
18 7.18 7.18
11 20 1.73 1.73
19 8.18 8.18


Jumlah 34.55

Jumlah 68.18

Quiz 1:

  Simpangan\ rata-rata=\dfrac{\Sigma  |x_i-\overline{x}|}{n}=\dfrac{34.55}{11}=3.141


Quiz 2:


  Simpangan\ rata-rata=\dfrac{\Sigma  |x_i-\overline{x}|}{n}=\dfrac{68.18}{11}=6.198

Kesimpulan:

Berdasarkan simpangan rata-rata, Quiz ke-2 lebih bervariasi dibandingkan dengan Quiz ke-1. (kesimpulannya berbeda dengan kesimpulan berdasarkan range)

Catatan:
Untuk menentukan simpangan rata-rata dari tabel frekuensi, caranya mirip dengan contoh 7 dan 8.

Contoh Tambahan:
Dengan cara yang sama seperti di atas, nilai simpangan rata-rata untuk ketiga varietas:
Varietas I = 1.2
Varietas II = 7.2
Varietas III = 2

3. Ragam dan Standar deviasi
Standar deviasi merupakan ukuran penyebaran yang paling banyak digunakan. Semua gugus data dipertimbangkan sehingga lebih stabil dibandingkan dengan ukuran lainnya. Namun, apabila dalam gugus data tersebut terdapat nilai ekstrem, standar deviasi menjadi tidak sensitif lagi, sama halnya seperti mean.
Standar Deviasi memiliki beberapa karakteristik khusus lainnya. SD tidak berubah apabila setiap unsur pada gugus datanya di tambahkan atau dikurangkan dengan nilai konstan tertentu. SD berubah apabila setiap unsur pada gugus datanya dikali/dibagi dengan nilai konstan tertentu. Bila dikalikan dengan nilai konstan, standar deviasi yang dihasilkan akan setara dengan hasilkali dari nilai standar deviasi aktual dengan konstan.
Secara matematis, standar deviasi dapat dihitung dengan menggunakan formula:

 \sigma =\sqrt{\dfrac{\Sigma {\left(x_i-\mu \right)}^2}{N}}\  atau\ \sqrt{\dfrac{\Sigma x^2_i-\dfrac{{\left(\Sigma  x_i\right)}^2}{N}}{N}}\
 
Standar deviasi populasi disimbolkan dengan sigma dan standar deviasi sampel disimbolkan dengan s. Standar deviasi sampel yang baik seharusnya merupakan ukuran yang tidak bias terhadap standar deviasi populasinya, karena kita menggunakan ukuran standar deviasi sampel untuk memperkirakan nilai standar deviasi populasi. Untuk itu, nilai n pada formula di atas diganti dengan n - 1 sehingga formula untuk standar deviasi sampel adalah sebagai berikut:

 s=\sqrt{\dfrac{\Sigma  {\left(x_i-\overline{x}\right)}^2}{n-1}}\ {\rm atau}\  \sqrt{\dfrac{\Sigma x^2_i-\dfrac{{\left(\Sigma x_i\right)}^2}{n}}{n-1}}\

Data pada tabel distribusi frekuensi:
Data Tunggal:
  s=\sqrt{\dfrac{\sum^k_{i=1}{{f_i\left(x_i-\overline{x}\right)}^2}}{n-1}}\  {\rm atau}\ s=\sqrt{\dfrac{\Sigma {f_ix}^2_i-\dfrac{{\left(\Sigma  f_ix_i\right)}^2}{n}}{n-1}}\

 \ {\rm atau}\ s=\sqrt{\dfrac{n\Sigma {f_ix}^2_i-{\left(\Sigma  f_ix_i\right)}^2}{n(n-1)}}

Data kelompok (sudah digrupkan berdasarkan selang tertentu):
Sama seperti pada perhitungan simpangan rata-rata. Standar deviasi dan ragam yang dihitung dari distribusi frekuensi data yang sudah dikelompokkan menggunakan nilai data perkiraan, bukan data aslinya. Data pewakil tersebut disimbolkan dengan m. Untuk membuat perhitungan dari data yang sudah dikelompokkan kita harus menganggap, bahwa semua nilai dalam sebuah kelas, sama dengan nilai pewakilnya (tanda kelasnya, mi). Selanjutnya, nilai perkiraan standar deviasi dapat dihitung dengan menggunakan rumus:

  s=\sqrt{\dfrac{\sum^k_{i=1}{{f_i\left(m_i-\overline{x}\right)}^2}}{n-1}}\  {\rm atau}\ s=\sqrt{\dfrac{\Sigma {f_im}^2_i-\dfrac{{\left(\Sigma  f_im_i\right)}^2}{n}}{n-1}}\

 \ {\rm atau}\ s=\sqrt{\dfrac{n\Sigma {f_im}^2_i-{\left(\Sigma  f_im_i\right)}^2}{n(n-1)}} 

contoh 1 :
Berikut ini adalah nilai Quiz ke-1 dan ke-2 Matakuliah Statistik.
Quiz ke-1: 1 20 20 20 20 20 20 20 20 20 20
Quiz ke-2: 2 3 4 5 6 14 15 16 17 18 19

Apabila data nilai Quiz pada contoh diatas diambil dari sampel, tentukan nilai ragam dan standar deviasinya.

jawab :
Untuk mencari nilai standar deviasi sampel, kita bisa menggunakan salah satu formula berikut:

 s=\sqrt{\dfrac{\Sigma  {\left(x_i-\overline{x}\right)}^2}{n-1}}\ {\rm atau}\  \sqrt{\dfrac{\Sigma x^2_i-\dfrac{{\left(\Sigma x_i\right)}^2}{n}}{n-1}}\

Formula pertama adalah formula secara definitif. Formula yang direkomendasikan untuk perhitungan secara manual adalah formula yang ke-2. Cara perhitungan dengan formula yang ke-2 bisa di lihat pada contoh 7 dan 8. Pada contoh ini, sebagai latihan, kita gunakan formula yang pertama. Untuk perhitungan dengan formula pertama, kita memerlukan nilai rata-ratanya, sehingga terlebih dahulu kita harus menghitung nilai rata-ratanya.
Quiz I: rata-rata =18.27
Quiz 2: rata-rata = 10.82


No Quiz 1 (xi)
 (x_i-\overline{x})  {\left(x_i-\overline{x}\right)}^2
Quiz 2 (xi)
 (x_i-\overline{x})  {\left(x_i-\overline{x}\right)}^2
1 1 -17.27 298.35
2 -8.82 77.76
2 20 1.73 2.98
3 -7.82 61.12
3 20 1.73 2.98
4 -6.82 46.49
4 20 1.73 2.98
5 -5.82 33.85
5 20 1.73 2.98
6 -4.82 23.21
6 20 1.73 2.98
14 3.18 10.12
7 20 1.73 2.98
15 4.18 17.49
8 20 1.73 2.98
16 5.18 26.85
9 20 1.73 2.98
17 6.18 38.21
10 20 1.73 2.98
18 7.18 51.58
11 20 1.73 2.98
19 8.18 66.94


Jumlah 328.1818


453.6364

Quiz 1:

 s=\sqrt{\dfrac{\Sigma  {\left(x_i-\overline{x}\right)}^2}{n-1}}\ \  s=\sqrt{\dfrac{328.18}{11-1}}=5.73\
 ragam=s^2={5.73}^2=32.82\

Quiz 2:

  s=\sqrt{\dfrac{453.64}{11-1}}=6.74\ \

  ragam=s^2={6.74}^2=45.36


Kesimpulan:

Berdasarkan nilai ragam dan standar deviasi, Quiz ke-2 lebih bervariasi dibandingkan dengan Quiz ke-1. (kesimpulannya berbeda dengan kesimpulan berdasarkan range)

contoh 2 :
Hitung nilai standar deviasi dan ragam dari tabel frekuensi data tunggal berikut:
No xi fi
1 70 5
2 69 6
3 45 3
4 80 1
5 56 1
Jumlah 320 16

Jawab:

Untuk kemudahan dalam perhitungan secara manual, kita gunakan formula standar deviasi berikut:

 s=\sqrt{\dfrac{n\Sigma {f_ix}^2_i-{\left(\Sigma  f_ix_i\right)}^2}{n(n-1)}}\ {\rm atau}\ s=\sqrt{\dfrac{\Sigma  {f_ix}^2_i-\dfrac{{\left(\Sigma f_ix_i\right)}^2}{n}}{n-1}}

Selanjutnya kita buat tabel seperti pada tabel berikut:
No xi fi fi.xi fi.xi2
1 70 5 350 24500
2 69 6 414 28566
3 45 3 135 6075
4 80 1 80 6400
5 56 1 56 3136
Jumlah 320 16 1035 68677
Dari tabel tersebut didapat:
n = 16
mean = 1035/12 = 64.69

Standar deviasi:
 s=\sqrt{\dfrac{{\rm 68677}-\dfrac{{\left({\rm  1035}\right)}^2}{16}}{16-1}}=10.72\

 {\rm atau}\ s=\sqrt{\dfrac{16(68677)-{\left({\rm  1035}\right)}^2}{16(16-1)}}=10.72


 {\rm Ragam}\ s^2={\left(10.72\right)}^2=115.03

contoh 3 :
Hitung nilai standar deviasi dan ragam dari tabel frekuensi yang sudah dikelompokkan:
Tabel berikut ini adalah nilai ujian statistik 80 mahasiswa yang sudah disusun dalam tabel frekuensi. Berbeda dengan contoh di atas, pada contoh ini, tabel distribusi frekuensi dibuat dari data yang sudah dikelompokkan berdasarkan selang/kelas tertentu (banyak kelas = 7 dan panjang kelas = 10).
Kelas ke- Nilai Ujian fi
1 31 - 40 2
2 41 - 50 3
3 51 - 60 5
4 61 - 70 13
5 71 - 80 24
6 81 - 90 21
7 91 - 100 12

Jumlah 80

Jawab:

Untuk kemudahan dalam perhitungan secara manual, kita gunakan formula standar deviasi berikut:
 s=\sqrt{\dfrac{\Sigma {f_im}^2_i-\dfrac{{\left(\Sigma  f_im_i\right)}^2}{n}}{n-1}}\ {\rm atau}\ \ s=\sqrt{\dfrac{n\Sigma  {f_im}^2_i-{\left(\Sigma f_im_i\right)}^2}{n(n-1)}}
Selanjutnya kita buat daftar tabel berikut, tentukan nilai tengah kelas/pewakilnya (mi) dan lengkapi kolom berikutnya.
Kelas ke- Nilai Ujian fi mi fi.mi fi.mi2
1 31 - 40 2 35.5 71.0 2520.5
2 41 - 50 3 45.5 136.5 6210.8
3 51 - 60 5 55.5 277.5 15401.3
4 61 - 70 13 65.5 851.5 55773.3
5 71 - 80 24 75.5 1812.0 136806.0
6 81 - 90 21 85.5 1795.5 153515.3
7 91 - 100 12 95.5 1146.0 109443.0

Jumlah 80 458.5 6090.0 479670.0
Dari tabel tersebut didapat:
n = 80
mean = 6090/80 = 76.13
Standar deviasi dan ragam:

 s=\sqrt{\dfrac{\Sigma {f_im}^2_i-\dfrac{{\left(\Sigma  f_im_i\right)}^2}{n}}{n-1}}=\sqrt{\dfrac{{\rm 479670}-\dfrac{{\left({\rm  6090}\right)}^2}{80}}{80-1}}=77.92

 {\rm atau}\ s=\sqrt{\dfrac{n\Sigma {f_im}^2_i-{\left(\Sigma  f_im_i\right)}^2}{n(n-1)}}=\sqrt{\dfrac{80(479670)-{\left({\rm  6090}\right)}^2}{80(80-1)}}=77.92

 {\rm Ragam}\ s^2={\left(77.92\right)}^2=6070.81

Contoh Tambahan:

Dengan cara yang sama seperti di atas, nilai standar deviasi untuk ketiga varietas:
Varietas I = 1.87
Varietas II = 9.49
Varietas III = 2.35

4. Varians



Varian ini digunakan untuk menunjukkan tingkat homogenitas suatu data. Varians ini dapat dihitung dengan berdasarkan kepada standar deviasi dan rata-rata data. Varians adalah kuadrat dari standar deviasi.  

Jika (Standar Deviasi) = 13,58 maka (Varians) = 13,582 = 184.4164
Jika (Standar Deviasi) = 7,045 maka (Varians) = 7,0452 = 49.632025

 


Sumber :