Measure of Central Tendency
dalam Statistika
Measure of Central Tendency?
Measure of Central Tendency dapat didefinisikan
sebagai suatu pengukuran nilai yang dapat
digunakan untuk merepresentasikan nilai tipikal atau
sentral dari suatu dataset.
Mean dari suatu dataset merupakan penjumlahan
dari keseluruhan entri pada dataset dibagi dengan
banyaknya entri pada dataset tersebut.
Median
Median dari suatu dataset merupakan nilai yang
berada di tengah dengan mengacu pada nilai dataset
yang sudah terurut.
● Untuk dataset dengan jumlah entri ganjil, nilai median dapat
diperoleh dari nilai yang tepat berada di tengah.
● Untuk dataset dengan jumlah entri genap, nilai median diperoleh
dari rerata dua nilai yang berada di tengah.
Mode
Mode dari suatu dataset merupakan nilai dari
dataset yang memiliki frekuensi kemunculan paling
tinggi.
● Suatu dataset dapat memiliki lebih dari satu mode (multi-modal).
● Suatu dataset juga bisa saja tidak memiliki mode, ketika frekuensi
kemunculan dari tiap datanya sama.
Measure of Variation dalam Statistika
Measure of Variation?
Measure of Variation dapat didefinisikan sebagai
suatu pengukuran nilai yang dapat digunakan untuk
merepresentasikan keberagaman atau sebaran data.
- Range
- Variance
- Standard Deviation
Range (Jangkauan)
Range dari suatu dataset merupakan hasil
perhitungan selisih antara nilai tertinggi dengan
nilai terrendah pada dataset tersebut.
Pengukuran nilai keberagaman dengan menggunakan
range memiliki kelemahan di mana hanya
menyertakan dua nilai saja dalam proses
pengukuran.
Variance (Variansi)
Variance dari suatu dataset merupakan hasil
perhitungan rerata simpangan tiap entri data pada
dataset terhadap nilai mean dari dataset tersebut.
Standard Deviation (Simpangan Baku)
Kelemahan utama dari Variance adalah nilai yang
dihasilkan tidak lagi memiliki satuan yang sama
dengan entri data. Kelemahan ini dapat diatasi dengan
Standard Deviation.
Measure of Position
dalam Statistika
Measure of Position?
Measure of Position dapat didefinisikan sebagai suatu
pengukuran nilai yang digunakan untuk menentukan
posisi relatif dari suatu entri data (data point) pada
dataset.
- Quartile
- Percentile
- Standard Score
Quartile (Kuartil)
Quartile adalah nilai yang membagi suatu dataset
terurut menjadi empat bagian yang sama.
Terdapat tiga nilai quartile, yaitu: Q1
, Q2
, dan Q3
Interquartile Range (IQR)
Interquartile Range (IQR) adalah measure of Variation
(pengukuran keberagaman/sebaran data) dengan
menselisihkan nilai quartile ketiga dan quartile pertama.
Deteksi Outlier dengan IQR
Entri data (data point) pada suatu dataset bisa
dikategorikan sebagai outlier bila:
● Lebih kecil dari Q1
-1.5(IQR)
● Lebih besar dari Q3
+1.5(IQR)
Percentile (Persentil)
Percentile adalah nilai yang membagi suatu dataset
terurut menjadi 100 bagian yang sama.
Terdapat 99 nilai percentaile, yaitu: P1
, P2
, …, P99
● P25 menunjuk posisi yang sama dengan Q1
● P50 menunjuk posisi yang sama dengan Q2
● P75 menunjuk posisi yang sama dengan Q3
Deteksi Outlier dengan Percentile
Entri data (data point) pada suatu dataset bisa
dikategorikan sebagai outlier bila:
● Lebih kecil dari P5
● Lebih besar dari P95
Standard Score (z-score)
Standard Score (z-score) merepresentasikan nilai
simpangan suatu entri data terhadap mean dari dataset
yang diukur berdasarkan standard deviation.
Nilai z-score bisa negatif, positif, atau nol.
Tidak ada komentar:
Posting Komentar