Statistik Inferensial
Terakhir diubah pada
Pertemuan 1
RPS
Materi Per Pertemuan - Statistik Inferensial
Berdasarkan Buku Acuan: Keller, Gerald. (2018). Statistics for Management and Economics, 11th Edition.
Minggu Ke- | Materi Pembelajaran | Bab dalam Buku Acuan |
---|---|---|
1 | Pengantar Statistik Inferensial | Bab 1 |
2 | Distribusi Sampling | Bab 9 |
3 | Estimasi Parameter | Bab 10 |
4 | Uji Hipotesis | Bab 11 |
5 | Inferensi Statistik untuk Satu Populasi | Bab 12 |
6 | Inferensi Statistik untuk Dua Populasi | Bab 13 |
7 | Inferensi Dua Populasi (Selisih Variansi & Proporsi) | Bab 13 |
8 | Ujian Tengah Semester (UTS) | - |
9 | Analisis Varians (ANOVA) | Bab 14 |
10 | ANOVA Dua Faktor | Bab 14 |
11 | Uji Khi Kuadrat | Bab 15 |
12 | Regresi Linier Sederhana | Bab 16 |
13 | Regresi Linier Berganda | Bab 17 |
14 | Statistik Nonparametrik (Wilcoxon, Kruskal-Wallis) | Bab 19 |
15 | Statistik Nonparametrik (Uji Friedman, Spearman) | Bab 19 |
16 | Ujian Akhir Semester (UAS) | - |
Pertemuan 2
Distribusi Sampling
Distribusi Sampling adalah distribusi probabilitas dari statistik sampel yang dihitung dari banyak sampel yang diambil dari suatu populasi.
Konsep ini sangat penting dalam inferensi statistik, karena memungkinkan kita untuk memperkirakan karakteristik populasi berdasarkan sampel.
Distribusi Sampling dari Mean
Distribusi sampling dari mean adalah distribusi probabilitas dari rata-rata sampel yang diambil dari suatu populasi.
Teorema Limit Pusat menyatakan bahwa jika ukuran sampel cukup besar, distribusi sampling dari mean akan mendekati distribusi normal, terlepas dari bentuk distribusi populasi asli.
Rumus Mean dan Standar Deviasi dari distribusi sampling:
\[ \mu_{\bar{x}} = \mu \] \[ \sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}} \]di mana:
- \(\mu\) adalah mean populasi
- \(\sigma\) adalah standar deviasi populasi
- \(n\) adalah ukuran sampel
Distribusi Sampling dari Proporsi
Distribusi sampling juga berlaku untuk proporsi, terutama dalam kasus data biner (misalnya, sukses/gagal).
Jika \( p \) adalah proporsi populasi dan \( \hat{p} \) adalah proporsi sampel, maka:
\[ \mu_{\hat{p}} = p \] \[ \sigma_{\hat{p}} = \sqrt{\frac{p(1 - p)}{n}} \]Distribusi sampling dari proporsi akan mendekati distribusi normal jika memenuhi aturan normalitas:
\[ np \geq 5 \quad \text{dan} \quad n(1-p) \geq 5 \]Distribusi Sampling dari Selisih Dua Mean
Ketika membandingkan dua sampel independen, distribusi sampling dari selisih dua mean mengikuti aturan:
Mean dari distribusi:
\[ \mu_{\bar{x}_1 - \bar{x}_2} = \mu_1 - \mu_2 \]Standar deviasi dari distribusi:
\[ \sigma_{\bar{x}_1 - \bar{x}_2} = \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}} \]Jika ukuran sampel cukup besar, distribusi ini dapat didekati dengan distribusi normal.
Inferensi Statistik dengan Distribusi Sampling
Distribusi sampling memungkinkan kita untuk:
- Menentukan estimasi parameter populasi (seperti mean atau proporsi).
- Menghitung probabilitas dari suatu sampel berdasarkan distribusi normal.
- Melakukan uji hipotesis dan interval kepercayaan untuk menentukan signifikansi hasil sampel.
Inferensi statistik bergantung pada asumsi bahwa distribusi sampling cukup normal untuk digunakan dalam perhitungan statistik.
Soal 1:
Waktu yang dihabiskan oleh orang dewasa di Amerika Utara untuk menonton televisi per hari diasumsikan mengikuti distribusi normal dengan rata-rata \( \mu = 6 \) jam dan standar deviasi \( \sigma = 1.5 \) jam.
- Berapa probabilitas bahwa seorang dewasa Amerika Utara yang dipilih secara acak menonton televisi lebih dari 7 jam per hari?
- Berapa probabilitas bahwa rata-rata waktu menonton televisi dalam sampel acak yang terdiri dari lima orang dewasa Amerika Utara lebih dari 7 jam per hari?
- Berapa probabilitas bahwa dalam sampel acak yang terdiri dari lima orang dewasa Amerika Utara, semuanya menonton televisi lebih dari 7 jam per hari?
Soal 2:
Jumlah pelanggan yang memasuki sebuah supermarket setiap jam diasumsikan mengikuti distribusi normal dengan rata-rata \( \mu = 600 \) pelanggan per jam dan standar deviasi \( \sigma = 200 \) pelanggan per jam.
Supermarket buka selama 16 jam per hari. Berapakah probabilitas bahwa total jumlah pelanggan yang masuk dalam satu hari lebih dari 10.000?
Petunjuk: Hitung rata-rata jumlah pelanggan per jam yang diperlukan agar total melebihi 10.000 dalam satu hari kerja 16 jam.
Soal 3:
Seorang manajer restoran percaya bahwa pelayan yang memperkenalkan diri dengan menyebutkan nama mereka kepada pelanggan akan mendapatkan tip yang lebih besar dibandingkan mereka yang tidak melakukannya.
Ia mengklaim bahwa rata-rata tip untuk kelompok pertama adalah 18%, sedangkan untuk kelompok kedua hanya 15%.
Jika distribusi tip mengikuti distribusi normal dengan standar deviasi 3%, berapakah probabilitas bahwa dalam sampel acak yang terdiri dari 10 tip dari pelayan yang memperkenalkan diri dan 10 tip dari pelayan yang tidak, rata-rata tip kelompok pertama lebih besar daripada kelompok kedua?
Pertemuan 3
Bab 10: Pengenalan Estimasi
10-1: Konsep Estimasi
Estimasi digunakan untuk menentukan nilai parameter populasi berdasarkan statistik sampel.
Dua jenis estimasi:
- Estimasi titik (Point Estimator): Menggunakan satu nilai untuk memperkirakan parameter populasi.
- Estimasi interval (Interval Estimator): Memberikan rentang nilai dengan tingkat kepercayaan tertentu.
Karakteristik estimator yang baik:
- Unbiased: Rata-rata estimator mendekati nilai parameter populasi.
- Consistent: Estimator semakin akurat saat ukuran sampel meningkat.
- Efficient: Estimator dengan variansi lebih kecil lebih diinginkan.
10-2: Estimasi Mean Populasi Ketika Standar Deviasi Populasi Diketahui
Jika populasi memiliki distribusi normal dan standar deviasi (\(\sigma\)) diketahui, maka interval kepercayaan untuk rata-rata populasi (\(\mu\)) adalah:
\[ \bar{x} \pm Z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \]- \(\bar{x}\) = rata-rata sampel
- \(Z_{\alpha/2}\) = nilai kritis dari distribusi normal standar
- \(\sigma\) = standar deviasi populasi
- \(n\) = ukuran sampel
Interpretasi Interval Kepercayaan:
- Bukan probabilitas bahwa parameter populasi ada dalam rentang tersebut.
- Dalam banyak sampel, persentase tertentu dari interval akan mencakup parameter populasi.
10-3: Menentukan Ukuran Sampel
Untuk mendapatkan interval kepercayaan dengan batas kesalahan tertentu (\(B\)), ukuran sampel (\(n\)) harus memenuhi:
\[ n = \left( \frac{Z_{\alpha/2} \cdot \sigma}{B} \right)^2 \]- Menambah ukuran sampel mempersempit interval kepercayaan.
- Jika \(\sigma\) tidak diketahui, biasanya digunakan estimasi dari sampel sebelumnya.
Contoh Aplikasi
1. Estimasi Diameter Pohon
Sebuah perusahaan kayu ingin memperkirakan rata-rata diameter pohon dengan interval kepercayaan 90%. Diperlukan 98 sampel pohon untuk mendapatkan estimasi dengan batas kesalahan ±1 inci.
2. Estimasi Permintaan Stok Barang
Seorang manajer ingin memperkirakan permintaan barang selama periode tertentu. Dengan metode estimasi interval kepercayaan, ia dapat menentukan jumlah stok yang optimal.
Kesimpulan
- Estimasi adalah alat penting dalam inferensi statistik.
- Interval kepercayaan lebih akurat dibanding estimasi titik karena mempertimbangkan variabilitas sampel.
- Ukuran sampel yang tepat meningkatkan akurasi estimasi tanpa membuang sumber daya.
Soal 1:
Salah satu efek samping negatif dari berhenti merokok adalah kenaikan berat badan. Diasumsikan bahwa kenaikan berat badan dalam 12 bulan setelah berhenti merokok mengikuti distribusi normal dengan standar deviasi sebesar 6 pon.
Untuk memperkirakan kenaikan berat badan rata-rata, sebuah sampel acak yang terdiri dari 13 orang yang berhenti merokok diambil. Data berat badan yang tercatat adalah sebagai berikut:
16, 23, 8, 2, 14, 22, 18, 11, 10, 19, 5, 8, 15
Tentukan estimasi interval kepercayaan 90% untuk rata-rata kenaikan berat badan dalam 12 bulan bagi semua orang yang berhenti merokok.
Soal 2:
Seorang profesor statistik sedang menyelidiki jumlah kelas yang dilewatkan oleh mahasiswa universitas setiap semester. Untuk menjawab pertanyaan ini, ia mengambil sampel acak dari 100 mahasiswa universitas dan meminta mereka melaporkan berapa banyak kelas yang mereka lewatkan pada semester sebelumnya.
Perkirakan jumlah rata-rata kelas yang dilewatkan oleh semua mahasiswa di universitas tersebut.
Gunakan tingkat kepercayaan 99% dan asumsikan bahwa standar deviasi populasi diketahui sebesar 2.2 kelas.
Soal 3:
Seorang ahli statistik medis ingin memperkirakan rata-rata penurunan berat badan dari orang-orang yang mengikuti program diet baru.
Dalam sebuah studi awal, ia memperkirakan bahwa standar deviasi populasi untuk penurunan berat badan adalah sekitar 10 pon.
Berapa besar sampel yang harus diambilnya agar dapat memperkirakan rata-rata penurunan berat badan dengan batas kesalahan 2 pon, menggunakan tingkat kepercayaan 90%?
Pertemuan 4
Bab 11: Pengantar Pengujian Hipotesis
11.1 Konsep Pengujian Hipotesis
Pengujian hipotesis adalah metode statistik yang digunakan untuk membuat keputusan tentang parameter populasi berdasarkan data sampel. Komponen utama dalam pengujian hipotesis meliputi:
- Hipotesis Nol (\(H_0\)): Pernyataan bahwa tidak ada perbedaan atau efek dalam populasi.
- Hipotesis Alternatif (\(H_a\)): Pernyataan yang bertentangan dengan \(H_0\), menunjukkan adanya perbedaan atau efek.
- Statistik Uji: Nilai yang dihitung dari data sampel untuk menentukan apakah \(H_0\) dapat ditolak.
- P-value: Probabilitas mendapatkan hasil yang diamati jika \(H_0\) benar.
- Tingkat Signifikansi (\(\alpha\)): Batas probabilitas (biasanya 0.05) untuk menolak \(H_0\).
11.2 Pengujian Mean Populasi Ketika Standar Deviasi Populasi Diketahui
Jika standar deviasi populasi (\(\sigma\)) diketahui, maka statistik uji untuk rata-rata sampel (\(\bar{x}\)) dapat dihitung dengan:
\[ Z = \frac{\bar{x} - \mu_0}{\frac{\sigma}{\sqrt{n}}} \]di mana:
- \(\mu_0\) = rata-rata populasi yang dihipotesiskan
- \(\sigma\) = standar deviasi populasi
- \(n\) = ukuran sampel
11.3 Menghitung Probabilitas Kesalahan Tipe II
Kesalahan Tipe II (\(\beta\)) terjadi ketika kita gagal menolak \(H_0\) padahal \(H_a\) benar. Daya uji statistik dihitung sebagai:
\[ \text{Daya Uji} = 1 - \beta \]Nilai \(\beta\) bergantung pada nilai rata-rata populasi sebenarnya dan distribusi statistik uji.
11.4 Kesimpulan
Memahami konsep pengujian hipotesis sangat penting dalam analisis data dan inferensi statistik. Teknik ini digunakan dalam berbagai metode lanjutan seperti interval kepercayaan, regresi, dan ANOVA.
Soal 1:
Sebuah perusahaan produsen lampu menyatakan bahwa, rata-rata, lampu tahan lama mereka akan bertahan lebih dari 5.000 jam.
Untuk menguji klaim tersebut, seorang ahli statistik mengambil sampel acak sebanyak 100 lampu dan mengukur waktu yang dibutuhkan sampai setiap lampu mati.
Jika diasumsikan bahwa umur jenis lampu ini memiliki standar deviasi sebesar 400 jam, dapatkah kita menyimpulkan pada tingkat signifikansi 5% bahwa klaim tersebut benar?
Soal 2:
Dalam negosiasi antara pekerja dan manajemen, presiden sebuah perusahaan berpendapat bahwa pekerja lapangan (blue-collar workers), yang dibayar rata-rata \$30.000 per tahun, telah mendapatkan gaji yang layak karena rata-rata pendapatan tahunan semua pekerja lapangan di negara tersebut kurang dari \$30.000.
Klaim ini ditentang oleh serikat pekerja, yang tidak percaya bahwa rata-rata pendapatan pekerja lapangan lebih kecil dari \$30.000.
Untuk menguji klaim presiden perusahaan, seorang arbiter mengambil sampel acak sebanyak 350 pekerja lapangan dari seluruh negara dan meminta mereka melaporkan pendapatan tahunan mereka.
Jika arbiter mengasumsikan bahwa pendapatan pekerja lapangan berdistribusi normal dengan standar deviasi \$8.000, dapatkah disimpulkan pada tingkat signifikansi 5% bahwa pernyataan presiden perusahaan benar?
Soal 3:
Hitung probabilitas kesalahan Tipe II (\(\beta\)) untuk pengujian hipotesis berikut, diberikan bahwa \(\mu = 203\).
\[ H_0: \quad \mu = 200 \] \[ H_1: \quad \mu \neq 200 \]Informasi tambahan:
- Tingkat signifikansi: \( \alpha = 0.05 \)
- Standar deviasi populasi: \( \sigma = 10 \)
- Ukuran sampel: \( n = 100 \)
Pertemuan 5
Pertemuan 6
Pertemuan 7
Daftar Hadir dan Nilai
Daftar Nilai ES4D
Daftar Nilai ES4E
Daftar Nilai ES4F