Ekonometrika

Ekonometrika

Terakhir diubah pada

Pertemuan 1

RPS

Minggu Materi Pembelajaran Pustaka
1 Pengantar Ekonometrika dan Model Regresi Linear Bab 1: The Linear Regression Model: An Overview
2 Bentuk Fungsional Model Regresi Bab 2: Functional Forms of Regression Models
3 Variabel Dummy dalam Regresi Bab 3: Qualitative Explanatory Variables Regression Models
4 Multikolinearitas dalam Model Regresi Bab 4: Regression Diagnostic I: Multicollinearity
5 Heteroskedastisitas dalam Regresi Bab 5: Regression Diagnostic II: Heteroscedasticity
6 Autokorelasi dalam Regresi Bab 6: Regression Diagnostic III: Autocorrelation
7 Kesalahan Spesifikasi Model Regresi Bab 7: Regression Diagnostic IV: Model Specification Errors
8 Ujian Tengah Semester (UTS) -
9 Model Logit dan Probit untuk Data Kategorikal Bab 8: The Logit and Probit Models
10 Model Multinomial dan Ordinal dalam Regresi Bab 9-10: Multinomial & Ordinal Regression Models
11 Model Data Terbatas dan Poisson Regression Bab 11-12: Limited Dependent Variable & Poisson Models
12 Analisis Deret Waktu Bab 13: Stationary and Nonstationary Time Series
13 Kointegrasi dan Model Koreksi Kesalahan (ECM) Bab 14: Cointegration and Error Correction Models
14 Model Volatilitas (ARCH dan GARCH) Bab 15: Asset Price Volatility: The ARCH and GARCH Models
15 Model Data Panel dan Survival Analysis Bab 17-18: Panel Data Regression & Survival Analysis
16 Ujian Akhir Semester (UAS) -

Pertemuan 2

graph TD A("Model Regresi Linier") B("$Y=B_1+B_2X_2+B_3X_3+\cdots +B_kX_k$") C("$ Y,X_2,X_3,\cdots,X_k$") D("Skala Variabel") D1("Skala Rasio") D2("Skala Interval") D3("Skala Ordinal") D4("Skala Nominal") E("Tipe Data") E1("Time Series") E2("Cross Section") E3("Panel") A --> B --> C --> D D --> D1 D --> D2 D --> D3 D --> D4 C --> E E --> E1 E --> E2 E --> E3

Bab 2: Functional Forms of Regression Models

Kasus 1 – Financial Inclusion
Kasus 2 – Banking Assets

Pertemuan 3

graph TD a("Bentuk Regresi Linier") a2("regresi logaritma
$\log Y = B_1+B_2\log X_1 + B_3\log X_2$") a1("regresi reciprocal
$Y = B_1+B_2\left(\dfrac{1}{X}\right)$") a3("regresi polinom
$Y = B_1+B_2X^2+B_3X+B_4$") a --> a1 a --> a2 a --> a3

Regresi Logaritma

Regresi Reciprocal

Regresi Polinom

Soal 1: Data Pendidikan vs. Pendapatan

Seorang peneliti ekonomi ingin memodelkan hubungan antara tingkat pendidikan dan pendapatan tahunan. Data dari 30 responden telah dikumpulkan. Lakukan analisis regresi untuk mengetahui seberapa besar pengaruh setiap tambahan tahun pendidikan terhadap pendapatan. Model apa yang paling sesuai untuk menjelaskan fenomena ini, di mana setiap jenjang pendidikan memberikan dampak persentase, bukan nominal tetap?

Analisis hubungan antara tahun pendidikan (X) dan pendapatan tahunan dalam juta Rupiah (Y).

Tahun_Pendidikan Pendapatan_Tahunan
12 95.8
16 221.5
11 81.2
18 355.1
14 145.3
16 218.9
19 470.2
12 98.1
13 115.6
17 280.4
10 70.3
16 225.1
18 340.7
14 150.8
12 101.4
19 485.6
16 230.2
13 120.5
17 295.3
12 99.9
14 148.2
18 360.1
16 222.8
11 84.5
20 598.7
12 103.1
17 288.0
14 152.9
16 215.7
18 351.9

Soal 2: Data Usia vs. Kinerja Penjualan

Sebuah perusahaan ingin memahami hubungan antara usia tenaga penjualnya dengan kinerja penjualan (dalam unit terjual per bulan). Hipotesisnya adalah kinerja akan meningkat seiring pengalaman (usia), mencapai puncaknya pada usia tertentu, dan kemudian menurun. Buatlah model regresi yang dapat menangkap pola "naik-lalu-turun" ini untuk menemukan usia puncak kinerja.

Analisis hubungan antara usia tenaga penjual (X) dan unit terjual per bulan (Y).

Usia Unit_Terjual
23 52.1
25 58.8
28 66.9
30 71.5
32 75.1
34 77.8
36 79.9
38 81.2
40 82.0
41 81.9
42 81.5
43 80.8
44 79.9
45 78.5
46 77.1
47 75.4
48 73.6
49 71.5
50 69.1
51 66.5
52 63.8
53 60.9
54 57.8
55 54.5
56 51.1
57 47.5
58 43.8
59 39.9
60 35.9
61 31.7

Soal 3: Data Jam Belajar vs. Skor Ujian

Sebuah lembaga bimbingan belajar ingin membuktikan efektivitas programnya. Mereka mengklaim bahwa penambahan jam belajar akan meningkatkan skor, namun peningkatannya akan semakin kecil saat mendekati skor maksimal (terjadi efek jenuh). Analisislah data berikut untuk menentukan berapa skor maksimal teoretis (asimtot) yang bisa dicapai oleh siswa.

Analisis hubungan antara total jam belajar (X) dan skor ujian (Y) untuk menentukan batas skor maksimal.

Jam_Belajar Skor_Ujian
1 18.5
2 57.1
3 71.2
4 78.9
5 82.1
6 85.5
7 87.9
8 89.1
9 90.3
10 91.5
11 92.1
12 92.8
13 93.5
14 94.0
15 94.3
16 94.8
18 95.4
20 95.9
22 96.1
24 96.5
26 96.8
28 97.0
30 97.2
32 97.4
34 97.5
36 97.6
38 97.8
40 97.9
42 98.0
45 98.1

Pertemuan 4

graph TD a("Asumsi Regresi Linier") a2("normalitas") a1(("multikolinieritas")) a3("heteroskedastisitas") a4("autokorelasi") a --> a1 a --> a2 a --> a3 a --> a4

(a) Regresi Dummy

(b) Regresi Dummy

(c) Asumsi Multikolinieritas

(d) Asumsi Multikolinieritas

Pertemuan 5

Apa Itu Heteroskedastisitas? Sebuah Analogi Sederhana

Bayangkan Anda seorang pelatih anjing yang sedang mengajari anjing dari berbagai ras untuk menangkap bola.

Homoskedastisitas (Kondisi Ideal): Jika Anda melempar bola dengan kekuatan yang sama setiap saat, semua anjing (baik Chihuahua, Beagle, maupun Golden Retriever) akan berlari dan menangkapnya dengan tingkat kesalahan (error) yang kira-kira sama. Jarak bola jatuh dari mulut mereka konsisten. Ini seperti homoskedastisitas, di mana varians dari error regresi Anda konstan di seluruh level variabel independen. Prediksi Anda sama baiknya untuk nilai kecil maupun besar.

Heteroskedastisitas (Masalah Muncul): Sekarang, bayangkan Anda meningkatkan kekuatan lemparan. Untuk anjing kecil seperti Chihuahua, kesalahan tangkapannya mungkin tetap kecil. Tapi untuk anjing besar seperti Golden Retriever, kesalahan tangkapannya menjadi sangat bervariasi; kadang tepat di mulut, kadang meleset jauh. Semakin kuat lemparan Anda (variabel independen), semakin tidak terduga dan semakin lebar sebaran kesalahannya (error). Inilah heteroskedastisitas. Varians dari error regresi Anda berubah seiring perubahan nilai variabel independen. Akibatnya, prediksi model Anda menjadi kurang bisa diandalkan pada level tertentu.

Singkatnya, heteroskedastisitas adalah kondisi di mana sebaran (varians) dari residual atau error dalam model regresi tidak konstan. Ini melanggar salah satu asumsi penting dari regresi Ordinary Least Squares (OLS), yang dapat membuat hasil uji signifikansi (uji-t dan uji-F) menjadi tidak valid.

flowchart TD subgraph Deteksi["Deteksi"] direction LR D1("Uji Glejser") D2("Uji Park") D3("Uji White") end A["Mulai: Model Regresi Awal"] --> B("Estimasi Model OLS") B --> C("Dapatkan Residual") C --> D{"Uji Heteroskedastisitas"} & D1 & D2 & D3 D -- Ada Heteroskedastisitas --> E["Pilih Metode Penanganan"] D -- Tidak Ada Heteroskedastisitas --> F["Selesai: Model Valid"] E --> G("Metode 1: Gunakan White's Robust Standard Errors" ) & H["Metode 2: Transformasi Variabel - Log, Box-Cox"] G --> I["Estimasi Ulang Model dengan Robust SE"] H --> J["Estimasi Ulang Model dengan Variabel Transformasi"] I --> K["Selesai: Uji Signifikansi Valid"] J --> K

Langkah 1: Estimasi Model Regresi Awal (OLS)

Pertama, estimasi model regresi linear Anda. Asumsikan model Anda adalah:

$Y=β0​+β1​X1​+β2​X2​+β3​X3​+ϵ$

Di EViews, buka window Quick > Estimate Equation. Masukkan persamaan Anda, contohnya: y c x1 x2 x3. Biarkan metodenya LS - Least Squares (NLS and ARMA). Klik OK.

Langkah 2: Lakukan Uji Heteroskedastisitas

Setelah jendela hasil regresi (Equation) muncul, lakukan langkah berikut:

  1. Klik View > Residual Diagnostics > Heteroskedasticity Tests.
  2. Pilih salah satu metode uji yang umum digunakan, misalnya White.
  3. Pada dialog selanjutnya, Anda bisa memilih untuk menyertakan cross terms atau tidak. Opsi default (tanpa cross terms) sudah cukup untuk permulaan. Klik OK.

Langkah 3: Interpretasi Hasil Uji

Anda akan melihat output "Heteroskedasticity Test: White". Perhatikan nilai Prob. Chi-Square(k) (dimana k adalah jumlah derajat kebebasan).

  • Jika Prob. > 0.05: Gagal menolak hipotesis nol. Artinya, tidak ada masalah heteroskedastisitas.
  • Jika Prob. < 0.05: Menolak hipotesis nol. Artinya, terdapat masalah heteroskedastisitas yang signifikan dalam model Anda.

Langkah 4: Penanganan Heteroskedastisitas (Jika Terdeteksi)

Jika uji menunjukkan adanya heteroskedastisitas, solusi paling praktis dan umum adalah menggunakan Robust Standard Errors (White).

  1. Kembali ke jendela estimasi awal (Quick > Estimate Equation) atau klik Estimate di jendela output regresi Anda.
  2. Masukkan lagi persamaan Anda: y c x1 x2 x3.
  3. Klik pada tab Options.
  4. Pada bagian Coefficient covariance matrix, pilih White dari dropdown menu.
  5. Klik OK.

Hasil regresi yang baru akan menampilkan nilai koefisien yang sama, tetapi standard error, t-statistic, dan p-value akan disesuaikan (robust), membuat inferensi statistik Anda menjadi valid kembali.

Selanjutnya silahkan berlatih dan mengerjakan tiga kasus di bawah ini.

Kasus 1: Pengaruh Iklan, Sales, dan Diskon terhadap Penjualan

Sebuah perusahaan ingin mengetahui bagaimana pengeluaran iklan (dalam jutaan rupiah), jumlah tenaga penjualan, dan rata-rata diskon (%) mempengaruhi total penjualan (dalam ribuan unit). Diduga, pada tingkat iklan yang sangat tinggi, variabilitas penjualan menjadi lebih besar.

Variabel: Y: Penjualan X1: Iklan X2: Salesperson X3: Diskon

Data CSV (Kasus 1):

Kasus 2: Dampak Edukasi, Pengalaman, dan Usia terhadap Pendapatan

Seorang ekonom menganalisis bagaimana lama pendidikan (dalam tahun), pengalaman kerja (dalam tahun), dan usia mempengaruhi pendapatan tahunan (dalam puluhan juta rupiah). Hipotesisnya adalah variabilitas pendapatan jauh lebih tinggi bagi individu dengan tingkat pendidikan dan pengalaman yang sangat tinggi.

Variabel: Y: Pendapatan X1: Pendidikan X2: Pengalaman X3: Usia

Data CSV (Kasus 2):

Kasus 3: Analisis Faktor yang Mempengaruhi Harga Rumah

Seorang analis real estat memodelkan harga rumah (dalam ratusan juta rupiah) berdasarkan luas bangunan (m²), jumlah kamar tidur, dan skor kelayakan lokasi (1-10). Ada asumsi bahwa variasi harga jauh lebih besar untuk rumah yang sangat luas di lokasi premium.

Variabel: Y: Harga X1: Luas X2: Kamar X3: Lokasi

Data CSV (Kasus 3):

Pertemuan 6

Error harus berdistribusi normal dengan rata-rata 0 untuk memastikan bahwa kesalahan-kesalahan kecil diperbolehkan dengan jumlah yang banyak di sekitar 0 tetapi kesalahan besar peluangnya dibuat sangat kecil.
graph TD A[Mulai: Siapkan Data] --> B[1. Estimasi Model Regresi]; B --> C{2. Dapatkan Residual}; C --> D[3. Lakukan Uji Normalitas pada Residual]; D --> E{Apakah P-value > 0.05?}; E -- Ya --> F[✅ Asumsi Terpenuhi: Lanjutkan Analisis]; E -- Tidak --> G[❌ Asumsi Dilanggar: Selidiki]; G --> H[Cek Outlier atau Kesalahan Spesifikasi Model]; H --> I[Lakukan Tindakan Korektif]; I --> B;

Langkah-langkah Uji Normalitas di EViews

  1. Impor Data Anda: Pertama, buka EViews dan impor data CSV yang disediakan dalam studi kasus di bawah ini.
  2. Jalankan Regresi: Di baris perintah EViews, ketik persamaan regresi Anda menggunakan perintah ls (least squares). Sebagai contoh: ls harga_saham c tingkat_suku_bunga tingkat_pengangguran pertumbuhan_pdb Tekan Enter. Ini akan menjalankan regresi dan membuka jendela hasil.
  3. Akses Diagnostik Residual: Di jendela hasil regresi (jendela 'Equation'), navigasikan ke ViewResidual DiagnosticsHistogram - Normality Test.
  4. Interpretasikan Hasil: EViews akan menampilkan histogram dari residual beserta kotak statistik. Cari dua nilai kunci:
    • Jarque-Bera: Ini adalah statistik uji.
    • Probability: Ini adalah p-value yang terkait dengan statistik Jarque-Bera.

    Uji hipotesisnya disusun sebagai berikut:

    $$H_0: \text{Residual terdistribusi secara normal.}$$

    $$H_1: \text{Residual tidak terdistribusi secara normal.}$$

    Aturan Keputusan:

    • Jika Probability > 0.05, Anda tidak menolak hipotesis nol ($H_0$). Ini berarti residual terdistribusi normal, dan asumsi terpenuhi.
    • Jika Probability ≤ 0.05, Anda menolak hipotesis nol ($H_0$). Ini menunjukkan residual tidak terdistribusi normal, dan asumsi dilanggar.

Kasus 1: Faktor-faktor yang Mempengaruhi Harga Saham Perusahaan

Kasus ini menguji bagaimana faktor makroekonomi memengaruhi harga saham suatu perusahaan.
Y (Harga_Saham): Harga penutupan saham.
X1 (Tingkat_Suku_Bunga): Tingkat suku bunga bank sentral yang berlaku (%).
X2 (Tingkat_Pengangguran): Tingkat pengangguran nasional (%).
X3 (Pertumbuhan_PDB): Tingkat pertumbuhan PDB kuartalan (%).


Kasus 2: Determinan Hasil Panen

Kasus ini menyelidiki faktor-faktor yang mempengaruhi hasil panen tanaman tertentu.
Y (Hasil_Panen): Hasil panen dalam ton per hektar.
X1 (Curah_Hujan): Total curah hujan selama musim tanam (dalam mm).
X2 (Pupuk): Jumlah pupuk yang digunakan (dalam kg per hektar).
X3 (Sinar_Matahari): Rata-rata jam sinar matahari harian.


Kasus 3: Memprediksi Harga Rumah

Kasus ini memodelkan harga rumah berdasarkan karakteristik fisiknya.
Y (Harga): Harga jual rumah (dalam jutaan rupiah, disimulasikan sebagai ratusan ribu dolar).
X1 (Luas_Bangunan): Luas rumah dalam meter persegi (disimulasikan sebagai sq. feet).
X2 (Jumlah_Kamar): Jumlah kamar tidur.
X3 (Usia_Rumah): Usia rumah dalam tahun.


KIRIMKAN JAWABAN PER KELOMPOK DISINI

Game Statistik

Pertemuan 7

Pertemuan 8

Ketentuan UTS

  1. UTS hanya boleh dikerjakan selama 1 jam.
  2. Soal UTS boleh dikerjakan dari 09:30-10:30 dan selanjutnya klik Kirim Jawaban untuk mengunggah jawaban di google form.
  3. Setiap mahasiswa akan menerima soal masing-masing sesuai dengan NIM.

Pertemuan 9

$Y$ merupakan data nominal atau kategori. Misal Ya atau Tidak, Hijau atau Merah, dsb.
graph TD D{Y data nominal
data kategori}; D -- Ya --> E[Pilih Metode: Logit atau Probit]; E --> F[Estimasi Model]; F --> G{Evaluasi Model}; G -- Koefisien Signifikan? --> H["Uji Kelayakan Model (Goodness of Fit)"]; H -- Model Layak? --> I["Interpretasi Hasil: Odds Ratio (Logit) / Marginal Effects"]; I --> J["Tarik Kesimpulan & Selesai"];

Menjalankan Estimasi Model

Setelah data berhasil diimpor, kita siap untuk melakukan estimasi. Prosesnya hampir identik untuk Logit dan Probit.

  1. Buka jendela Command atau pilih Quick → Estimate Equation....
  2. Pada dialog Equation Estimation, tuliskan spesifikasi model Anda. Formatnya adalah: variabel_dependen c variabel_independen1 variabel_independen2 .... Contoh: Y c X1 X2 X3.
  3. Ubah menu dropdown Method dari LS (Least Squares) menjadi BINARY - Binary Choice.
  4. Akan muncul pilihan estimasi. Pilih:
    • Logit untuk Model Logit (distribusi logistik).
    • Probit untuk Model Probit (distribusi normal).
    Tips: Secara default, EViews menggunakan metode Maximum Likelihood (ML) untuk mengestimasi model ini, yang merupakan standar industri.
  5. Klik OK untuk menjalankan estimasi.

Jendela output akan muncul dengan hasil estimasi Anda.

Interpretasi Output EViews

Output EViews memberikan banyak informasi penting. Mari kita bedah bagian utamanya:

  • Coefficient ($\beta$): Menunjukkan arah hubungan variabel independen dengan log-odds (Logit) atau Z-score (Probit). Positif berarti meningkatkan probabilitas Y=1, negatif berarti sebaliknya.
  • Std. Error, z-Statistic, Prob.: Ini adalah kunci untuk uji signifikansi. Jika nilai Prob. (p-value) lebih kecil dari tingkat signifikansi yang Anda tentukan (misal, 0.05), maka variabel tersebut berpengaruh signifikan secara statistik terhadap probabilitas Y.
  • McFadden R-squared: Ini adalah salah satu ukuran goodness-of-fit, analog dengan R-squared pada regresi OLS. Nilainya berkisar antara 0 dan 1. Semakin tinggi, semakin baik model menjelaskan variasi data. Nilai antara 0.2 hingga 0.4 sudah dianggap sangat baik.
  • LR statistic & Prob(LR statistic): Ini adalah uji signifikansi model secara keseluruhan (overall significance). Jika nilai Prob(LR statistic) < 0.05, maka model dianggap layak (setidaknya ada satu variabel independen yang berpengaruh signifikan).

Formula yang diestimasi untuk model Logit adalah probabilitas kejadian (Y=1):

$$ P(Y=1 | X) = \frac{e^{\beta_0 + \beta_1 X_1 + \dots + \beta_k X_k}}{1 + e^{\beta_0 + \beta_1 X_1 + \dots + \beta_k X_k}} $$

Karena interpretasi koefisien $\beta$ secara langsung tidak intuitif (misalnya, 'kenaikan satu unit X1 akan menaikkan log-odds sebesar $\beta_1$'), kita seringkali perlu menghitung Odds Ratio (untuk Logit) atau Marginal Effects untuk interpretasi yang lebih mudah.

Marginal Effects

Efek marjinal (marginal effects) menjawab pertanyaan: "Jika X1 naik satu unit, berapa persen perubahan probabilitas Y=1, dengan asumsi variabel lain konstan pada nilai rata-ratanya?". Ini jauh lebih mudah dipahami.

  1. Setelah mendapatkan output estimasi, klik tombol View pada jendela output.
  2. Pilih Marginal Effects... (atau pada beberapa versi EViews, mungkin berada di bawah Gradients and Derivatives).
  3. Biarkan pengaturan default (biasanya dihitung pada rata-rata variabel) dan klik OK.
  4. Output baru akan menunjukkan perubahan probabilitas untuk setiap unit perubahan variabel independen.

Kasus 1: Prediksi Persetujuan Kredit Mikro

Bank ingin memprediksi probabilitas seorang calon nasabah akan disetujui (APPROVE=1) atau ditolak (APPROVE=0) pengajuan kredit mikronya.
Variabel Dependen (Y):
APPROVE (1=Disetujui, 0=Ditolak)
Variabel Independen (X):
PENDAPATAN: Pendapatan bulanan pemohon (dalam jutaan Rupiah).
LAMA_USAHA: Lama usaha berjalan (dalam tahun).
RASIO_UTANG: Rasio total utang terhadap pendapatan (%).
JAMINAN: Apakah pemohon memiliki jaminan (1=Ya, 0=Tidak).

  1. Lakukan estimasi regresi berganda.
  2. Uji asumsi klasik (normalitas, heteroskedastisitas, dan multikolinieritas
  3. Interpretasikan hasilnya.

Kasus 2: Prediksi Kelulusan Tepat Waktu Mahasiswa

Universitas ingin mengetahui faktor-faktor yang mempengaruhi probabilitas seorang mahasiswa lulus tepat waktu (LULUS_TEPAT=1) atau tidak (LULUS_TEPAT=0).
Variabel Dependen (Y):
LULUS_TEPAT (1=Lulus Tepat Waktu, 0=Tidak)
Variabel Independen (X):
IPK_SEM2: Indeks Prestasi Kumulatif mahasiswa pada semester 2.
SKS_LULUS_SEM2: Jumlah SKS yang berhasil diambil hingga semester 2.
KEAKTIFAN_ORG: Keaktifan dalam organisasi (1=Aktif, 0=Tidak Aktif).
BEASISWA: Apakah mahasiswa penerima beasiswa (1=Ya, 0=Tidak).

  1. Lakukan estimasi regresi berganda.
  2. Uji asumsi klasik (normalitas, heteroskedastisitas, dan multikolinieritas
  3. Interpretasikan hasilnya.

Kasus 3: Prediksi Adopsi Aplikasi Mobile Banking

Menganalisis faktor-faktor yang mendorong nasabah untuk mengadopsi (PAKAI_MBANKING=1) atau tidak mengadopsi (PAKAI_MBANKING=0) aplikasi mobile banking.
Variabel Dependen (Y):
PAKAI_MBANKING (1=Pakai, 0=Tidak Pakai)
Variabel Independen (X):
USIA: Usia nasabah (dalam tahun).
TINGKAT_PENDIDIKAN: Tingkat pendidikan (1=SMA/Sederajat, 2=Diploma, 3=Sarjana, 4=Pascasarjana).
LITERASI_DIGITAL: Skor literasi digital nasabah (skala 1-10).
KEPERCAYAAN_KEAMANAN: Skor kepercayaan terhadap keamanan digital (skala 1-10).

  1. Lakukan estimasi regresi berganda.
  2. Uji asumsi klasik (normalitas, heteroskedastisitas, dan multikolinieritas
  3. Interpretasikan hasilnya.

Pertemuan 10

flowchart TD B{"Cek Variabel Dependen (Y)"}; B --> C{"Y Kontinu? (Mis: Rupiah, KG)"}; C -- Ya --> D[Gunakan OLS / Regresi Linear]; C -- Tidak --> E{Y Kategorikal?}; E -- Ya --> F{Berapa Kategori?}; F -- "2 Kategori (Mis: Ya/Tidak)" --> G[Gunakan Binary Logit / Probit]; F -- 3+ Kategori --> H{Apakah Kategori Punya Urutan?}; H -- Ya (Mis: Jelek, Cukup, Bagus) --> I["Gunakan Model ORDINAL (Ordered Logit/Probit)"]; H -- "Tidak (Mis: Mobil, Motor, Bus)" --> J["Gunakan Model MULTINOMIAL (MNL)"];

Membedah Model Multinomial dan Ordinal Logit

Dalam ekonometrika, kita sering berhadapan dengan variabel dependen (Y) yang bukan angka kontinu. Ketika Y adalah sebuah pilihan dari beberapa kategori, kita tidak bisa menggunakan OLS biasa. Di sinilah Model Multinomial dan Ordinal berperan.

1. Model Multinomial Logit (MNL)

Digunakan ketika Y memiliki 3+ kategori yang tidak berperingkat (unordered).

Contoh: Pilihan moda transportasi (Mobil, Motor, Bus), pilihan karier (Swasta, PNS, Wirausaha).

Model ini menghitung probabilitas individu i memilih alternatif j, berdasarkan serangkaian variabel independen $X_i$. Model ini mengasumsikan satu kategori sebagai "base" (referensi).

Probabilitas pilihan j adalah:

$$ P(Y_i=j | X_i) = \frac{e^{\beta_j'X_i}}{\sum_{k=1}^J e^{\beta_k'X_i}} $$

Dimana $J$ adalah jumlah total kategori.

2. Model Ordinal Logit (OL)

Digunakan ketika Y memiliki 3+ kategori yang berperingkat (ordered).

Contoh: Rating kepuasan (Buruk, Cukup, Baik), Peringkat kredit (C, B, A, AA).

Model ini bekerja dengan mengestimasi sebuah variabel laten (tidak teramati), $Y^*$, yang bergantung pada $X_i$.

$$ Y_i^* = \beta'X_i + \epsilon_i $$

Kita tidak mengamati $Y^*$, tapi kita mengamati $Y$ (kategori) melalui "cut-points" atau thresholds ($\mu$):

  • $Y_i = 1$ (Mis: Buruk) jika $Y_i^* \le \mu_1$
  • $Y_i = 2$ (Mis: Cukup) jika $\mu_1 < Y_i^* \le \mu_2$
  • $Y_i = 3$ (Mis: Baik) jika $Y_i^* > \mu_2$

Model Ordinal Logit mengestimasi koefisien $\beta$ dan titik potong $\mu$ secara bersamaan.

Langkah-Langkah Analisis Umum

  1. Identifikasi Y: Tentukan apakah Y Anda kategorikal.
  2. Cek Urutan: Apakah kategorinya berperingkat (Ordinal) atau hanya pilihan (Multinomial)?
  3. Spesifikasi Model: Tentukan variabel independen (X) yang relevan.
  4. Estimasi Model: Gunakan Eviews atau software statistik lain (Metode: ORDERED untuk Ordinal, LOGIT/MNL untuk Multinomial).
  5. Interpretasi:
    Peringatan: Koefisien $\beta$ dalam model Logit (MNL/Ordinal) TIDAK dapat diinterpretasikan secara langsung sebagai "jika X naik 1 unit, Y naik $\beta$ unit".

    Interpretasi harus melalui:

    • Odds Ratios (OR): $OR = e^\beta$. (Seberapa besar perubahan odds jika X naik 1 unit).
    • Marginal Effects (ME): (Seberapa besar perubahan probabilitas jika X naik 1 unit). Ini adalah cara interpretasi yang paling intuitif.

Kasus 1: Model Ordinal (Kepuasan Layanan Bank)

Y (Dependen): Kepuasan (1 = Sangat Tidak Puas, 2 = Netral, 3 = Puas)
X1 (Independen): Kecepatan (Waktu tunggu dalam menit)
X2 (Independen): Staf_Ramah (Skor 1-10)
X3 (Independen): Digital_App (1 = Sering Pakai, 0 = Jarang/Tidak)

Kasus 2: Model Multinomial (Pilihan Transportasi Kerja)

Y (Dependen): Transport (Mobil, Motor, Umum) -> Harus dalam format Teks/Alpha di Eviews
X1 (Independen): Waktu_Tempuh (Menit)
X2 (Independen): Biaya (Ribu Rupiah per hari)
X3 (Independen): Jarak_KM (Jarak rumah ke kantor)

Kasus 3: Model Ordinal (Rating Risiko Kredit UMKM)

Y (Dependen): Rating (1=Tinggi, 2=Sedang, 3=Rendah)
X1 (Independen): DER (Debt to Equity Ratio)
X2 (Independen): Laba_Bersih (Juta Rupiah)
X3 (Independen): Lama_Usaha (Tahun)

Pertemuan 11

flowchart TD A[Mulai: Identifikasi Masalah & Variabel Y] --> B{Apa Sifat Variabel Y?}; B -- "Y = Hitungan (0, 1, 2, 3...)" --> D[Model Count Data]; B -- "Y = Kontinu, tapi Terbatas" --> E[Model LDV]; E -- "Y tersensor di 0 (banyak data 0)" --> F[Model Tobit]; E -- "Y terpotong (data 0 hilang)" --> G[Model Truncated]; D --> H{Apakah Mean ≈ Varians?}; H -- Ya --> I[Regresi Poisson]; H -- "Tidak (Overdispersion)" --> J["Negative Binomial (NB) / ZIP"]; K["Proses Estimasi (MLE)"]; I --> K; F --> K; J --> K; G --> K; K --> O["Selesai: Kesimpulan & Rekomendasi"];

1. Model Tobit (Censored Regression)

Analogi: Sumbangan Amal

Bayangkan Anda meneliti faktor apa yang memengaruhi jumlah sumbangan amal seseorang (Y). Anda mengumpulkan data pendapatan (X1), usia (X2), dan tingkat religiusitas (X3).

Masalahnya: Banyak orang memilih untuk tidak menyumbang sama sekali (Y=0). Data Anda akan "menggumpal" di angka nol. Jika Anda pakai OLS biasa, OLS akan kesulitan memahami data ini karena OLS mengasumsikan Y bisa bernilai negatif (padahal sumbangan tidak mungkin negatif).

Model Tobit adalah solusinya. Model ini memahami bahwa ada dua proses yang terjadi:

  1. Keputusan untuk menyumbang (atau tidak).
  2. Keputusan berapa banyak harus menyumbang (jika memutuskan untuk menyumbang).

Model Tobit menangani data yang "tersensor" (censored) atau terpotong pada nilai tertentu (dalam kasus ini, 0).

Kapan Digunakan?

Gunakan Model Tobit ketika variabel dependen (Y) Anda memiliki nilai batas (lantai atau langit-langit) di mana data terkonsentrasi. Contoh: Pengeluaran R&D (banyak perusahaan 0), jam kerja (banyak orang 0), atau skor tes (ada nilai maksimal 100).

Formula

Model Tobit mengasumsikan ada variabel laten (tidak teramati) $Y^*$: $$ Y_i^* = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \beta_3 X_{3i} + \epsilon_i $$ Namun, yang kita amati adalah $Y_i$: $$ Y_i = \begin{cases} Y_i^* & \text{jika } Y_i^* > L \\ L & \text{jika } Y_i^* \le L \end{cases} $$ Di mana $L$ adalah batas sensor (misalnya $L=0$).

Langkah-langkah Analisis di EViews

  1. Import Data: Masukkan data Anda (Y, X1, X2, X3) ke EViews.
  2. Buka Persamaan: Klik Quick > Estimate Equation...
  3. Pilih Metode: Di dialog 'Equation Estimation', ganti Method dari LS (Least Squares) menjadi TOBIT (Censored/Truncated).
  4. Tentukan Batas Sensor: Akan muncul opsi 'Censoring'. Jika data Anda tersensor di nol (paling umum), biarkan 'Left' = 0 dan 'Right' = NA (Not Available/Tidak Ada).
  5. Tulis Persamaan: Di kotak 'Equation Specification', ketik variabel Anda. Contoh: Y C X1 X2 X3 (C adalah konstanta/intersep).
  6. Estimasi: Klik OK.
  7. Interpretasi: Lihat output. Koefisien yang ditampilkan adalah untuk variabel laten $Y^*$. Untuk interpretasi yang lebih mudah (marginal effects), Anda mungkin perlu ke menu View > Marginal Effects setelah estimasi.

2. Regresi Poisson (Poisson Regression)

Analogi: Antrian Teller Bank

Bayangkan Anda seorang manajer bank yang ingin memprediksi jumlah pelanggan (Y) yang datang ke teller setiap jam. Anda tahu Y adalah "data hitungan" (count data): bisa 0, 1, 2, 10, tapi tidak mungkin 2.5 atau negatif.

Anda ingin tahu apakah jumlah kedatangan dipengaruhi oleh jam sibuk (X1), hari (X2=1 jika weekend, 0 jika weekday), dan jumlah promo (X3).

OLS tidak cocok karena OLS bisa memprediksi Y = -1 pelanggan, yang tidak masuk akal. Regresi Poisson dirancang khusus untuk memodelkan data hitungan (non-negatif, integer).

Kapan Digunakan?

Gunakan Regresi Poisson ketika variabel dependen (Y) Anda adalah data hitungan (count) dari suatu kejadian dalam interval waktu atau ruang tertentu. Contoh: Jumlah klaim asuransi per tahun, jumlah gol dalam pertandingan, jumlah cacat produksi per batch.

Formula

Regresi Poisson mengasumsikan Y mengikuti distribusi Poisson. Probabilitas Y mengambil nilai $y_i$ adalah: $$ P(Y_i = y_i | X_i) = \frac{e^{-\lambda_i} \lambda_i^{y_i}}{y_i!} $$ Di mana $\lambda_i$ (lambda) adalah rata-rata (mean) dan varians dari kejadian, yang dipengaruhi oleh variabel X: $$ \ln(\lambda_i) = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \beta_3 X_{3i} $$ Kita menggunakan $\ln(\lambda_i)$ (log-link) untuk memastikan $\lambda_i$ selalu positif.

Langkah-langkah Analisis di EViews

  1. Import Data: Masukkan data hitungan Anda (Y) dan variabel independen (X1, X2, X3).
  2. Buka Persamaan: Klik Quick > Estimate Equation...
  3. Pilih Metode: Di dialog 'Equation Estimation', ganti Method dari LS menjadi COUNT (Integer Count Data).
  4. Tentukan Distribusi: Di bawah opsi 'Count Data', pastikan Distribution diatur ke Poisson. (Jika Anda mencurigai overdispersion—varians jauh lebih besar dari mean—Anda bisa memilih Negative Binomial).
  5. Tulis Persamaan: Di kotak 'Specification', ketik: Y C X1 X2 X3.
  6. Estimasi: Klik OK.
  7. Interpretasi: Koefisien $\beta$ menunjukkan perubahan dalam $\ln(\lambda_i)$. Untuk interpretasi yang lebih mudah, lihat nilai $e^\beta$ (exponentiated coefficient). Jika $\beta_1 = 0.1$, maka $e^{0.1} \approx 1.105$. Artinya, kenaikan 1 unit X1 akan meningkatkan jumlah Y (hitungan) sekitar 10.5%, dengan asumsi variabel lain konstan.

Contoh Kasus dan Data Simulasi (Regresi Terpotong)

Kasus 1: Pengeluaran R&D Perusahaan

  • Y (Dependen): RND (Pengeluaran R&D, jutaan USD; tersensor di 0)
  • X1 (Independen): PROFIT (Keuntungan perusahaan, jutaan USD)
  • X2 (Independen): ASET (Total aset, miliaran USD)
  • X3 (Independen): PATEN (Jumlah paten tahun lalu)
Download Data R&D (N=50)

Kasus 2: Jam Kerja Karyawan

  • Y (Dependen): JAM_KERJA (Jam kerja per minggu; tersensor di 0 bagi yang tidak bekerja)
  • X1 (Independen): PENDIDIKAN (Tahun pendidikan)
  • X2 (Independen): ANAK_BALITA (Jumlah anak di bawah 5 tahun)
  • X3 (Independen): INCOME_SUAMI (Pendapatan pasangan, jutaan IDR/bulan)
Download Data Jam Kerja (N=50)

Kasus 3: Pembelian Polis Asuransi

  • Y (Dependen): PREMI (Jumlah premi asuransi jiwa yang dibeli per tahun, jutaan IDR; tersensor di 0)
  • X1 (Independen): PENDAPATAN (Pendapatan tahunan, jutaan IDR)
  • X2 (Independen): USIA (Usia nasabah)
  • X3 (Independen): LITERASI_KEU (Skor literasi keuangan, 0-100)
Download Data Asuransi (N=50)

Contoh Kasus dan Data Simulasi (Regresi Poisson)

Kasus 1: Jumlah Klaim Asuransi Mobil

  • Y (Dependen): JML_KLAIM (Jumlah klaim dalam 1 tahun; 0, 1, 2, ...)
  • X1 (Independen): USIA (Usia pengemudi)
  • X2 (Independen): PENGALAMAN (Pengalaman mengemudi, tahun)
  • X3 (Independen): TIPE_MOBIL (1=Sport, 0=Keluarga)
Download Data Klaim (N=50)

Kasus 2: Jumlah Pelanggan Restoran

  • Y (Dependen): PELANGGAN (Jumlah pelanggan per jam)
  • X1 (Independen): JAM_SIBUK (1=Makan Siang/Malam, 0=Lainnya)
  • X2 (Independen): WEEKEND (1=Ya, 0=Tidak)
  • X3 (Independen): JML_PROMO (Jumlah promosi aktif)
Download Data Restoran (N=50)

Kasus 3: Jumlah Cacat Produksi

  • Y (Dependen): CACAT (Jumlah cacat produksi per batch)
  • X1 (Independen): KEC_MESIN (Kecepatan mesin, RPM)
  • X2 (Independen): USIA_MESIN (Usia mesin, bulan)
  • X3 (Independen): SUHU (Suhu ruangan, Celcius)
Download Data Cacat Produksi (N=50)

Pertemuan 12

flowchart TD A[Mulai: Plot Data Mentah] --> B{Apakah Visual Stabil?} B -- Tidak (Ada Tren) --> C[Uji Akar Unit / Unit Root Test] B -- Ya --> D[Identifikasi Model AR/MA] C --> E{Prob < 0.05?} E -- Tidak (Tidak Stasioner) --> F[Lakukan Turunan Pertama / 1st Difference] F --> C E -- Ya (Stasioner) --> D D --> G[Estimasi Model ARIMA] G --> H[Uji Diagnostik Residual] H --> I{Residual White Noise?} I -- Tidak (Masih ada pola) --> D I -- Ya (Acak sempurna) --> J[Peramalan / Forecasting] J --> K[Selesai]

Pengantar Analisis Deret Waktu (Time Series)

Dalam ekonometrika, data deret waktu adalah sekumpulan observasi pada variabel nilai yang diambil pada waktu yang berbeda. Tantangan utamanya adalah autokorelasi, di mana masa lalu mempengaruhi masa kini.

1. Konsep Stasioneritas

Agar model valid, data harus stasioner. Artinya, rata-rata dan variansnya konstan sepanjang waktu. Secara matematis, proses stasioner \( Y_t \) memenuhi:

$$ E(Y_t) = \mu $$ $$ Var(Y_t) = \sigma^2 $$ $$ Cov(Y_t, Y_{t+k}) = \gamma_k $$

2. Model ARIMA (Box-Jenkins)

Model umum yang sering digunakan adalah ARIMA(p,d,q). Jika kita mengambil contoh model AR(1) atau Autoregressive Order 1, persamaannya adalah:

$$ Y_t = \beta_0 + \beta_1 Y_{t-1} + \epsilon_t $$

Dimana \( \epsilon_t \) adalah white noise (error acak) yang diasumsikan berdistribusi normal \( N(0, \sigma^2) \).

3. Langkah Estimasi di EViews

Setelah memastikan data stasioner (misalnya pada tingkat level), kita dapat melakukan estimasi persamaan. Berikut adalah perintah dasar pada command window EViews:

ls variabel_y c ar(1) ma(1)

Kasus 1: Inflasi (Trend Deterministik)

Kondisi: Data cenderung naik terus menerus seiring waktu (misal: IHK). Analisis: Butuh Detrending atau Differencing.

Kasus 2: Harga Saham (Random Walk)

Kondisi: Pergerakan acak, sulit ditebak, volatilitas tinggi. Analisis: Seringkali tidak stasioner di level, butuh log-return.

Kasus 3: Pertumbuhan Ekonomi (Siklus/Cyclical)

Kondisi: Gelombang naik turun tapi periodenya tidak tetap (Boom & Bust). Analisis: Identifikasi titik balik (turning points).

Kasus 4: Nilai Tukar (Structural Break)

Kondisi: Stabil, lalu tiba-tiba melonjak karena krisis/kebijakan, lalu stabil di level baru. Analisis: Perlu uji Chow Test atau Dummy Variable.

Pertemuan 13

Pertemuan 14

Pertemuan 15

Pertemuan 16

Ketentuan UAS

  1. Pembagian soal UAS sesuai kelompok yang ada pada .
  2. UAS harus dikumpulkan saat minggu UAS pada link ini .
  3. Buatlah google form sesuai indikator variable pada pembagian soal UAS dengan menambahkan isian nama dan NIM responden.
  4. Bagikan google form kepada teman seangkatan dan kumpulkan 100 data mahasiswa.
  5. Pelajari tentang deskripsi data dan skala likert.
  6. Olah data menggunakan regresi linier yang sesuai.
  7. Analisis data sesuai dengan materi yang telah diberikan di kelas.
  8. Simpulkan dan berikan saran yang sesuai.

Daftar Hadir dan Nilai

Daftar Nilai ES5A

Loading...