Disesuaikan R kuadrat (Koefisien determinasi yang disesuaikan): Rumus koefisien determinasi yang disesuaikan

Adjusted R squared (atau koefisien determinasi yang disesuaikan) digunakan dalam regresi berganda untuk melihat tingkat intensitas atau efektivitas yang dimiliki variabel independen dalam menjelaskan variabel dependen.

Dengan kata yang lebih sederhana, R kuadrat yang disesuaikan memberi tahu kita berapa persentase variasi variabel dependen yang secara kolektif dijelaskan oleh semua variabel independen.

Penggunaan koefisien ini dibenarkan karena ketika kita menambahkan variabel ke dalam regresi , koefisien penyesuaian tanpa penyesuaian cenderung meningkat. Bahkan ketika kontribusi marjinal dari masing-masing variabel baru yang ditambahkan tidak relevan secara statistik.

Oleh karena itu, ketika menambahkan variabel ke model, koefisien determinasi dapat meningkat dan kita dapat berpikir, secara keliru, bahwa kumpulan variabel yang dipilih mampu menjelaskan sebagian besar variasi variabel bebas. Masalah ini umumnya dikenal sebagai “model overestimasi”.

Rumus koefisien determinasi yang disesuaikan

Untuk mengatasi masalah yang dijelaskan di atas, banyak peneliti menyarankan untuk menyesuaikan koefisien determinasi menggunakan rumus berikut:

R 2 a → R kuadrat disesuaikan atau koefisien determinasi disesuaikan

R 2 → R kuadrat atau koefisien determinasi

n → Jumlah pengamatan dalam sampel

k → Jumlah variabel bebas

Mempertimbangkan bahwa 1-R 2 adalah bilangan konstan dan bahwa n lebih besar dari k, saat kita menambahkan variabel ke model, hasil bagi dalam tanda kurung menjadi lebih besar. Akibatnya. juga hasil mengalikannya dengan 1-R 2 . Dengannya kita melihat bahwa formula dibangun untuk menyesuaikan dan menghukum dimasukkannya koefisien dalam model.

Selain keunggulan sebelumnya, penyesuaian yang digunakan pada rumus sebelumnya juga memungkinkan kita untuk membandingkan model dengan jumlah variabel bebas yang berbeda. Sekali lagi, rumus menyesuaikan jumlah variabel antara satu model dan model lainnya dan memungkinkan kita untuk membuat perbandingan yang homogen.

Kembali ke rumus sebelumnya, kita dapat menyimpulkan bahwa koefisien determinasi yang disesuaikan akan selalu sama dengan atau lebih kecil dari koefisien R 2 . Berbeda dengan koefisien determinasi yang bervariasi antara 0 dan 1, koefisien determinasi yang disesuaikan bisa negatif karena 2 alasan:

  • Semakin dekat ka n mendekat.
  • Semakin rendah koefisien determinasi