Teori Singkat Regresi Linear Menurut Ilmu Statistika

Teori Singkat Regresi Linear Menurut Ilmu Statistika

Topic Progress:

Dalam Ilmu Statistika, regresi digunakan untuk menemukan asosiasi atau hubungan dari dua variabel kuantitatif. Variabel yang dimaksud adalah variabel bebas (explanatory variable), yaitu variabel yang mempengaruhi, dan yang lainnya yaitu variabel terikat (response variable), atau variabel yang perubahannya kita amati. Asosiasi yang dimaksud bisa positif, bisa negatif, atau bisa juga tidak ada asosiasi.

Untuk menggambarkan asosiasi dari dua variabel kuantitatif, biasanya digunakan diagram tebar (Scatterplot Diagram, lihat gambar). Ketika data pada diagram tebar ternyata diamati kira-kira persebarannya mendekati garis lurus, kedua variabel kita katakan memiliki hubungan yang linear. Seberapa kuat hubungan linear kedua variabel diukur oleh koefisien korelasi, r. Semakin dekat nilai r ke +1 atau -1, hubungan linear kedua variabel semakin kuat.

Hubungan kedua variabel juga dapat diukur dengan nilai r-squared (r2) atau kuadrat dari nilai korelasi. Nilai r-squared memiliki makna proporsi varian dari variabel terikat yang dapat dijelaskan melalui varian dari variabel bebas. Artinya, bila nilai r-squared adalah 0.968, maka 96.8% varian dari variabel terikat dapat dijelaskan melalui model regresi ($y = mx + c$).

Umumnya, dalam banyak perhitungan di Kimia (terutama olimpiade), ketika kita diminta untuk melakukan regresi, biasanya model yang diberikan akan memiliki nilai r-squared sangat mendekati 1 (misalnya 0.9999, 0.997, 0.989). Tidak ada standar baku nilai r-squared minimal yang dapat dibilang mendekati 1. Namun, bila data yang kita regresi nilai r-squared nya cukup jauh dari 1 (misal: 0.236, 0.877 0.455), hasil ini dapat menjadi indikator bahwa model regresi kita salah.

Gradien Garis (b) dan Perpotongan di Sumbu y (a)

Kegunaan utama melakukan regresi (terutama di olimpiade) adalah menemukan data gradien garis (b) dan perpotongan di sumbu y (a). Misal kita memiliki persamaan hubungan nilai konstanta kesetimbangan, K, dengan temperatur:

$\ln{K} = \frac{-\Delta H}{R} \frac{1}{T} + \frac{\Delta S}{R}$

Apabila kita memiliki data nilai K dengan suhu masing-masing, maka dengan meng-plot nilai $ln K$ terhadap $\frac{1}{T}$, kita akan mendapatkan garis lurus dengan nilai gradien garis, b, sama dengan nilai $\frac{-\Delta H}{R}$ dan perpotongan di sumbu y, a, sama dengan nilai $\frac{\Delta S}{R}$.

Sumber: Statistics: The Art and Science of Learning from Data (Agresti, Franklin, Klingenberg), Pearson, 2017