Раскрываем понятие коэффициента детерминации

Существуют математические модели, где учитывается взаимодействия различных переменных.

Они могут быть зависимыми и независимыми. Чтобы определить степень взаимодействия между параметрами, выяснить процент вариантов, которые модель может объяснить, используют коэффициент детерминации.

Особенности параметра

Данный показатель имеет буквенно-цифровое обозначение R2. Произносится в русском языке «ЭР-квадрат». Это связано с тем, что показатель детерминации является квадратом другого коэффициента — корреляции. Последний параметр обозначает, как связаны переменные данные или измерения.

Сам же показатель соотношения (корреляции) является параметром дисперсии или разброса результативных признаков вследствие влияния независимых переменных.
Данный показатель R2 (детерминации) описывает связи между зависимыми и независимыми переменными. Он определяет, какую долю вариаций может объяснить.
Коэффициент детерминации является универсальным средством, используется в различных науках. Показатель укладывается в диапазон значений от 0 до 1, где цифра 1 будет обозначать 100% вариаций. В физике он может превышать 0,9, то есть быть близким к эмпирическим наблюдениям, в биологии ниже – составлять 0,7 — 0,8, в общественных науках не превышать 0,5.

Данный параметр является также квадратом корреляции Пирсона между двумя переменными. Он выражает величину дисперсий между изменяющимися величинами. Если имеется парная регрессионная модель то формула имеет вид R 2 = r 2, где коэффициент детерминации равняется квадрату коэффициента корреляции.

Качественная оценка степени связи

Показатель соотношения детерминации можно перевести в качество связи между зависимыми и независимыми переменными. Для этого используется шкала Чеддока, где имеются следующие диапазоны параметров:

  1. При мере тесноты связи в 0,1 – 0,3 качество определяется как слабое.
  2. Для диапазона от 0,3 до 0,5 параметр характеризуется как умеренный.
  3. Показатель 0,5 – 0,7 имеет определение заметного.
  4. Связь с показателем 0,7 – 0,9 является высокой.
  5. Свыше 0,9 – очень высокой.

Если показатель коэффициента детерминации составляет 1, то говорят о возникновении функциональной связи. Для параметра ниже 0,7, значение выявленных связей будет меньше 50%, то есть неучтенные факторы будут оказывать влияние больше, чем выявленные. Поэтому регрессионные модели, построенные с такими показателем коэффициента детерминации будут слабыми, их не стоит применять для практического анализа.