Расчет коэффициентов множественной линейной регрессии.
Общее задание 1. Построить уравнение линейной регрессии Y на x1;x2;y. 2. Проверить значимость параметров регрессии с помощью t-теста. 3. Построить доверительные интервалы для параметров регрессии. 4. Проверить статистическую значимость уравнения регрессии с помощью f-теста. 5. Исследовать с помощью теста ранговой корреляции Спирмена на гетероскелатичность. 6. Проверить модель на наличие автокорреляции остатков по критерию Дирбина-Уотсона. Билет В таблице содержатся данные 1991-2000 гг. об объеме продаж электроэнергии в Мвт * r(y) в зависимости от длины линии электропередач в 10 тыс. км (x1) и кол-ва потребителей энергии в 100 тыс. (x2): Y 3,2 3,3 3,4 3,5 3,6 3,6 3,7 3,8 3,9 4,0 X1 1,2 1,3 1,3 1,4 1,4 1,5 1,5 1,6 1,6 1,7 X2 3,6 3,7 3,8 3,8 3,9 3,9 4,0 4,0 4,1 4,2 РЕШЕНИЕ: 1. На любой экономический показатель чаще всего оказывает влияние не один, а несколько факторов. В этом случае вместо парной регрессии рассматривается множественная регрессия Задача оценки статистической взаимосвязи переменных и формулируется аналогично случаю парной регрессии. Уравнение множественной регрессии может быть представлено в виде: , где – вектор независимых (объясняющих) переменных; – вектор параметров (подлежащих определению); – случайная ошибка (отклонение); – зависимая (объясняемая) переменная. Рассмотрим самую употребляемую и наиболее простую из моделей множественной регрессии – модель множественной линейной регрессии. Теоретическое линейное уравнение регрессии имеет вид: или для индивидуальных наблюдений : . Здесь – вектор размерности неизвестных параметров. называется -тым теоретическим коэффициентом регрессии (частичным коэффициентом регрессии). Он характеризует чувствительность величины к изменению величины , т.е. отражает влияние на условное математическое ожидание зависимой переменной объясняющей переменной при условии, что все другие объясняющие переменные модели остаются постоянными. – свободный член, определяющий в случае, когда все объясняющие переменные равны нулю. После выбора линейной функции в качестве модели зависимости необходимо оценить параметры регрессии. Пусть имеется наблюдений вектора объясняющих переменных и зависимой переменной : . Для того чтобы однозначно можно было решить задачу нахождения параметров (т.е. найти некоторый наилучший вектор ), должно выполняться неравенство . Если это неравенство не будет выполняться, то существует бесконечно много различных векторов параметров, при которых линейная формула связи между и будет абсолютно точно соответствовать имеющимся наблюдениям. Например, для однозначного определения оценок параметров уравнения регрессии достаточно иметь выборку из трех наблюдений . В этом случае найденные значения параметров определяют такую плоскость в трехмерном пространстве, которая пройдет именно через три точки. С другой стороны, добавление в выборку к имеющимся трем наблюдениям еще одного приведет к тому, что четвертая точка практически наверняка будет лежать вне построенной плоскости, что потребует определенной переоценки параметров. Число называется числом степеней свободы. Если число степеней свободы невелико, то статистическая надежность оцениваемой формулы невысока. Например, вероятность верного вывода (получения более точных оценок) по трем наблюдениям существенно ниже, чем по тридцати. Считается, что при оценивании множественной линейной регрессии для обеспечения статистической надежности требуется, чтобы число наблюдений по крайней мере в три раза превосходило число оцениваемых параметров. нет нет Похожие работы:
Поделитесь этой записью или добавьте в закладки |