Поле корреляции и линия регрессии:
Сначала построим поле корреляции точки с координатами (хi, уi), и принимая во внимание экономические соображения, по их расположению сформулируем предположение о связи Y и X.
Визуальный анализ полученного графика показывает, что точки поля корреляции располагаются вдоль некоторой воображаемой прямой линии, но не очень плотно, рассеиваясь около неё. Нельзя сказать, что прослеживается тесная зависимость, но можно заметить, что с увеличением среднемесячной номинальной начисленной зарплаты работающих в экономике Х наблюдается тенденция у населения регионов к увеличению среднедушевого размера вклада в Сбербанке РФ Y. Можно предположить, что связь среднемесячной номинальной начисленной зарплаты работающих в экономике и среднедушевого размера вклада в Сбербанке РФ положительная.
Это предположение проверим с помощью линейного коэффициента корреляции:
где - см. таблицу выше.
Линейная связь положительна, теснота связи сильная.
2) Линейная парная регрессионная модель
Предположим, что связь между количеством автомобилей и среднедушевыми доходами линейна, то есть эконометрическая модель для генеральной совокупности имеет линейный вид: , а значит, и для данной выборки модель также линейна: ; то есть решение сводится к нахождению линейного уравнения регрессии по выборке: . Таким образом, нужно найти коэффициенты регрессии b0, b1, являющиеся оценками параметров 0 и 1 линейной модели. Используя для этого классический подход, который основан на методе наименьших вадратов, приходим к системе нормальных уравнений:
.
Все необходимые числовые значения рассчитаны ранее (см. расчетную таблицу), подставим их в систему нормальных уравнений:
и решим её относительно b0, b1. Получим коэффициенты регрессии: b0=789,07 и b1= 0,083.
Итак, уравнение регрессии имеет вид: .
Коэффициент b0=789,07 можно формально интерпретировать как среднедушевой размер вклада в Сбербанке РФ при среднемесячной номинальной начисленной зарплате работающих в экономике, равной нулю, т.е. при х=0, понятно, что по смыслу задачи в данном случае b0 не имеет содержательной экономической интерпретации. А коэффициент b1= 0,036 показывает, что полученная линейная связь среднедушевого размера вклада в Сбербанке РФ и среднемесячной номинальной начисленной зарплаты работающих в экономике, положительная, то есть при увеличении на 1000 руб. в месяц среднемесячной номинальной начисленной зарплаты работающих в экономике среднедушевой размер вклада в Сбербанке РФ в регионе в среднем увеличивается на 0,083 тыс. руб. или на 83 руб.
ЗАДАНИЕ:
Представлены статистические данные о среднедушевом размере денежного вклада в Сбербанке РФ по регионам (результативный признак Y) и о среднемесячной номинальной начисленной заработной плате работающих в экономике, руб. (фактор Х) по 50 регионам РФ за 2000 год:
№
региона Регионы Среднедушевой размер вклада в Сбербанке РФ, руб. Среднемесячная номинальная начисленная зарплата работающих в экономике, руб.
22 Ханты-Мансийский а.о. 1472,5 8492,2
23 Эвенкийский а.о. 1152,9 3611,3
24 Ямало-Ненецкий а.о. 1472,5 8964,7
25 Алтайский край 862,9 1364,8
26 Краснодарский край 1209,5 1697,6
27 Красноярский край 1152,9 3451,7
28 Приморский край 1124,6 2383,2
29 Ставропольский край 779,5 1438,4
30 Хабаровский край 1221,2 2800,0
31 Амурская обл. 875,3 2232,2
32 Архангельская обл. 866,4 2542,2
33 Астраханская обл. 933,5 1898,7
34 Белгородская обл. 965,8 1717,0
35 Брянская обл. 662,3 1213,1
36 Владимирская обл. 846,0 1573,4
Требуется:
1) Кратко охарактеризовать данные выборки. Сделать предположение о наличии или отсутствии зависимости между Y и Х и провести его предварительный анализ (с помощью поля корреляции, коэффициента корреляции, а также на основе экономических соображений).
2) Построить уравнение линейной парной регрессии зависимости Y от Х по МНК. Пояснить экономический смысл его коэффициентов. Изобразить графически линию регрессии на одном графике с полем корреляции, сделать вывод.
3) Оценить тесноту линейной связи Y от Х с помощью коэффициентов корреляции и детерминации.
4) Рассчитать средний коэффициент эластичности и на его основе дать оценку силы связи Y и Х.
5) Оценить статистическую значимость коэффициентов регрессии и коэффициента корреляции на уровне значимости =0,05.
6) Построить доверительные интервалы для параметров линейной парной регрессии 0 и 1. Вывод.
7) Оценить статистическую надежность и качество полученного уравнения регрессии в целом с помощью Fкритерия Фишера и средней ошибки аппроксимации.
8) Рассчитать прогнозное значение результативного признака Y, если значение фактора будет равно максимальному из выборки х=хmax. Определить доверительный интервал прогноза для средних и для индивидуальных значений результативного признака Y с вероятностью =0,95.
Сделать общий вывод и анализ.
ЗАДАНИЕ:
Представлены статистические данные о среднедушевом размере денежного вклада в Сбербанке РФ по регионам (результативный признак Y) и о среднемесячной номинальной начисленной заработной плате работающих в экономике, руб. (фактор Х) по 50 регионам РФ за 2000 год:
№
региона Регионы Среднедушевой размер вклада в Сбербанке РФ, руб. Среднемесячная номинальная начисленная зарплата работающих в экономике, руб.
22 Ханты-Мансийский а.о. 1472,5 8492,2
23 Эвенкийский а.о. 1152,9 3611,3
24 Ямало-Ненецкий а.о. 1472,5 8964,7
25 Алтайский край 862,9 1364,8
26 Краснодарский край 1209,5 1697,6
27 Красноярский край 1152,9 3451,7
28 Приморский край 1124,6 2383,2
29 Ставропольский край 779,5 1438,4
30 Хабаровский край 1221,2 2800,0
31 Амурская обл. 875,3 2232,2
32 Архангельская обл. 866,4 2542,2
33 Астраханская обл. 933,5 1898,7
34 Белгородская обл. 965,8 1717,0
35 Брянская обл. 662,3 1213,1
36 Владимирская обл. 846,0 1573,4
Требуется:
1) Кратко охарактеризовать данные выборки. Сделать предположение о наличии или отсутствии зависимости между Y и Х и провести его предварительный анализ (с помощью поля корреляции, коэффициента корреляции, а также на основе экономических соображений).
2) Построить уравнение линейной парной регрессии зависимости Y от Х по МНК. Пояснить экономический смысл его коэффициентов. Изобразить графически линию регрессии на одном графике с полем корреляции, сделать вывод.
3) Оценить тесноту линейной связи Y от Х с помощью коэффициентов корреляции и детерминации.
4) Рассчитать средний коэффициент эластичности и на его основе дать оценку силы связи Y и Х.
5) Оценить статистическую значимость коэффициентов регрессии и коэффициента корреляции на уровне значимости =0,05.
6) Построить доверительные интервалы для параметров линейной парной регрессии 0 и 1. Вывод.
7) Оценить статистическую надежность и качество полученного уравнения регрессии в целом с помощью Fкритерия Фишера и средней ошибки аппроксимации.
8) Рассчитать прогнозное значение результативного признака Y, если значение фактора будет равно максимальному из выборки х=хmax. Определить доверительный интервал прогноза для средних и для индивидуальных начений результативного признака Y с вероятностью =0,95.
Сделать общий вывод и анализ.
ий уровень которого ;нормальности распределения остаточной компоненты по критерию с критическими уровнями 2,73,7;4)для оценки точности модели используйте среднеквадратическое отклонение и среднюю по
и доверительные интервалы для и на основании оценок и при уровне значимости α = 0,05.7. Вычислить коэффициент детерминации и оценить качество выбранного уравнения регрессии.Имеются данные по п
водную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.4. Рассчитать прогнозное значение результативного признака, если прогнозное значение фактора увеличится
Контрольная
2011
11
Волгоградский институт экономики, социологии и права
и на общий результат, которая затрудняет оценивание регрессионных параметров. Если регрессоры в модели связаны строгой функциональной зависимостью, то имеет место полная (совершенная) мультиколлинеарн
корреляции.Последовательное увеличение результативного признака от одной группы к другой свидетельствует о присутствии корреляционной связи между признаками. Эффект влияние на определяется отноше