< Попередня  Змiст  Наступна >

7.4. РЕГРЕСІЯ НА ГРУПУВАННЯХ


Модель зі структурними змінними і змінними взаємодії можна застосувати до комбінаційних групувань. Традиційно для аналізу взаємозв’язків за даними комбінаційних групувань використовується модель дисперсійного аналізу Аnova/Manova. Основне завдання дисперсійного аналізу — виявити джерела варіації, а дисперсійні комплекси орієнтовані переважно на обробку даних запланованих експериментів з однаковими частотами груп і підгруп. У соціально-економічних дослідженнях будь-яке комбінаційне групування є результатом статистичного спостереження, тобто незапланованого експерименту, тож забезпечити однакові частоти груп і підгруп практично неможливо. У такому разі перевагу віддають моделям множинної лінійної регресії. Особливості застосування регресії до задач дисперсійного аналізу розглянемо на прикладі двофакторної класифікації (фактори А і В).

У регресійній моделі, як і в дисперсійному аналізі, значення i-ї ознаки у h-ї одиниці сукупності, яка належить до j-ї групи, подається сумою загальної середде e ijh — залишок; і — рівень фактора А; j — рівень фактора В.

ньої µ, ефекту кожного фактора (а i + b j ) та ефектів їх взаємодії (ab) ij : ньої µ, ефекту кожного фактора (а i + b j ) та ефектів їх взаємодії (ab) ij : Y ijh = µ + а i + b j + (ab) ij + e ijh , Y ijh = µ + а i + b j + (ab) ij + e ijh ,

Щоб забезпечити однозначність МНК-оцінок параметрів моделі формулюються додаткові обмеження:

На основі введених обмежень можна подати одні ефекти моделі як лінійну комбінацію інших і записати модель з мінімальною кількістю ефектів. Наприклад, за фактором А виділено три групи, за фактором В

— дві. Тоді в моделі, окрім ефектів факторів (а

1 , а

2 , а

3 , b

1 , b

2 ), необхідно врахувати шість ефектів взаємодії: (ab)

11 ,(ab)

12 ,(ab)

21 , (ab)

22 ,(ab)

31 ,(ab)

32 . Сформулюємо додаткові обмеження для зазначених ефектів моделі:

Визначальними виявляються параметри: µ , а

Визначальними виявляються параметри: µ , а

1 , а

2 , b

1 , (ab)

21 . Це мінімальна їх кількість, і модель з цими параметрами записується так: робітних: А

11 і(ab)

Y = µ + а

1 х

1 + а

2 х

2 + b

1 х

3 + (ab)

11 х

4 + (ab)

21 х

5 .

Порядок формування файлу первинних даних розглянемо на прикладі моделі тривалості перерви в роботі безробітних (n = 12). Фактор А — вікова група безY = µ + а

1 х

1 + а

2 х

2 + b

1 х

3 + (ab)

11 х

4 + (ab)

21 х

5 .

Порядок формування файлу первинних даних розглянемо на прикладі моделі тривалості перерви в роботі безробітних (n = 12). Фактор А — вікова група без

1 — до 30 років; А

2 — від 30 до 50; А

3 — 50 років і старше. Фактор В

— стать безробітного: В

1 —чоловіки; В

— жінки. У табл. 7.11 належність безробітного до відповідної підгрупи за цими факторами вказується подвійним ін

2

Таблиця 7.11

Таблиця 7.11

ФАЙЛ ПЕРВИННИХ ДАНИХ МОДЕЛІ

11 4 1 0

Ознакова множина моделі Х є матрицею коефіцієнтів при відповідних ефектах впливу факторів та ефектах їхньої взаємодії. Так, х

1 ,

1 відповідає ефекту а

тому х

1 = 1 для першої вікової групи, х

1 = 0 для другої вікової групи, а оскільки а

1 + а

2 + а

3 = 0, то для третьої вікової групи х

1 = -1. Аналогічно визначається вектор х

2 , який відповідає ефекту а

2 . Вектор х

3 стосується ефекту b

1 . Вважаючи, що х

3 = 1 для чоловіків, маємо х

3 = –1 для жінок. Вектори х

4 та х

5 належать до ефектів взаємодії. а

1 + а

2 + а

3 = 0, то для третьої вікової групи х

1 = -1. Аналогічно визначається вектор х

2 , який відповідає ефекту а

2 . Вектор х

3 стосується ефекту b

1 . Вважаючи, що х

3 = 1 для чоловіків, маємо х

3 = –1 для жінок. Вектори х

4 та х

5 належать до ефектів взаємодії. що х

3 = 1 для чоловіків, маємо х

3 = –1 для жінок. Вектори х

4 та х

5 належать до ефектів взаємодії.

тому х

1 = 1 для першої вікової групи, х

1 = 0 для другої вікової групи, а оскільки а

1 + а

2 + а

3 = 0, то для третьої вікової групи х

1 = -1. Аналогічно визначається вектор х

2 , який відповідає ефекту а

2 . Вектор х

3 стосується ефекту b

1 . Вважаючи, що х

3 = 1 для чоловіків, маємо х

3 = –1 для жінок. Вектори х

4 та х

5 належать до ефектів взаємодії.

До сформованого в такий спосіб файлу первинних даних застосуємо процедури модуля Multiple Regression. Параметри моделі наведено в табл. 7.12.

Таблиця 7.12

ПАРАМЕТРИ МОДЕЛІ НА ГРУПУВАННЯХ

Regression Summary for Dependent Variable: у
R= ,96 RІ= ,922 Adjusted RІ= ,857
F(5,6)=14,22 p<,0028 Std.Error of estimate: ,913
St. Err. St. Err.
BETA of BETA B of B t(6) p-level
Intercpt, µ 5,833 0,291 20,02 1,01E-06
х 1 –0,962 0,141 –2,583 0,378 –6,84 0,000
х 2 –0,027 0,143 –0,083 0,435 –0,19 0,854
х 3 –0,432 0,126 –1 0,291 –3,43 0,014
х 4 0,448 0,135 1,25 0,378 3,31 0,016
х 5 0,078 0,136 0,25 0,435 0,57 0,586

Істотними виявилися ефекти впливу першої групи фактора А (вік до 30 років) та першої градації фактора В (чоловіки), а також ефект взаємодії цих фактоів (ab)

11 . Якщо середня тривалість у роботі по сукупності в цілому становить 5,8 міс., то у віковій групі до 30 років цей показник на 2,6 міс. менший; на 1 міс. менша за середню тривалість перерви в роботі у чоловіків.

Зі збільшенням кількості факторів оцінка ефектів впливу кожного з них і усіх можливих взаємодій за розглянутою методикою значно ускладнюється. У такому разі ефективною виявляється модель з адитивними ефектами. Адитивність означає незалежність впливу одного фактора від рівня іншого. Забезпечити її можна стандартизацією комбінаційного групування, тобто заміною частот емпіричного розподілу частотами певного стандартного розподілу. Зважені за частотами стандартного розподілу середні j-ї групи за і-м фактором Y ij називаються стандартизованими, а відхилення цих середніх від загальної середньої

у

— стандартизованими (центрованими) ефектами а ij = Y ijу. Незсунені і з мінімальною дисперсією оцінки ефектів а ij дає стандартизація групувань методом найменших квадратів.у

— стандартизованими (центрованими) ефектами а ij = Y ijу. Незсунені і з мінімальною дисперсією оцінки ефектів а ij дає стандартизація групувань методом найменших квадратів.


< Попередня  Змiст  Наступна >
Iншi роздiли:
БАГАТОФАКТОРНІ ДИНАМІЧНІ МОДЕЛІ
8.2. МОДЕЛІ З ЛАГОВИМИ ЗМІННИМИ
8.3. НЕЛІНІЙНА РЕГРЕСІЯ НА ЧАСОВИХ РЯДАХ
Частина 1. 8.4. МОДЕЛЮВАННЯ НА ОСНОВІ ПАНЕЛЬНИХ ДАНИХ
Частина 2. 8.4. МОДЕЛЮВАННЯ НА ОСНОВІ ПАНЕЛЬНИХ ДАНИХ
Дисциплiни

Медичний довідник новиниКулінарний довідникАнглійська моваБанківська справаБухгалтерський облікЕкономікаМікроекономікаМакроекономікаЕтика та естетикаІнформатикаІсторіяМаркетингМенеджментПолітологіяПравоСтатистикаФілософіяФінанси

Бібліотека підручників та статтей Posibniki (2022)