За допомогою dummy-змінних можна адаптувати регресійну модель до неоднорідної сукупності. Якщо неоднорідність проявляється розшаруванням сукупності на р ізольованих класів (груп), то кожен клас розглядається як градація номінальної ознаки і тим одиницям, що належать до j-го класу, приписутових ознак.
ється структурна змінна u j = 1, а тим, що не належать, u j = 0. Параметри при структурних змінних класів інтерпретуються так само, як і при градаціях тексється структурна змінна u j = 1, а тим, що не належать, u j = 0. Параметри при структурних змінних класів інтерпретуються так само, як і при градаціях текс
Специфіка моделювання процесів у неоднорідній сукупності зумовлена своєрідністю внутрішньокласової варіації та характером взаємозв’язків. Ефекти впливу того самого фактора х і на у за класами можуть істотно різнитися. Наприклад, у вугільній промисловості виділяються класи шахт за гірничо-геологічними умовами: потужністю та нахилом залягання пластів, їхньою газоносністю, глибиною розробки лав. Кожному типу цих природних умов відповідає певна технологічна схема і певний рівень механізації виробничих процесів. Вплив механізації на трудомісткість, скажімо, очисних робіт залежить від класу шахти. Залежність сили впливу одного фактора від рівня іншого називають взаємодією. У неоднорідних сукупностях йдеться про взаємодію факторів і специфічних умов окремих класів. Для цього використовують змінні взаємодії х і u j , значення яких дорівнює добутку значень відповідних ознак.
Отже, під час моделювання взаємозв’язків у неоднорідних сукупностях ознакова множина моделі охоплює, крім факторних ознак х і , два типи інструментальних змінних: dummy-змінні u j , які відображають особливості класів, і змінні взаємодії х і u j , що характеризують особливості взаємозв’язків в окремих класах. За рахунок цих змінних модель регресійного аналізу розширяється: m
1-p
== i jij
11 +++= jiijjjii uxcuaxbaY
0 ,???? == +++= i jij jiijjjii uxcuaxbaY
11
0 ,
де b i — характеризує чистий ефект впливу і-го фактора в середньому по сукупності; a j — показує відхилення середнього значення показника-функції в j-му класі від середнього його рівня в класі, узятому за базу порівняння; с ij — різниця ефектів впливу і-го фактора в j-му класі порівняно з середнім впливом у цілому по сукупності. Істотність параметрів a j і с ij свідчить про неоднорідність сукупності.
У моделі такого типу поєднуються регресія на факторних ознаках метричної шкали та модель дисперсійного аналізу міжкласових відмінностей. Вона уможливлює одночасну оцінку кількох рівнянь, і така оцінка може бути більш точною, ніж оцінки покласових регресій.
Як приклад розглянемо модель продуктивності праці робітників очисних вибоїв за даними 21 шахти, серед яких за гірничо-геологічними умовами 12 належать до першого класу (пологі пласти), 9
— до другого класу (круто падаючі пласти). Акцентуючи увагу на особливостях коваріаційної моделі, обмежимося одним фактором — швидкістю просування лави. Первинні дані наведено в табл. 7.5.
Таблиця 7.5
МАТРИЦЯ ПЕРВИННИХ ДАНИХ ACOV-МОДЕЛІ НА ГРУПУВАННЯХ
Перший клас (u 1 = 1) |
Другий клас (u 1 = 0) |
Номер шахти |
Швидкість просування лави, м за місяць |
Продуктивність праці, т за місяць |
Номер шахти |
Швидкість просування лави, м за місяць |
Продуктивність праці, т за місяць |
1 |
46 |
139 |
1 |
36 |
129 |
2 |
64 |
183 |
2 |
28 |
104 |
3 |
48 |
165 |
3 |
43 |
132 |
4 |
62 |
175 |
4 |
25 |
106 |
5 |
41 |
147 |
5 |
30 |
128 |
6 |
76 |
192 |
6 |
32 |
98 |
7 |
57 |
149 |
7 |
21 |
83 |
8 |
65 |
158 |
8 |
17 |
76 |
9 |
87 |
190 |
9 |
29 |
117 |
10 |
80 |
175 |
|
|
|
11 |
48 |
153 |
|
|
|
12 |
82 |
198 |
|
|
|
Модель має вигляд Y = a
0 + b
1 x
1 + a
1 u
1 + c
11 x
1 u
1 .
Графічно модель можна подати у вигляді двох прямих, які відображають за
Модель має вигляд Y = a
0 + b
1 x
1 + a
1 u
1 + c
11 x
1 u
1 .
Графічно модель можна подати у вигляді двох прямих, які відображають за
лежність продуктивності праці в різних класах шахт. Оскільки параметри цих
прямих різняться, вони мають різний нахил і перетинають вісь ординат у різних точках (рис. 7.9). а
Рис. 7.9. Схематичний приклад специфікації ACOV-моделі
Параметри моделі наведено в табл. 7.6. Коефіцієнт детермінації свідчить, що 92,1 % варіації продуктивності праці робітників очисних вибоїв (Var1) пояснюється класом шахт (Var3) і швидкістю просування лави (Var2). Адекватність моделі підтверджують значення F-критерію і p-level, істотність впливу факторів — характеристики t-критерію.
Таблиця 7.6
ПАРАМЕТРИ ACOV-МОДЕЛІ НА ГРУПУВАННЯХ
Regression Summary for Dependent Variable: Var1 |
|
R= ,96 RІ= ,921 Adjusted RІ= ,907 |
|
|
F(3,17)=66,4 p<,000 Std.Error of estimate: 11,05 |
|
|
|
|
St. Err. |
|
St. Err. |
|
|
|
BETA |
of BETA |
B |
of B |
t(17) |
p-level |
Intercеpt |
|
|
43,525 |
15,078 |
2,89 |
0,010 |
Var2 |
1,31 |
0,296 |
2,227 |
0,504 |
4,42 |
0,000 |
Var3 |
0,80 |
0,286 |
57,500 |
20,484 |
2,81 |
0,012 |
Var4 |
–1,08 |
0,512 |
–1,153 |
0,548 |
–2,11 |
0,050 |
На шахтах з пологими пластами (клас 1) середня місячна продуктивність праці в очисних вибоях на 57,5 т вища порівняно з шахтами, що мають круто падаючі пласти (клас 2). Зі збільшенням швидкості просування лави на 1 м про-
дуктивність праці зростає в середньому на 2,23 т, на шахтах першого класу ефект впливу цього фактора на 1,15 т менший за середній.
Теоретичний рівень продуктивності праці визначається так: класів. Наприклад, у табл. 7.7 ознакова множина моделі охоплює дві факторні ознаки (х
для шахт першого класу Y = (43,525 + 57,5) + (2,227 – 1,153) x
1 ; для шахт другого класу Y = 43,525 + 2,227 x
1 .
Аналогічно здійснюється модельна специфікація за наявності трьох і більше для шахт другого класу Y = 43,525 + 2,227 x
1 .
Аналогічно здійснюється модельна специфікація за наявності трьох і більше для шахт першого класу Y = (43,525 + 57,5) + (2,227 – 1,153) x
1 ; для шахт другого класу Y = 43,525 + 2,227 x
1 .
Аналогічно здійснюється модельна специфікація за наявності трьох і більше
1 , х
2 ) та дві dummy-змінні (u
1 , u
2 ).
За допомогою dummy-змінних можна врахувати в моделі нетиповість певної групи одиниць, які класифікуються як аномальні. Належним до такої групи
членам сукупності приписується u j =1. членам сукупності приписується u j =1.
Таблиця 7.7
СПЕЦИФІКАЦІЯ ACOV-МОДЕЛІ ДЛЯ ДВОХ DUMMY-ЗМІННИХ
Специфікація моделі
u
1 u
2
00 |
|
Y = a 0 + b 1 x 1 + b 2 x 2 |
10 |
|
Y = (a 0 + a 1 ) + (b 1 + c 11 ) x 1 + b 2 x 2 |
01 |
|
Y = (a 0 + a 2 ) + b 1 x 1 + (b 2 + c 22 ) x 2 |
11 |
|
Y = (a 0 + a 1 + a 2 )+ (b 1 + c 11 ) x 1 + (b 2 + c 22 ) x 2 |
Dummy-змінні в трендових моделях. Якісна однорідність є однією з умов моделювання динаміки. Вона виявляється неперервністю ряду, сталістю тенденції розвитку. Проте в рядах соціально-економічних показників ця умова часом порушується; спостерігаються розриви однорідності рядів через зміни у причинному комплексі формування тенденцій. Скажімо, зміна форми власності, фінансова криза, несприятливі погодні умови тощо. Серед методів статистичного аналізу такого типу трендів найпростішим є застосування dummy-змінних u t , які вводяться в трендову модель лінійно. При цьому система dummy-змінних різниться залежно від того, відома чи не відома точка зламу тенденції. Розглянемо обидва варіанти на прикладі динаміки ціни акцій умовної компанії (табл. 7.8).
Варіант перший. Точка зламу тенденції t р відома. Тоді часовий ряд у цій точці поділяється на два інтервали [до і після]. У трендову модель лінійно вводиться дві dummy-змінні u t . Значення першої змінної u t в інтервалі до точки зламу зростають від 1 до t р , у другому — фіксуються на рівні t р . Другій змінній
u t до точки зламу приписуються значення 0, після цієї точки u t = 1, 2, …, n, де n
— останнє значення ряду.
Трендова модель набуває вигляду u t до точки зламу приписуються значення 0, після цієї точки u t = 1, 2, …, n, де n
— останнє значення ряду.
Трендова модель набуває вигляду Y = a
0 + a
1 u
1 + a
2 u
2 . Y = a
0 + a
1 u
1 + a
2 u
2 .
Параметри a
2 характеризують абсолютну швидкість динаміки, відповідно, до і після зламу тенденції. Точка зламу тенденції відома.
1 і a
Варіант другий. Точка зламу тенденції невідома. У такому разі в трендову модель уводиться ще одна dummy-змінні u
3 , яка стежить за невідомою точкою зламу тенденції: де a
3 — вертикальна відстань між лініями тренду в середині ряду; знак «мінус» при a
3 вказує, що точка зламу t р розташована зліва від центру ряду.
У табл. 7.8 наведено значення dummy-змінних для обох варіантів.
Таблиця 7.8
МАТРИЦІ DUMMY-ЗМІННИХ ДЛЯ УРАХУВАННЯ ЗЛАМУ ТЕНДЕНЦІЇ
|
|
Точка зламу відома |
Точка зламу невідома |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
№ з/пy t u
1 u
2 u
1 u
2 u
3
1 |
12 |
101 |
|
|
0 |
0 |
2 |
13 |
202 |
|
|
0 |
0 |
3 |
16 |
303 |
|
|
0 |
0 |
4 |
19 |
404 |
|
|
0 |
0 |
5 |
20 |
505 |
|
|
0 |
1 |
6 |
21 |
515 |
|
|
1 |
1 |
7 |
22 |
525 |
|
|
2 |
1 |
8 |
23 |
535 |
|
|
3 |
1 |
9 |
24 |
545 |
|
|
4 |
1 |
За першим варіантом точка зламу тенденції — п’ятий рівень t
5 . Параметри трендової моделі (табл. 7.9) показують, що до точки t
5 ціна акцій зростала в се
редньому на 2,16, після — на 0,90. Параметр a
0 = 9,476 є тим відрізком, який відсікає на осі ординат перша лінія тренда. редньому на 2,16, після — на 0,90. Параметр a
0 = 9,476 є тим відрізком, який відсікає на осі ординат перша лінія тренда.
Таблиця 7.9
ПАРАМЕТРИ ТРЕНДОВОЇ МОДЕЛІ З DUMMY-ЗМІННИМИ
Регресію з dummy-змінними можна застосувати в аналізі сезонних коливань на основі поквартальних даних. При цьому один з кварталів (зазвичай перший) визнається базовим, отож до регресійної моделі включаються три dummy-змінні.
В табл. 7.10 наведено результати аналізу поквартальної реалізації безалкогольних напоїв (див. табл. 5.4). Статистично значимими виявилися коефіцієнти регресії при dummy-змінних другого і третього кварталів. У другому кварталі середній рівень реалізації безалкогольних напоїв більше порівняно з базовим першим кварталом (31,6 млн дкл.) на 26,4, у третьому кварталі — на 35,3 млн дкл.
Таблиця 7.10
ПАРАМЕТРИ МОДЕЛІ СЕЗОННИХ КОЛИВАНЬ З dummy-ЗМІННИМИ