Posibniki.com.ua Статистика Статистичне моделювання та прогнозування 7.3. АДАПТАЦІЯ РЕГРЕСІЙНОЇ МОДЕЛІ ДО НЕОДНОРІДНОЇ СУКУПНОСТІ


< Попередня  Змiст  Наступна >

7.3. АДАПТАЦІЯ РЕГРЕСІЙНОЇ МОДЕЛІ ДО НЕОДНОРІДНОЇ СУКУПНОСТІ


За допомогою dummy-змінних можна адаптувати регресійну модель до неоднорідної сукупності. Якщо неоднорідність проявляється розшаруванням сукупності на р ізольованих класів (груп), то кожен клас розглядається як градація номінальної ознаки і тим одиницям, що належать до j-го класу, приписутових ознак.

ється структурна змінна u j = 1, а тим, що не належать, u j = 0. Параметри при структурних змінних класів інтерпретуються так само, як і при градаціях тексється структурна змінна u j = 1, а тим, що не належать, u j = 0. Параметри при структурних змінних класів інтерпретуються так само, як і при градаціях текс

Специфіка моделювання процесів у неоднорідній сукупності зумовлена своєрідністю внутрішньокласової варіації та характером взаємозв’язків. Ефекти впливу того самого фактора х і на у за класами можуть істотно різнитися. Наприклад, у вугільній промисловості виділяються класи шахт за гірничо-геологічними умовами: потужністю та нахилом залягання пластів, їхньою газоносністю, глибиною розробки лав. Кожному типу цих природних умов відповідає певна технологічна схема і певний рівень механізації виробничих процесів. Вплив механізації на трудомісткість, скажімо, очисних робіт залежить від класу шахти. Залежність сили впливу одного фактора від рівня іншого називають взаємодією. У неоднорідних сукупностях йдеться про взаємодію факторів і специфічних умов окремих класів. Для цього використовують змінні взаємодії х і u j , значення яких дорівнює добутку значень відповідних ознак.

Отже, під час моделювання взаємозв’язків у неоднорідних сукупностях ознакова множина моделі охоплює, крім факторних ознак х і , два типи інструментальних змінних: dummy-змінні u j , які відображають особливості класів, і змінні взаємодії х і u j , що характеризують особливості взаємозв’язків в окремих класах. За рахунок цих змінних модель регресійного аналізу розширяється: m

1-p

== i jij

11 +++= jiijjjii uxcuaxbaY

0 ,???? == +++= i jij jiijjjii uxcuaxbaY

11

0 ,

де b i — характеризує чистий ефект впливу і-го фактора в середньому по сукупності; a j — показує відхилення середнього значення показника-функції в j-му класі від середнього його рівня в класі, узятому за базу порівняння; с ij — різниця ефектів впливу і-го фактора в j-му класі порівняно з середнім впливом у цілому по сукупності. Істотність параметрів a j і с ij свідчить про неоднорідність сукупності.

У моделі такого типу поєднуються регресія на факторних ознаках метричної шкали та модель дисперсійного аналізу міжкласових відмінностей. Вона уможливлює одночасну оцінку кількох рівнянь, і така оцінка може бути більш точною, ніж оцінки покласових регресій.

Як приклад розглянемо модель продуктивності праці робітників очисних вибоїв за даними 21 шахти, серед яких за гірничо-геологічними умовами 12 належать до першого класу (пологі пласти), 9

— до другого класу (круто падаючі пласти). Акцентуючи увагу на особливостях коваріаційної моделі, обмежимося одним фактором — швидкістю просування лави. Первинні дані наведено в табл. 7.5.

Таблиця 7.5

МАТРИЦЯ ПЕРВИННИХ ДАНИХ ACOV-МОДЕЛІ НА ГРУПУВАННЯХ

Перший клас (u 1 = 1) Другий клас (u 1 = 0)
Номер шахти Швидкість просування лави, м за місяць Продуктивність праці, т за місяць Номер шахти Швидкість просування лави, м за місяць Продуктивність праці, т за місяць
1 46 139 1 36 129
2 64 183 2 28 104
3 48 165 3 43 132
4 62 175 4 25 106
5 41 147 5 30 128
6 76 192 6 32 98
7 57 149 7 21 83
8 65 158 8 17 76
9 87 190 9 29 117
10 80 175
11 48 153
12 82 198

Модель має вигляд Y = a

0 + b

1 x

1 + a

1 u

1 + c

11 x

1 u

1 .

Графічно модель можна подати у вигляді двох прямих, які відображають за

Модель має вигляд Y = a

0 + b

1 x

1 + a

1 u

1 + c

11 x

1 u

1 .

Графічно модель можна подати у вигляді двох прямих, які відображають за

лежність продуктивності праці в різних класах шахт. Оскільки параметри цих

прямих різняться, вони мають різний нахил і перетинають вісь ординат у різних точках (рис. 7.9). а

Рис. 7.9. Схематичний приклад специфікації ACOV-моделі

Рис. 7.9. Схематичний приклад специфікації ACOV-моделі

Параметри моделі наведено в табл. 7.6. Коефіцієнт детермінації свідчить, що 92,1 % варіації продуктивності праці робітників очисних вибоїв (Var1) пояснюється класом шахт (Var3) і швидкістю просування лави (Var2). Адекватність моделі підтверджують значення F-критерію і p-level, істотність впливу факторів — характеристики t-критерію.

Таблиця 7.6

ПАРАМЕТРИ ACOV-МОДЕЛІ НА ГРУПУВАННЯХ

Regression Summary for Dependent Variable: Var1
R= ,96 RІ= ,921 Adjusted RІ= ,907
F(3,17)=66,4 p<,000 Std.Error of estimate: 11,05
St. Err. St. Err.
BETA of BETA B of B t(17) p-level
Intercеpt 43,525 15,078 2,89 0,010
Var2 1,31 0,296 2,227 0,504 4,42 0,000
Var3 0,80 0,286 57,500 20,484 2,81 0,012
Var4 –1,08 0,512 –1,153 0,548 –2,11 0,050

На шахтах з пологими пластами (клас 1) середня місячна продуктивність праці в очисних вибоях на 57,5 т вища порівняно з шахтами, що мають круто падаючі пласти (клас 2). Зі збільшенням швидкості просування лави на 1 м про-

дуктивність праці зростає в середньому на 2,23 т, на шахтах першого класу ефект впливу цього фактора на 1,15 т менший за середній.

Теоретичний рівень продуктивності праці визначається так: класів. Наприклад, у табл. 7.7 ознакова множина моделі охоплює дві факторні ознаки (х

для шахт першого класу Y = (43,525 + 57,5) + (2,227 – 1,153) x

1 ; для шахт другого класу Y = 43,525 + 2,227 x

1 .

Аналогічно здійснюється модельна специфікація за наявності трьох і більше для шахт другого класу Y = 43,525 + 2,227 x

1 .

Аналогічно здійснюється модельна специфікація за наявності трьох і більше для шахт першого класу Y = (43,525 + 57,5) + (2,227 – 1,153) x

1 ; для шахт другого класу Y = 43,525 + 2,227 x

1 .

Аналогічно здійснюється модельна специфікація за наявності трьох і більше

1 , х

2 ) та дві dummy-змінні (u

1 , u

2 ).

За допомогою dummy-змінних можна врахувати в моделі нетиповість певної групи одиниць, які класифікуються як аномальні. Належним до такої групи

членам сукупності приписується u j =1. членам сукупності приписується u j =1.

Таблиця 7.7

СПЕЦИФІКАЦІЯ ACOV-МОДЕЛІ ДЛЯ ДВОХ DUMMY-ЗМІННИХ

Dummy-змінні

Специфікація моделі

u

1 u

2

00 Y = a 0 + b 1 x 1 + b 2 x 2
10 Y = (a 0 + a 1 ) + (b 1 + c 11 ) x 1 + b 2 x 2
01 Y = (a 0 + a 2 ) + b 1 x 1 + (b 2 + c 22 ) x 2
11 Y = (a 0 + a 1 + a 2 )+ (b 1 + c 11 ) x 1 + (b 2 + c 22 ) x 2

Dummy-змінні в трендових моделях. Якісна однорідність є однією з умов моделювання динаміки. Вона виявляється неперервністю ряду, сталістю тенденції розвитку. Проте в рядах соціально-економічних показників ця умова часом порушується; спостерігаються розриви однорідності рядів через зміни у причинному комплексі формування тенденцій. Скажімо, зміна форми власності, фінансова криза, несприятливі погодні умови тощо. Серед методів статистичного аналізу такого типу трендів найпростішим є застосування dummy-змінних u t , які вводяться в трендову модель лінійно. При цьому система dummy-змінних різниться залежно від того, відома чи не відома точка зламу тенденції. Розглянемо обидва варіанти на прикладі динаміки ціни акцій умовної компанії (табл. 7.8).

Варіант перший. Точка зламу тенденції t р відома. Тоді часовий ряд у цій точці поділяється на два інтервали [до і після]. У трендову модель лінійно вводиться дві dummy-змінні u t . Значення першої змінної u t в інтервалі до точки зламу зростають від 1 до t р , у другому — фіксуються на рівні t р . Другій змінній

u t до точки зламу приписуються значення 0, після цієї точки u t = 1, 2, …, n, де n

— останнє значення ряду.

Трендова модель набуває вигляду u t до точки зламу приписуються значення 0, після цієї точки u t = 1, 2, …, n, де n

— останнє значення ряду.

Трендова модель набуває вигляду Y = a

0 + a

1 u

1 + a

2 u

2 . Y = a

0 + a

1 u

1 + a

2 u

2 .

Параметри a

2 характеризують абсолютну швидкість динаміки, відповідно, до і після зламу тенденції. Точка зламу тенденції відома.

1 і a

Варіант другий. Точка зламу тенденції невідома. У такому разі в трендову модель уводиться ще одна dummy-змінні u

3 , яка стежить за невідомою точкою зламу тенденції: де a

3 — вертикальна відстань між лініями тренду в середині ряду; знак «мінус» при a

3 — вертикальна відстань між лініями тренду в середині ряду; знак «мінус» при a

3 вказує, що точка зламу t р розташована зліва від центру ряду.

У табл. 7.8 наведено значення dummy-змінних для обох варіантів.

Таблиця 7.8

МАТРИЦІ DUMMY-ЗМІННИХ ДЛЯ УРАХУВАННЯ ЗЛАМУ ТЕНДЕНЦІЇ

Точка зламу відома Точка зламу невідома

№ з/пy t u

1 u

2 u

1 u

2 u

3

1 12 101 0 0
2 13 202 0 0
3 16 303 0 0
4 19 404 0 0
5 20 505 0 1
6 21 515 1 1
7 22 525 2 1
8 23 535 3 1
9 24 545 4 1

За першим варіантом точка зламу тенденції — п’ятий рівень t

5 . Параметри трендової моделі (табл. 7.9) показують, що до точки t

5 ціна акцій зростала в се

редньому на 2,16, після — на 0,90. Параметр a

0 = 9,476 є тим відрізком, який відсікає на осі ординат перша лінія тренда. редньому на 2,16, після — на 0,90. Параметр a

0 = 9,476 є тим відрізком, який відсікає на осі ординат перша лінія тренда.

Таблиця 7.9

ПАРАМЕТРИ ТРЕНДОВОЇ МОДЕЛІ З DUMMY-ЗМІННИМИ

Регресію з dummy-змінними можна застосувати в аналізі сезонних коливань на основі поквартальних даних. При цьому один з кварталів (зазвичай перший) визнається базовим, отож до регресійної моделі включаються три dummy-змінні.

Регресію з dummy-змінними можна застосувати в аналізі сезонних коливань на основі поквартальних даних. При цьому один з кварталів (зазвичай перший) визнається базовим, отож до регресійної моделі включаються три dummy-змінні.

В табл. 7.10 наведено результати аналізу поквартальної реалізації безалкогольних напоїв (див. табл. 5.4). Статистично значимими виявилися коефіцієнти регресії при dummy-змінних другого і третього кварталів. У другому кварталі середній рівень реалізації безалкогольних напоїв більше порівняно з базовим першим кварталом (31,6 млн дкл.) на 26,4, у третьому кварталі — на 35,3 млн дкл.

Таблиця 7.10

ПАРАМЕТРИ МОДЕЛІ СЕЗОННИХ КОЛИВАНЬ З dummy-ЗМІННИМИ

7.4. РЕГРЕСІЯ НА ГРУПУВАННЯХ

< Попередня  Змiст  Наступна >
Iншi роздiли:
7.5. СТАНДАРТИЗАЦІЯ ЕФЕКТІВ ВПЛИВУ
БАГАТОФАКТОРНІ ДИНАМІЧНІ МОДЕЛІ
8.2. МОДЕЛІ З ЛАГОВИМИ ЗМІННИМИ
8.3. НЕЛІНІЙНА РЕГРЕСІЯ НА ЧАСОВИХ РЯДАХ
Частина 1. 8.4. МОДЕЛЮВАННЯ НА ОСНОВІ ПАНЕЛЬНИХ ДАНИХ
Дисциплiни

Медичний довідник новиниКулінарний довідникАнглійська моваБанківська справаБухгалтерський облікЕкономікаМікроекономікаМакроекономікаЕтика та естетикаІнформатикаІсторіяМаркетингМенеджментПолітологіяПравоСтатистикаФілософіяФінанси

Бібліотека підручників та статтей Posibniki (2022)