Posibniki.com.uaСтатистикаСтатистичне моделювання та прогнозування7.3. АДАПТАЦІЯ РЕГРЕСІЙНОЇ МОДЕЛІ ДО НЕОДНОРІДНОЇ СУКУПНОСТІ


< Попередня  Змiст  Наступна >

7.3. АДАПТАЦІЯ РЕГРЕСІЙНОЇ МОДЕЛІ ДО НЕОДНОРІДНОЇ СУКУПНОСТІ


За допомогою dummy-змінних можна адаптувати регресійну модель до неоднорідної сукупності. Якщо неоднорідність проявляється розшаруванням сукупності на р ізольованих класів (груп), то кожен клас розглядається як градація номінальної ознаки і тим одиницям, що належать до j-го класу, приписутових ознак.

ється структурна змінна u j = 1, а тим, що не належать, u j = 0. Параметри при структурних змінних класів інтерпретуються так само, як і при градаціях тексється структурна змінна u j = 1, а тим, що не належать, u j = 0. Параметри при структурних змінних класів інтерпретуються так само, як і при градаціях текс

Специфіка моделювання процесів у неоднорідній сукупності зумовлена своєрідністю внутрішньокласової варіації та характером взаємозв’язків. Ефекти впливу того самого фактора х і на у за класами можуть істотно різнитися. Наприклад, у вугільній промисловості виділяються класи шахт за гірничо-геологічними умовами: потужністю та нахилом залягання пластів, їхньою газоносністю, глибиною розробки лав. Кожному типу цих природних умов відповідає певна технологічна схема і певний рівень механізації виробничих процесів. Вплив механізації на трудомісткість, скажімо, очисних робіт залежить від класу шахти. Залежність сили впливу одного фактора від рівня іншого називають взаємодією. У неоднорідних сукупностях йдеться про взаємодію факторів і специфічних умов окремих класів. Для цього використовують змінні взаємодії х і u j , значення яких дорівнює добутку значень відповідних ознак.

Отже, під час моделювання взаємозв’язків у неоднорідних сукупностях ознакова множина моделі охоплює, крім факторних ознак х і , два типи інструментальних змінних: dummy-змінні u j , які відображають особливості класів, і змінні взаємодії х і u j , що характеризують особливості взаємозв’язків в окремих класах. За рахунок цих змінних модель регресійного аналізу розширяється: m

1-p

== i jij

11 +++= jiijjjii uxcuaxbaY

0 ,???? == +++= i jij jiijjjii uxcuaxbaY

11

0 ,

де b i — характеризує чистий ефект впливу і-го фактора в середньому по сукупності; a j — показує відхилення середнього значення показника-функції в j-му класі від середнього його рівня в класі, узятому за базу порівняння; с ij — різниця ефектів впливу і-го фактора в j-му класі порівняно з середнім впливом у цілому по сукупності. Істотність параметрів a j і с ij свідчить про неоднорідність сукупності.

У моделі такого типу поєднуються регресія на факторних ознаках метричної шкали та модель дисперсійного аналізу міжкласових відмінностей. Вона уможливлює одночасну оцінку кількох рівнянь, і така оцінка може бути більш точною, ніж оцінки покласових регресій.

Як приклад розглянемо модель продуктивності праці робітників очисних вибоїв за даними 21 шахти, серед яких за гірничо-геологічними умовами 12 належать до першого класу (пологі пласти), 9

— до другого класу (круто падаючі пласти). Акцентуючи увагу на особливостях коваріаційної моделі, обмежимося одним фактором — швидкістю просування лави. Первинні дані наведено в табл. 7.5.

Таблиця 7.5

МАТРИЦЯ ПЕРВИННИХ ДАНИХ ACOV-МОДЕЛІ НА ГРУПУВАННЯХ

Перший клас (u 1 = 1)Другий клас (u 1 = 0)
Номер шахти Швидкість просування лави, м за місяць Продуктивність праці, т за місяць Номер шахти Швидкість просування лави, м за місяць Продуктивність праці, т за місяць
146139136129
264183228104
348165343132
462175425106
541147530128
67619263298
75714972183
86515881776
987190929117
1080175
1148153
1282198

Модель має вигляд Y = a

0 + b

1 x

1 + a

1 u

1 + c

11 x

1 u

1 .

Графічно модель можна подати у вигляді двох прямих, які відображають за

Модель має вигляд Y = a

0 + b

1 x

1 + a

1 u

1 + c

11 x

1 u

1 .

Графічно модель можна подати у вигляді двох прямих, які відображають за

лежність продуктивності праці в різних класах шахт. Оскільки параметри цих

прямих різняться, вони мають різний нахил і перетинають вісь ординат у різних точках (рис. 7.9). а

Рис. 7.9. Схематичний приклад специфікації ACOV-моделі

Рис. 7.9. Схематичний приклад специфікації ACOV-моделі

Параметри моделі наведено в табл. 7.6. Коефіцієнт детермінації свідчить, що 92,1 % варіації продуктивності праці робітників очисних вибоїв (Var1) пояснюється класом шахт (Var3) і швидкістю просування лави (Var2). Адекватність моделі підтверджують значення F-критерію і p-level, істотність впливу факторів — характеристики t-критерію.

Таблиця 7.6

ПАРАМЕТРИ ACOV-МОДЕЛІ НА ГРУПУВАННЯХ

Regression Summary for Dependent Variable: Var1
R= ,96 RІ= ,921 Adjusted RІ= ,907
F(3,17)=66,4 p<,000 Std.Error of estimate: 11,05
St. Err.St. Err.
BETAof BETABof Bt(17)p-level
Intercеpt43,52515,0782,890,010
Var21,310,2962,2270,5044,420,000
Var30,800,28657,50020,4842,810,012
Var4–1,080,512–1,1530,548–2,110,050

На шахтах з пологими пластами (клас 1) середня місячна продуктивність праці в очисних вибоях на 57,5 т вища порівняно з шахтами, що мають круто падаючі пласти (клас 2). Зі збільшенням швидкості просування лави на 1 м про-

дуктивність праці зростає в середньому на 2,23 т, на шахтах першого класу ефект впливу цього фактора на 1,15 т менший за середній.

Теоретичний рівень продуктивності праці визначається так: класів. Наприклад, у табл. 7.7 ознакова множина моделі охоплює дві факторні ознаки (х

для шахт першого класу Y = (43,525 + 57,5) + (2,227 – 1,153) x

1 ; для шахт другого класу Y = 43,525 + 2,227 x

1 .

Аналогічно здійснюється модельна специфікація за наявності трьох і більше для шахт другого класу Y = 43,525 + 2,227 x

1 .

Аналогічно здійснюється модельна специфікація за наявності трьох і більше для шахт першого класу Y = (43,525 + 57,5) + (2,227 – 1,153) x

1 ; для шахт другого класу Y = 43,525 + 2,227 x

1 .

Аналогічно здійснюється модельна специфікація за наявності трьох і більше

1 , х

2 ) та дві dummy-змінні (u

1 , u

2 ).

За допомогою dummy-змінних можна врахувати в моделі нетиповість певної групи одиниць, які класифікуються як аномальні. Належним до такої групи

членам сукупності приписується u j =1. членам сукупності приписується u j =1.

Таблиця 7.7

СПЕЦИФІКАЦІЯ ACOV-МОДЕЛІ ДЛЯ ДВОХ DUMMY-ЗМІННИХ

Dummy-змінні

Специфікація моделі

u

1 u

2

00Y = a 0 + b 1 x 1 + b 2 x 2
10Y = (a 0 + a 1 ) + (b 1 + c 11 ) x 1 + b 2 x 2
01Y = (a 0 + a 2 ) + b 1 x 1 + (b 2 + c 22 ) x 2
11Y = (a 0 + a 1 + a 2 )+ (b 1 + c 11 ) x 1 + (b 2 + c 22 ) x 2

Dummy-змінні в трендових моделях. Якісна однорідність є однією з умов моделювання динаміки. Вона виявляється неперервністю ряду, сталістю тенденції розвитку. Проте в рядах соціально-економічних показників ця умова часом порушується; спостерігаються розриви однорідності рядів через зміни у причинному комплексі формування тенденцій. Скажімо, зміна форми власності, фінансова криза, несприятливі погодні умови тощо. Серед методів статистичного аналізу такого типу трендів найпростішим є застосування dummy-змінних u t , які вводяться в трендову модель лінійно. При цьому система dummy-змінних різниться залежно від того, відома чи не відома точка зламу тенденції. Розглянемо обидва варіанти на прикладі динаміки ціни акцій умовної компанії (табл. 7.8).

Варіант перший. Точка зламу тенденції t р відома. Тоді часовий ряд у цій точці поділяється на два інтервали [до і після]. У трендову модель лінійно вводиться дві dummy-змінні u t . Значення першої змінної u t в інтервалі до точки зламу зростають від 1 до t р , у другому — фіксуються на рівні t р . Другій змінній

u t до точки зламу приписуються значення 0, після цієї точки u t = 1, 2, …, n, де n

— останнє значення ряду.

Трендова модель набуває вигляду u t до точки зламу приписуються значення 0, після цієї точки u t = 1, 2, …, n, де n

— останнє значення ряду.

Трендова модель набуває вигляду Y = a

0 + a

1 u

1 + a

2 u

2 . Y = a

0 + a

1 u

1 + a

2 u

2 .

Параметри a

2 характеризують абсолютну швидкість динаміки, відповідно, до і після зламу тенденції. Точка зламу тенденції відома.

1 і a

Варіант другий. Точка зламу тенденції невідома. У такому разі в трендову модель уводиться ще одна dummy-змінні u

3 , яка стежить за невідомою точкою зламу тенденції: де a

3 — вертикальна відстань між лініями тренду в середині ряду; знак «мінус» при a

3 — вертикальна відстань між лініями тренду в середині ряду; знак «мінус» при a

3 вказує, що точка зламу t р розташована зліва від центру ряду.

У табл. 7.8 наведено значення dummy-змінних для обох варіантів.

Таблиця 7.8

МАТРИЦІ DUMMY-ЗМІННИХ ДЛЯ УРАХУВАННЯ ЗЛАМУ ТЕНДЕНЦІЇ

Точка зламу відомаТочка зламу невідома

№ з/пy t u

1 u

2 u

1 u

2 u

3

11210100
21320200
31630300
41940400
52050501
62151511
72252521
82353531
92454541

За першим варіантом точка зламу тенденції — п’ятий рівень t

5 . Параметри трендової моделі (табл. 7.9) показують, що до точки t

5 ціна акцій зростала в се

редньому на 2,16, після — на 0,90. Параметр a

0 = 9,476 є тим відрізком, який відсікає на осі ординат перша лінія тренда. редньому на 2,16, після — на 0,90. Параметр a

0 = 9,476 є тим відрізком, який відсікає на осі ординат перша лінія тренда.

Таблиця 7.9

ПАРАМЕТРИ ТРЕНДОВОЇ МОДЕЛІ З DUMMY-ЗМІННИМИ

Регресію з dummy-змінними можна застосувати в аналізі сезонних коливань на основі поквартальних даних. При цьому один з кварталів (зазвичай перший) визнається базовим, отож до регресійної моделі включаються три dummy-змінні.

Регресію з dummy-змінними можна застосувати в аналізі сезонних коливань на основі поквартальних даних. При цьому один з кварталів (зазвичай перший) визнається базовим, отож до регресійної моделі включаються три dummy-змінні.

В табл. 7.10 наведено результати аналізу поквартальної реалізації безалкогольних напоїв (див. табл. 5.4). Статистично значимими виявилися коефіцієнти регресії при dummy-змінних другого і третього кварталів. У другому кварталі середній рівень реалізації безалкогольних напоїв більше порівняно з базовим першим кварталом (31,6 млн дкл.) на 26,4, у третьому кварталі — на 35,3 млн дкл.

Таблиця 7.10

ПАРАМЕТРИ МОДЕЛІ СЕЗОННИХ КОЛИВАНЬ З dummy-ЗМІННИМИ

7.4. РЕГРЕСІЯ НА ГРУПУВАННЯХ

< Попередня  Змiст  Наступна >
Iншi роздiли:
7.5. СТАНДАРТИЗАЦІЯ ЕФЕКТІВ ВПЛИВУ
БАГАТОФАКТОРНІ ДИНАМІЧНІ МОДЕЛІ
8.2. МОДЕЛІ З ЛАГОВИМИ ЗМІННИМИ
8.3. НЕЛІНІЙНА РЕГРЕСІЯ НА ЧАСОВИХ РЯДАХ
Частина 1. 8.4. МОДЕЛЮВАННЯ НА ОСНОВІ ПАНЕЛЬНИХ ДАНИХ
Дисциплiни

Англійська моваБанківська справаБухгалтерський облікЕкономікаМікроекономікаМакроекономікаЕтика та естетикаІнформатикаІсторіяМаркетингМенеджментПолітологіяПравоСтатистикаФілософіяФінанси

Бібліотека підручників та статтей Posibniki