Posibniki.com.ua Статистика Статистичне моделювання та прогнозування 7.5. СТАНДАРТИЗАЦІЯ ЕФЕКТІВ ВПЛИВУ


< Попередня  Змiст  Наступна >

7.5. СТАНДАРТИЗАЦІЯ ЕФЕКТІВ ВПЛИВУ


У моделі МНК стандартизована середня Y ij подається як регресія на dummy-змінних u ij : де m — кількість факторів; p i

— кількість груп за і-м фактором.

кількість груп за і-м фактором.

Параметри моделі a ij характеризують чистий, елімінований від взаємодії ефект впливу j-го рівня і-го фактора. Оцінювання параметрів моделі здійснюється розв’язуванням системи нормальних рівнянь, елементами якої є групові ? ij u і підгрупові ? rjij uuчастоти. Щоб уникнути лінійної залежності рівнянь, ефекти однієї з груп за кожним фактором прирівнюються до нуля. Трансформована в такий спосіб модель набуває вигляду: де b ij — різниця між груповими середніми j-ї групи і групи з нульовими ефектами (бази порівняння за і-м фактором).

Як і в загальній моделі МНК, систему нормальних рівнянь такої моделі можна записати в матричному вигляді: де UU — матриця dummy-змінних.

Як і в загальній моделі МНК, систему нормальних рівнянь такої моделі можна записати в матричному вигляді: де UU — матриця dummy-змінних.

Щоб визначити стандартизовані ефекти за і-м фактором а ij , необхідно зафіксувати на середньому рівні значення інших факторів. Це досягається приписуванням усім dummy-змінним, окрім змінної за і-м фактором, їхніх середніх значень — часток груп d ij . Dummy-змінній j-ї групи за і-м фактором приписується одиниця, іншим групам за цим фактором — нулі. У матричному вигляді розрахунок стандартизованих середніх записується у вигляді скалярного добутку вектора В на вектор коефіцієнтів D:

Щоб визначити стандартизовані ефекти за і-м фактором а ij , необхідно зафіксувати на середньому рівні значення інших факторів. Це досягається приписуванням усім dummy-змінним, окрім змінної за і-м фактором, їхніх середніх значень — часток груп d ij . Dummy-змінній j-ї групи за і-м фактором приписується одиниця, іншим групам за цим фактором — нулі. У матричному вигляді розрахунок стандартизованих середніх записується у вигляді скалярного добутку вектора В на вектор коефіцієнтів D:

BDY ij =. BDY ij =.

Середня похибка стандартизованого ефекту оцінюється за формулою де e

DUUDs eY

1 )( ? =µ, DUUDs eY

1 )( ? =µ,

2 s

— залишкова дисперсія.

Отже, схема стандартизації комбінаційних групувань МНК об’єднує два блоки. У першому визначаються параметри трансформованої моделі b ij , у дру-

гому — вектор коефіцієнтів переходу від параметрів b ij до стандартизованих ефектів а ij .

Реалізацію цієї схеми розглянемо на прикладі професійної мобільності зареєстрованих безробітних. Як оцінку професійної мобільності використаємо частку безробітних, котрі виявили бажання пройти перенавчання для роботи за іншою професією.

У табл. 7.13 подано комбінаційний розподіл безробітних за віком (фактор А) та освітою (фактор Б). Вікова структура представлена двома групами: А

до 30 років; А

1

2 — 30 років і старше; освіта — трьома рівнями: Б

— ПТУ; Б

2 — середня спеціальна; Б

1

3 — вища.

Таблиця 7.13

КОМБІНАЦІЙНЕ ГРУПУВАННЯ

Як видно з даних таблиці, молодь (до 30 років) професійно мобільніша. Водночас простежується залежність професійної мобільності від рівня освіти: що вищий рівень освіти, то вища готовність здобути нову професію. Очевидно, що ці два фактори взаємозв’язані. Стандартизація групування МНК передбачає, насамперед, ідентифікацію dummy-змінних. Вилучивши за кожним фактором останню групу, дістанемо одну dummy-змінну за фактором А і дві — за фактором Б. Рівняння регресії має вигляд норма

Як видно з даних таблиці, молодь (до 30 років) професійно мобільніша. Водночас простежується залежність професійної мобільності від рівня освіти: що вищий рівень освіти, то вища готовність здобути нову професію. Очевидно, що ці два фактори взаємозв’язані. Стандартизація групування МНК передбачає, насамперед, ідентифікацію dummy-змінних. Вилучивши за кожним фактором останню групу, дістанемо одну dummy-змінну за фактором А і дві — за фактором Б. Рівняння регресії має вигляд норма

Y = b

0 + b

11 u

11 + b

21 u

21 + b

22 u

22 .

0

11

11 +

21

21

22

22 Y = b

0 + b

11 u

11 + b

21 u

21 + b

22 u

22 .

Враховуючи, що ijij uu= 2 , a u ij u ik = 0, де kj?, елементами матриці системи

0270150270

40150200200

0

21211121

221121111111 == ??? ???? uuuu uuuuuu UU ???? =),,,()(

222111 yuyuyuyyU = (120; 60; 53; 43).

Враховуючи, що ijij uu= 2 , a u ij u ik = 0, де kj?, елементами матриці системи льних рівнянь UU та вектора yU будуть такі частоти:

170040170

0270150270

40150200200

170270200500

0

0

22221122

21211121

221121111111

222111 == ??? ??? ???? ??? uuuu uuuu uuuuuu uuun UU ???? =),,,()(

222111 yuyuyuyyU = (120; 60; 53; 43).

Розв’язавши систему рівнянь, дістаємо параметри: які оцінюють ефекти відповідних груп за і-м фактором відносно вилученої групи. На основі цих параметрів визначаються стандартизовані середні Y ij та ефекти а ij : де d rj

— частка j-ї групи за r-м фактором (ri?).

— частка j-ї групи за r-м фактором (ri?).

Сформуємо вектори коефіцієнтів переходу від регресійної моделі до станда

Комбінаційний розподіл безробітних (табл. 7.13) характеризується частками: вить: вища за середній рівень. Аналогічно визначені стандартизовані середні і стандартизовані ефекти для інших груп наведені в табл. 7.14.

Комбінаційний розподіл безробітних (табл. 7.13) характеризується частками: вить: вища за середній рівень. Аналогічно визначені стандартизовані середні і стандартизовані ефекти для інших груп наведені в табл. 7.14.

d

11 = 200 : 500 = 0,4; d

12 = 0,6; d

21 = 270 : 500 = 0,54; d

22 =170 : 500 = 0,34; d

23 = = 0,12. Звідси стандартизована середня для першої групи за фактором А стано= 0,12. Звідси стандартизована середня для першої групи за фактором А станоd

11 = 200 : 500 = 0,4; d

12 = 0,6; d

21 = 270 : 500 = 0,54; d

22 =170 : 500 = 0,34; d

23 = = 0,12. Звідси стандартизована середня для першої групи за фактором А станоY

11 = 0,3470 + 0,1557 + 0 + (–0,2642) 0,54 + (–0,1577) 0,34 + 0 = 0,306. Y

11 = 0,3470 + 0,1557 + 0 + (–0,2642) ? 0,54 + (–0,1577) ? 0,34 + 0 = 0,306.

Відповідно центрований ефект цієї групи а

11 = 0,306 – 0,240 = +0,066, тобто професійна мобільність молоді, незалежно від освіти, в середньому на 6,6 %

Відповідно центрований ефект цієї групи а

11 = 0,306 – 0,240 = +0,066, тобто професійна мобільність молоді, незалежно від освіти, в середньому на 6,6 %

Таблиця 7.14

ДО РОЗРАХУНКУ СТАНДАРТИЗОВАНИХ ЕФЕКТІВ

ij b ij 11 12

0,34711111

11 0,1557 1 0

21–0,26420,540,54100

22 –0,1577 0,34 0,34

Y ij ?0,3060,1520,1450,2510,409

а ij ? 0,066 –0,088

Згідно з даними таблиці професійна мобільність осіб старшого віку на 8,8 % нижча за середній рівень. Щодо освіти, то незалежно від віку, найбільший ПТУ, навпаки, характерний низький рівень професійної мобільності, ефект цієї групи становить (–9,5 %).

ефект професійної мобільності дає вища освіти (+16,9 %). Для випускників ефект професійної мобільності дає вища освіти (+16,9 %). Для випускників

Отже, за допомогою стандартизації ефекти впливу факторів, представлених ознаками різного типу (метричних, номінальних), зводяться до порівняльного вигляду. І це значно розширює аналітичні можливості регресійних моделей.

РЕЗЮМЕ

Адекватність регресійної моделі означає її здатність правильно описати реальну структуру взаємозв’язків між факторами х і і функцією у. Методологічною основою вирішення проблеми адекватності є теоретичний, змістовий аналіз матеріальної природи процесу (явища) й обґрунтування типу та структури моделі, яка описує механізм його формування. Практично з метою забезпечення адекватності моделі змістовий аналіз поєднується з формальними процедурами перевірки гіпотез щодо дотримання логіко-статистичних умов використання МНК.

Для оцінювання адекватності регресійної моделі використовують: стандартне відхилення, множинні коефіцієнти детермінації та кореляції, часткові коефіцієнти детермінації та кореляції, коефіцієнти окремої детермінації; критерії перевірки істотності зв’язку.

Базою оцінювання адекватності моделі слугують відхилення фактичних значень від теоретичних — залишки. На їхню величину впливає увесь комплекс умов, зокрема: інформативність включених до моделі факторів, обсяг та однорідність сукупності, незалежність спостережень, стабільність не включених до моделі факторів; тип моделі.

Важливою умовою регресійного аналізу є відсутність мультиколінеарності, яка веде до зсунення оцінок параметрів моделі й унеможливлює коректну інтерпретацію результатів.

Стабільність не включених до моделі факторів означає, що вплив їх на варіацію у незначний і урівноважується, він однаковий в усіх частинах сукупності (умова гомоскедастичності). Математичною основою дотримання названих передумов МНК слугує ймовірнісний розподіл залишків. Перевірку гіпотези про незалежність залишків (відсутність серійної кореляції чи автокореляції) здійснюють за допомогою критерія Дарбіна-Ватсона d.

У соціально-економічних дослідженнях часто стикаються із ситуацією, коли окремі властивості явищ описуються ознаками номінальної шкали (форма власності, професія тощо). Використання таких ознак у регресійному аналізі передбачає їх оцифровування, на практиці найчастіше застосовують бінарні змінні, коли приписане k-й градації число має лише два значення (0; 1). Dummy-змінна розглядається як умовний код, що вказує на належність (1) чи не належність (0) j-ї одиниці сукупності до певної градації. Щоб уникнути проблеми мультиколінеарності для ознаки, що має р градацій , ставиться у відповідність (p – 1) dummy-змінних.

Dummy-змінні часто використовують разом з ознаками метричної шкали (змішані ознакові множини). У такому разі до матриці ознакової множини моделі Х додається матриця dummy-змінних U. Параметри при dummy-змінних оцінюються одночасно з коефіцієнтами регресіїпри метричних ознаках. Такі моделі називають ACOV-моделями.

За допомогою dummy-змінних можна адаптувати регресійну модель до неоднорідної сукупності. Якщо неоднорідність проявляється розшаруванням сукупності на р ізольованих класів (груп), то кожен клас розглядається як градація номінальної ознаки і тим одиницям, що належать до j-го класу, приписується

dummy-змінна u j = 1, а тим, що не належать, u j = 0. Параметри при dummy-змінних класів інтерпретуються так само як і при градаціях текстових ознак. dummy-змінна u j = 1, а тим, що не належать, u j = 0. Параметри при dummy-змінних класів інтерпретуються так само як і при градаціях текстових ознак.

Ефекти впливу того самого фактора на результат у різних класах можуть істотно різнитися. Залежність сили впливу одного фактора від рівня іншого називають взаємодією. У неоднорідних сукупностях ідеться про взаємодію факторів і специфічних умов окремих класів. Для цього використовують змінні взаємодії, значення яких дорівнює добутку значень відповідних ознак х і u j .

Отже, при моделюванні взаємозв’язків у неоднорідних сукупностях ознакова множина моделі охоплює, крім факторних ознак х і , два типи інструментальних змінних: dummy-змінні u j , які відображають особливості класів, і змінні взаємодії х і u j , що характеризують особливості взаємозв’язків в окремих класах.

Модель з dummy-змінними і змінними взаємодії можна застосувати до часових рядів і до комбінаційних групувань.

У регресійній моделі, як і в дисперсійному аналізі, значення i-ї ознаки у h-ї одиниці сукупності, яка належить до j-ї групи, подається сумою загальної середвих взаємодій за розглянутою методикою значно ускладнюється. У такому разі ефективною виявляється модель з адитивними ефектами. Адитивність означає незалежність впливу одного фактора від рівня іншого. Забезпечити її можна стандартизацією комбінаційного групування, тобто заміною частот емпіричного розподілу частотами певного стандартного розподілу. Зважені за частотами стандартного розподілу групові середні називають стандартизованими, а відхилення їх від загальної середньої — стандартизованими (центрованими) ефектами. За допомогою стандартизації ефекти впливу факторів, представлених ознаками різного типу (метричними, номінальними), зводяться до порівняльного вигляду. І це значно розширює аналітичні можливості регресійних моделей.

ньої µ, ефекту кожного фактора (а i + b j ) та ефектів їх взаємодії (ab) ij . Зі збільшенням кількості факторів оцінка ефектів впливу кожного з них і всіх можлиньої µ, ефекту кожного фактора (а i + b j ) та ефектів їх взаємодії (ab) ij . Зі збільшенням кількості факторів оцінка ефектів впливу кожного з них і всіх можли

ПИТАННЯ І ЗАДАЧІ ДЛЯ САМОПІДГОТОВКИ

1. Поясніть сутність адекватності регресійної моделі й умови її забезпечення.

2. Чи пов’язана адекватність регресійної моделі з мультиколінеарністю ознакової множини? Як можна виявити мультиколінеарність?

3. Як забезпечити дотримання умови гомоскедастичності?

4. Чому аналіз залишків розглядають як базу оцінювання адекватності регресійної моделі?

5. Яку функцію в аналізі залишків виконує критерій Durbin-Watson? Поясніть особливість застосування цього критерію.

6. Яку роль в оцінюванні адекватності регресійних моделей виконує візуальний аналіз розподілу залишків?

7. Яку функцію в регресійному аналізі виконують dummy-змінні?

8. Поясніть структуру ACOV-моделі.

9. Вплив стану довкілля на здоров’я населення описується регресійною моделлю, ознакова множина якої охоплює: х

1 — середні викиди забруднюючих речовин в атмосферу на одну людину за рік, кг; х

2 — місце проживання: великі промислові центри (перша група) та території з невисоким рівнем техногенного навантаження (друга група). Коефіцієнти регресії моделі онкозахворювань стапраці х

новлять: b

1 = 0,414; a

1 = 112,380. Поясніть зміст коефіцієнтів моделі.

10. Виконайте специфікацію моделей окупності витрат у від продуктивності новлять: b

1 = 0,414; a

1 = 112,380. Поясніть зміст коефіцієнтів моделі.

10. Виконайте специфікацію моделей окупності витрат у від продуктивності

1 : а) для птахофабрик, різних за спеціалізацією виробництва (м’ясні, яєчні); б) для теплоелектростанцій, які використовують різні види палива (вугілля, природний газ, мазут);

11. Виконайте специфікацію моделі витрат у, необхідних для підтримки торгового судна у робочому стані, від віку судна х

1 , його тоннажності х

2 , типу використання пального (дизельне, ядерне) та наявності радарного захисту (є, немає).

12. Регресійна модель описує залежність продуктивності праці робітників очисних вибоїв (т на одного робітника за зміну) від потужності вугільного пласта х

1 та типу вугільного комбайна (широкозахватні — 1, вузькозахватні — 0). Параметри моделі становлять:

R 2 a 0 b 1 a 1 c 11
0,78 3,82 1,85 1,24 0,26

Поясніть зміст параметрів моделі, зробіть специфікацію моделі для кожного типу комбайнів.

13. За яких умов можна застосувати dummy-змінні в трендових моделях?

14. Яка мета стандартизації ефектів впливу і як вона здійснюється?

15. За допомогою моделі стандартизованих групувань проведено аналіз обсягу емісій цінних паперів залежно від типу емітента х та еволюційних факторів розвитку банківської системи (змінна часу t). Стандартизовані ефекти впливу цих факторів становлять:

Вид цінних паперів, х Обсяг емісій, млн грн Стандартизований ефект
Державні Корпоративні Банківські 26,5 35,2 34,3 –5,1 –7,3 12,4
У середньому 32,0 ?
Роки 1 2 3 27,9 32,1 36,0 –2,3 –0,4 2,7
У середньому 32,0 ?

Визначте стандартизовані середні для кожної групи і, розглядаючи їх як теоретично можливі рівні, оцініть ступінь використання теоретичних можливостей банків щодо емісії цінних паперів.

ЗАВДАННЯ ДЛЯ ПРАКТИЧНИХ ЗАНЯТЬ

7.1. За наведеними даними по сукупності шахт перевірте логіко-статистичні умови забезпечення адекватності регресійної моделі продуктивності праці робітників, ознакову множину якої формують: навантаження на діючі очисні вибої, посування діючої лінії очисних вибоїв і рівень механізованого проведення підготовчих виробок:

1) на основі кореляційної матриці проаналізуйте взаємозв’язки між факторними ознаками, зробіть висновки про наявність (відсутність) мультиколінеарності;

2) в рамках лінійної регресійної моделі оцініть ефекти впливу включених до моделі факторів на продуктивності праці, перевірте істотність впливу кожного фактора;

3) чи не суперечать висновки про істотність впливу окремих факторів висновкам на основі множинного коефіцієнта детермінації?

4) проаналізуйте часткові кореляції і толерантність включених до моделі факторів;

5) на основі графічного аналізу залишків зробіть висновок про нормальність їх розподілу і забезпечення умови гомоскедастичності.

Зробіть загальний висновок щодо забезпечення адекватності запропонованої регресійної моделі продуктивності праці робітників по видобутку вугілля.

№ з/п

Продуктивність праці робітників по видобутку, т/міс.

Навантаження на діючі очисні вибої, т/добу

Посування діючої лінії очистки вибоїв, м/міс.

Рівень механізованого проведення підготовчих виробок, км

1 34,9 1090 51,1 14
2 23,9 864 46,2 12,8
3 48,2 1791 93,9 18,0
4 35,2 933 47,6 15
5 24,1 737 38,9 7,6
6 38,4 914 43,3 14,9
7 35,1 1508 78,4 16,8
8 40,6 1919 85,4 19,2
9 10,4 628 31,2 10,6
10 31,6 781 36,2 14,1
11 23,3 816 41,7 10,5
12 38,3 1487 70,3 16,9
13 36,5 1432 85,5 15,4

Закінчення табл.

№ з/п Продуктивність праці робітників по видобутку, т/міс. Навантаження на діючі очисні вибої, т/добу Посування діючої лінії очистки вибоїв, м/міс. Рівень механізованого проведення підготовчих виробок, км
14 32,9 851 43,7 14,7
15 39,7 1618 92,8 16,6
16 35,1 924 47,0 15,1
17 44,7 1675 86,1 17,5
18 27,7 946 48,5 12,9
19 42,6 1707 83,8 17,8
20 26,8 931 44,2 9,7

7.2. За даними файлу Textbooks з (папка Examples системи Statistica):

1) побудуйте регресійну модель IQ-індексу учнів, замінивши ознаку Var1Textbook dummy-змінною;

2) оцініть взаємозв’язки між ознаками;

3) на основі лінійної регресійної моделі оцініть ефекти впливу факторів на результат;

4) здійсніть аналіз залишків, перевірте гіпотезу про незалежність спостережень;

5) на основі візуального аналізу залишків зробіть висновок про адекватність моделі.

7.3. Через погіршення фінансового стану компанії чистий дохід на акції різко упав. Опишіть динаміку дохідності акцій лінійним трендом з урахуванням зрушень, поясніть зміст параметрів моделі.

Тиждень 12 3 456 7
Дохід на акцію, грн 1,12 1,28 1,33 1,56 1,42 1,36 1,25

7.4. За даними файлу Reading (папка Examples системи Statistica), який містить дані про швидкість й ефективність роботи з текстами:

1) здійсніть специфікацію моделі, за допомогою опції Text Labels Editor замініть ознаки номінальної шкали на dummy-змінні;

2) поясніть зміст параметрів регресійної моделі;

3) оцініть адекватність моделі, зробіть висновки.

7.5. За наведеними даними про фактори урожайності кукурудзи:

1) здійсніть специфікацію регресійної моделі урожайності кукурудзи;

2) сформуйте матрицю ознакової множини моделі;

Режим іригації Урожайність, ц/га при застосуванні інсектициду
В 1 В 2 В 3

3) визначте ефекти впливу факторів: А — режиму іригації; В — використання інсектицидів, їх взаємодії.

A

4346; 52; 5847; 53

1

A 2 56; 49; 50 66; 71 62

7.6. Характеристикою потенційної професійної мобільності є частка робітників, які прагнуть змінити професію. На конкретному підприємстві цей показник становить 0,240. Механізм формування потенційної мобільності робітників підприємства описано регресійною моделлю, параметри якої наведено в таблиці:

Групи робітників за ознаками Частка робітників, % Коефіцієнт регресії
Вік, років
до 25 24 0,09
25—35 39 –0,07
35 і старше 37
Ступінь задоволеності професією
не подобається 35 0,17
ставлюся байдуже 09 0,05
подобається 56

Вільний член рівняння а

0 = 0,21.

Визначте стандартизовані середні та стандартизовані ефекти впливу факто

Вільний член рівняння а

0 = 0,21.

Визначте стандартизовані середні та стандартизовані ефекти впливу факто

рів на професійну мобільність робітників. Зробіть висновки.

РЕКОМЕНДОВАНА ЛІТЕРАТУРА

1. Дрейпер Н. Прикладной регрессионный анализ / Н. Дрейпер, Г. Сміт ; пер. с англ. Ю. П. Адлера и В. Г. Горского. — М. : Статистика, 1973. — С. 172

—242.

2. Єріна А. М. Статистичне моделювання та прогнозування : навч. посібн. / А. М. Єріна. — К. : КНЕУ, 2001. — С. 108—125.

3. Лук’яненко І. Г. Сучасні економетричні методи у фінансах: навч. посібн. / І. Г. Лук’яненко, Ю. О. Городніченко. — К. : Літера ЛТД, 2002.

— С. 76

—112.

4. Маленво Э. Статистические методы эконометрии. В. 1. / Э. Маленво. — М. : Статистика, 1975. — С. 258—322.

5. Трофимов В. П. Логическая структура статистических моделей / В. П. Трофимов. — М. : Финансы и статистика, 1985.

— С. 117—130.


< Попередня  Змiст  Наступна >
Iншi роздiли:
8.2. МОДЕЛІ З ЛАГОВИМИ ЗМІННИМИ
8.3. НЕЛІНІЙНА РЕГРЕСІЯ НА ЧАСОВИХ РЯДАХ
Частина 1. 8.4. МОДЕЛЮВАННЯ НА ОСНОВІ ПАНЕЛЬНИХ ДАНИХ
Частина 2. 8.4. МОДЕЛЮВАННЯ НА ОСНОВІ ПАНЕЛЬНИХ ДАНИХ
МОДЕЛІ КОМПОНЕНТНОГО АНАЛІЗУ
Дисциплiни

Медичний довідник новиниКулінарний довідникАнглійська моваБанківська справаБухгалтерський облікЕкономікаМікроекономікаМакроекономікаЕтика та естетикаІнформатикаІсторіяМаркетингМенеджментПолітологіяПравоСтатистикаФілософіяФінанси

Бібліотека підручників та статтей Posibniki (2022)