Posibniki.com.ua Статистика Статистичне моделювання та прогнозування 1.6. ФОРМУВАННЯ ІНФОРМАЦІЙНОЇ БАЗИ СТАТИСТИЧНИХ МОДЕЛЕЙ


< Попередня  Змiст  Наступна >

1.6. ФОРМУВАННЯ ІНФОРМАЦІЙНОЇ БАЗИ СТАТИСТИЧНИХ МОДЕЛЕЙ


Масив первинних даних у системі Statistica організується і зберігається у вигляді електронної таблиці Spreadsheet з рядками Cases і стовпцями Variables. Тобто в рядках електронної таблиці розміщуються елементи статиски таблиці призначені для числової або текстової інформації.

тичної сукупності (j = 1, 2, …, n), по стовпцях — ознаки (i = 1, 2, …, m). Клітинтичної сукупності (j = 1, 2, …, n), по стовпцях — ознаки (i = 1, 2, …, m). Клітин

Створення нового файлу з первинними даними здійснюється за командою New… у меню File (файл). У діалоговому вікні Сreate New Document (рис. 1.15) необхідно виділити вкладинку Spreadsheet і одразу вказати кількість ознак (Number of variables) і кількість спостережень (Number of cases). Програма автоматично створить електронну таблицю відповідного розміру (рис. 1.17 ліворуч).

Рис. 1.15. Діалогове вікно Сreate New Document

Наступним етапом формування інформаційної бази є специфікації ознак, тобто визначення основних параметрів кожної з них: імені, типу ознаки, формату подання даних, коду для пропущених даних, формули розрахунку, перекодування чи трансформації значень ознаки. Специфікації ознак — Variable Specs

— доступні через контекстне меню або через вікно Data чи кнопку Vars на панелі інструментів. Перелік специфікацій ідентичний (рис. 1.16): Name — ім’я ознаки, довжина його не може перевищувати восьми символів. Інакше необхідно використати позначку Label y полі Long name (Label or formula with Functions) — Довге ім’я (позначка чи формула з функцією); Measurement Type — шкала вимірювання (аutо, categorial, оrdinal … ); Default data Type — тип ознаки (double, text, integer, byte); Length

— розрядність числа; за умовчанням усі ознаки подаються у форматі восьми значущих цифр і трьох розрядів після коми; Display Format — формат подання даних (чисел, дат, часу, даних у науковому, у грошовому форматах, у процентах); MD code — код, який приписується пропущеним даним. Можна вилучити дані з розрахунків, замінити їх середніми значеннями (команда Replase Missing Date by Means) або інтерполювати. За умовчанням MD code становить — 9999.

Рис. 1.16. Специфікації ознаки Var1

За необхідності перетворення чи перекодування ознаки Var в текстове поле формулою перерахувати значення ознак (їх вказують за номерами v1, v2 і т. д.), необхідно натиснути ОК і в діалоговому вікні підтвердити команду Recalculаte the variable now. Наприклад, значення ознаки Var3 в таблиці на рис.1.17 обчисвий швидкий доступ до великої кількості спеціальних математичних чи статистичних функцій через кнопку Functions, допускається використання логічних операторів.

Long name вводиться формула, яка починається символом “=”. Щоби згідно з Long name вводиться формула, яка починається символом “=”. Щоби згідно з лено за формулою [=v2/v1]. При використанні більш складних формул можлилено за формулою [=v2/v1]. При використанні більш складних формул можли

За допомогою команди Аll Specs можна переглянути й відредагувати специфікації всіх ознак. Скажімо, у файлі, що розглядається, ознаки ідентифіковані так:

Variables Name Long name
Vаr1 ВВП Валовий внутрішній продукт за паритетом купівельної спроможності ПКС, млрд дол. США у цінах 201__ р.
Vаr2 ЕнРесур Кінцеве споживання енергоресурсів, млн т нафтового еквіваленту
Vаr3 ЕнВитр Витрати енергоресурсів на 1000 дол. США ВВП, кг
Vаr4 ЕнВ-ЄС Енергоємність ВВП у країнах ЄС

Після специфікації ознак необхідно задати імена об’єктів. Для цього на полі, де вказаний номер об’єкта, замість номера об’єкта записують його ім’я (треба двічі клацнути лівою кнопкою миші). Перехід від імені до номера можна здійснити за командою Show/Hide Case Names, розміщеною на панелі інструментів. Аналогічно можна записати додаткову інформацію стосовно файлу у верхньому вільному полі таблиці. Файл необхідно зберегти через команду Save з меню File, вказавши його ім’я. В інформаційному рядку електронної таблиці автоматично відобразиться ім’я файлу і його розмір, наприклад, назва таблиці, розміщеної на рис. 1.17 праворуч, «Енергоємність ВВП (4v by 5c)». Після того, як усі параметри таблиці задані, можна вводити дані.

Специфікація параметрів таблиці Spreadsheet

Рис. 1.17. Специфікація таблиці первинних даних Spreadsheet

Залежно від обсягу наявної інформації первинну структуру електронної таблиці можна змінювати, додаючи (Add) або вилучаючи (Delete) певні ознаки чи спостереження.

РЕЗЮМЕ

Моделювання

— один з ефективних засобів пізнання законів і закономірностей навколишнього світу. Особливого значення набувають моделі під час вивчення закономірностей масових соціально-економічних явищ і процесів, які недоступні прямому спостереженню й не піддаються експериментуванню.

Обєктом моделювання є статистична сукупність, в якій реалізується закономірність. Характеристика об’єкта моделювання охоплює: вибір одиничного елемента сукупності — носія характерних для закономірності рис; визначення просторових і часових меж об’єкта моделювання; формування ознакової множини моделі.

Формально статистична модель — це абстрактна схема відношень між величинами, що характеризують властивості реального процесу. Вибір же цих властивостей і розроблення схем відношень між ними здійснюється неформально. Важливим напрямом використання статистичних моделей є прогнозування.

Прогнозування

— це процес формування прогнозів на основі аналізу тенденцій і закономірностей розвитку об’єкта. Під час прогнозування соціально-економічних процесів перевагу віддають статистичним методам, прогнозним результатом яких є очікувані в майбутньому значення характеристик процесу.

Основним інструментом статистичного прогнозування є прогнозна екстраполяція, суть якої полягає у вивченні попереднього розвитку об’єкта прогнозування (передісторії) і перенесенні закономірностей його розвитку в минулому і сьогоденні на майбутнє. Такий підхід виходить з інерційності соціально-економічних явищ і процесів: з одного боку, протягом відносно тривалого часу зберігається характер розвитку об’єкта прогнозування (напрям, темпи, коливання), з другого — більш-менш сталою залишається його внутрішня структура, взаємозв’язки і співвідношення з іншими об’єктами.

Важливим етапом статистичного прогнозування є верифікація прогнозу, тобто визначення ступеня його відповідності дійсному стану об’єкта в майбутньому. При верифікації прогнозів вирізняють такі поняття, як точність прогнозування, достовірність (надійність) та обґрунтованість прогнозу. Точність прогнозу виявляється розбіжностями між прогнозними і фактичними даними (реалізацією прогнозу) на часовому інтервалі періоду попередження. Найбільш поширене ретроспективне оцінювання точності прогнозу, тобто оцінювання прогнозу для минулого часу (еx-post прогноз).

Під час обґрунтування складних управлінських рішень в умовах невизначеності, при довгостроковому прогнозуванні розвитку науки, техніки, економіки використовують колективні експертизи, які передбачають спільну працю групи експертів з метою отримання максимально об’єктивної оцінки перспектив розвитку об’єкта прогнозування. Надійність колективної експертизи залежить від узгодженості оцінок експертів. Мірою узгодженості експертних оцінок слугує коефіцієнт конкордації.

Характерною особливістю моделювання та прогнозування соціально-економічних процесів є багатоваріантність, тобто можливість використання різних методів, моделей, інформаційного забезпечення, критеріїв оцінювання адекватності моделі тощо. Вибір між конкуруючими варіантами також має ґрунтуватися на експертних оцінках, визначених за певною системою правил.

Практичне використання нових технологій статистичного моделювання і прогнозування складних соціально-економічних явищ і процесів стало можливим завдяки появі інтегрованих систем аналізу й обробки даних, до класу яких належить система Statistica. Система організована за модульним принципом, тобто всі статистичні методи обробки даних розбиті на окремі модулі згідно з основними розділами статистичного аналізу. Модуль об’єднує групу логічно пов’язаних між собою статистичних методів і в межах конкретної моделі забезпечує повний і всебічний аналіз даних.

Більшість модулів системи має спільні елементи діалогу: у стартовому вікні відкривається файл даних, за потреби задаються умови вибору спостережень і ваги ознак, з відритого файлу даних вибираються ознаки для аналізу, обираєть-

ся обчислювальна процедура і задаються її параметри, здійснюється запуск і виконання обчислювальної процедури. Послідовність зазначених елементів діалогу в стартовому вікні модуля схематично показано на рис. 1.18.

Рис. 1.18. Структура діалогу в модулі системи Statistica

Рис. 1.18. Структура діалогу в модулі системи Statistica

Важливою характеристикою системи Statistica є наявність засобів всебічної графічної підтримки процесу обробки даних і візуалізації результатів аналізу. Графічні можливості й засоби системи унікальні. Використання сучасних комп’ютерних технологій обробки даних, інтерактивний спосіб взаємодії з системою перетворюють статистичне моделювання та прогнозування на захоплююче дослідження закономірностей навколишнього світу.

ПИТАННЯ І ЗАДАЧІ ДЛЯ САМОПІДГОТОВКИ

1. Суть статистичного моделювання.

2. Роль статистичних моделей у системі управління і регулювання соціальноекономічних процесів.

3. У який спосіб поєднуються математична схема статистичної моделі і реальні процеси?

4. Поясніть суть і послідовність етапів статистичного моделювання.

5. Що таке об’єкт статистичного моделювання? Назвіть його характеристики.

6. Сформулюйте основні принципи статистичного моделювання

7. Поясніть суть статистичного прогнозування, назвіть види статистичних прогнозів.

8. Які процедури поєднує верифікація статистичних прогнозів?

9. Як оцінюють точність статистичних прогнозів?

Прогнозний період Прогнозний рівень визначений на основі моделі Фактичний рівень
АRIMA експоненціального згладжування
Січень 315 302 312

10. Складено два варіанти прогнозу податкових надходжень у регіоні (млн грн) у першому кварталі нового року. Використовуючи стандартну похибку, оцініть точність прогнозу за кожним варіантом, зробіть висновок.

Лютий360314340

Березень 355 346 362

11. За даними поквартальної динаміки товарного експорту та імпорту (млрд ючи похибку апроксимації, порівняйте точність прогнозів, зробіть висновок.

дол. США) складено прогнози на період попередження v =1, 2, 3. Використовудол. США) складено прогнози на період попередження v =1, 2, 3. Використову

Прогнозний період Прогнозний рівень Фактичний рівень
Експорт Імпорт Експорт Імпорт

р + 115,715,115,115,5 р + 115,715,115,115,5

+ 2 16,5 15,8 15,8 16,0
р + 3 17,3 16,5 17,0 16,9

р

12. Поясніть суть і порядок перспективних розрахунків методом пересування вікових груп.

13. Використовуючи основне рівняння поновлення, визначте, скільки об’єктів необхідно ввести в експлуатацію через 1-6 років в умовах простого відтворення, якщо термін їхньої служби становить три роки, а імовірність вибуття —

Р

1 = 0,2; Р

2 = 0,3; Р

3 = 0,5.

14. Поясніть сутність експертних оцінок, окресліть сферу їх використання. Р

1 = 0,2; Р

2 = 0,3; Р

3 = 0,5.

14. Поясніть сутність експертних оцінок, окресліть сферу їх використання.

15. Як оцінити узгодженість думок експертів?

16. П’ять експертів здійснили ранжирування трьох проектів. Коефіцієнт конкордації становить 0,75. Чи можна стверджувати, що думки експертів узгоджуються? Як перевірити істотність коефіцієнта конкордації?

17. Експерти Світового банку ранжирували країни за ступенем політичного ризику. Оцініть ступінь узгодженості думок експертів, висновок зробіть з імовірністю 0,95.

Експерт Країна
АВ С К Р
№ 1 143 2 5

№ 223415

№ 3 134 2 5

18. Цільова настанова проекту — максимальний прибуток. Можливі три стратегії досягнення мети. За даними матриці переваг, наданих експертами кожній стратегії, ранжируйте їх за вагомістю. Зробіть висновки.

Стратегія АВ С
А —3 4
В 2— 3
С 12

19. Назвіть можливі способи заміни пропущених даних. Чи можна встановити спосіб заміни пропущених даних у стартовому вікні конкретного статистичного модуля?

ЗАВДАННЯ ДЛЯ ПРАКТИЧНИХ ЗАНЯТЬ

1.1. Групи експертів визначили найбільш проблемні фактори для ведення бізнесу в країні:

Фактор Рагни, надані експертами за секторами економіки
Нефінансові корпорації Фінансові корпорації Домогосподарства

Податкова політика121

Корупція 212
Інфляція 443

Неефективність держапарату334

Дозвільна система та ліцензування 566
Доступ до фінансування 655

Оцініть ступінь узгодженості думок експертів, висновок зробіть з імовірністю 0,95.

1.2. За наведеними даними матриці попарних порівнянь визначте, що важливіше для соціально-правової захищенності населення:

Життєвий рівень 1,00 3,00 3,00 4,00
Розвиток соціальної інфраструктури 0,33 1,00 0,50 1,00
Правоохоронна діяльність 0,33 2,00 1,00 2,00
Соціальний захист 0,25 1,00 0,50 1,00

1.3. За наведеними даними перепису населення і таблиці дожиття хлопчиків визначте чисельність хлопчиків, народжених у рік перепису, які досягнуть шкільного віку.

Вік, років Табличний коефіцієнт дожиття, Р х Чисельність хлопчиків за даними перепису, осіб, 0 x S
0 0,9856 311 316
1 0,9985 316 975
2 0,9991 322 066
3 0,9994 325 764
4 0,9995 327 469
5 0,9996 330 216
6 0,9997 326 463

1.4. За наведеними даними про рівень цін на олію в Україні і на світових ринках створіть у системі Statistica файл даних, здійсніть специфікацію ознак, задайте імена об’єктів. Додайте в електронну таблицю ознаку для порівняння цін, здійсніть її специфікацію. Збережіть файл, вказавши його ім’я.

Дата торгів Україна, порти Чорного моря Нідерланди, порти Роттердаму
18.06.2014 860* 925
16.07.2014 820 885
23.07.2014 835 885
30.07.2014 830 870

* Ціни подаються на умовах поставки FOB, дол./т.

1.5. Для аналізу фінансового стану комерційних банків за даними НБУ самостійно визначте сукупність банків (не менше, як 25) і по кожному з них випишіть інформацію про розмір активів, капіталу, зобов’язань і прибутку. У системі Statistica сформуйте файл первинних даних; по кожному банку визначте: прибутковість активів та капіталу, співідношення капіталу і зобов`язань; здійсніть специфікацію показників [www.bank.gov.ua].

1.6. За даними Держстату України створіть у системі Statistica файл даних основних макроекономічних показників України: ВВП; обсяг інвестицій; експорт та імпорт товарів і послуг; грошова маса M3; рівень інфляції; державні витрати; обсяг вкладів населення в банках. Здійсніть специфікацію показників. [www.ukrstat.gov.ua].

Потрібно розширити файл даних за рахунок таких самостійно визначених показників: рівень монетизації економіки (відношення грошової маси до ВВП); частка інвестицій у ВВП; частка державних витрат у ВВП; частка експорту товарів і послуг у ВВП; відношення обсягу вкладів населення в банках до ВВП.

РЕКОМЕНДОВАНА ЛІТЕРАТУРА

1. Боровиков В. П. Statistica® — Статистический анализ и обработка данных в среде Windows® : учебн. пособ. / В. П. Боровиков, И. П. Боровиков. — М. : Информ.-издат. дом «Филинъ», 1998. — С. 89—229.

2. Єріна А. М. Статистичне моделювання та прогнозування : навч. посіб. / А. М. Єріна. — К. : КНЕУ, 2001.

— С. 5—36.

3. Халафян А. А. Statistica 6. Статистический анализ данных: учебник / А. А. Халафян. — 3-е изд. — М. : Бином-Пресс, 2007. — С. 19—58.

4. StatSoft. Inc. (2001): Электронный учебник по статистике [Електронний ресурс]. Режим доступа: http://www. StatSoft.ru


< Попередня  Змiст  Наступна >
Iншi роздiли:
2.2. ЧАСТОТНИЙ АНАЛІЗ СТРУКТУРИ ДАНИХ
2.3. РОЗВІДУВАЛЬНИЙ АНАЛІЗ КОРЕЛЯЦІЙ
2.4. ТАБЛИЦІ КРОСТАБУЛЯЦІЇ
МОДЕЛІ БАГАТОВИМІРНОЇ КЛАСИФІКАЦІЇ
3.2. ОЦІНЮВАННЯ ЛАТЕНТНИХ ЯВИЩ ЗА ДОПОМОГОЮ ІНТЕГРАЛЬНИХ ПОКАЗНИКІВ
Дисциплiни

Медичний довідник новиниКулінарний довідникАнглійська моваБанківська справаБухгалтерський облікЕкономікаМікроекономікаМакроекономікаЕтика та естетикаІнформатикаІсторіяМаркетингМенеджментПолітологіяПравоСтатистикаФілософіяФінанси

Бібліотека підручників та статтей Posibniki (2022)