Виконання Постанови Кабміну про відкриті дані під загрозою зриву. 21 квітня спливає шестимісячний термін, відведений органам державної влади на публікацію на Порталі відкритих даних, зазначених у Постанові наборів інформації.
Виконання Постанови Кабміну про відкриті дані під загрозою зриву. 21 квітня спливає шестимісячний термін, відведений органам державної влади на публікацію на Порталі відкритих даних, зазначених у Постанові наборів інформації.
Станом на 2 квітня 2016 року на порталі відкритих даних було доступно 126 наборів даних із необхідних 302, тобто лише 41,7 % від потрібної кількості. Дванадцять відомств не опублікували жодного набору даних із зазначених у Постанові.
Важливе зауваження – тут ми оцінюємо лише ті набори даних, які підлягають оприлюдненню відповідно до Постанови. І не оцінюємо так звані “типові” набори даних, себто однакові для всіх розпорядників даних. Отже, якщо хтось опублікував типовий або не зазначений у Постанові набір даних, – молодці, але це не є предметом нашого інтересу.
Тому не дуже радійте, коли бачите, що на Порталі відкритих даних опубліковано вже 512 наборів даних. Значна частка з цього – саме типові набори даних, які не представляють великого інтересу. Також зауважте, що значна частина з опублікованих наборів даних – дуже низької якості і не відповідає самому визначенню “відкритих даних”. Держагентство з електронного урядування веде з розпорядниками роз’яснювальну роботу, але на швидкий результат тут розраховувати не варто.
Оцінка кількості опублікованих наборів даних
Лише чотири відомства опублікували всі необхідні набори даних на Порталі: Верховна рада України (3 з 3 наборів даних), Міністерство молоді і спорту (8 з 8 наборів даних), Національна комісія, що здійснює державне регулювання у сферах енергетики та комунальних послуг (1 з 1 набору даних), Міністерство культури (4 з 4 наборів даних).
Верховна рада та НКРЕКП опублікували всі набори даних у машиночитаних форматах, Міністерство молоді та спорту опублікувало 3 набори даних у машиночитаних форматах і 5 наборів даних у немашиночитаних форматах, а Міністерство культури опублікувало 2 набори даних у машиночитаних форматах і 2 набори у немашиночитаних форматах.
Відомства, які не виклали жодного набору даних з обов’язкових до оприлюднення відповідно до Постанови: Міністерство фінансів, Державна реєстраційна служба, Міністерство освіти і науки, Держрибагентство, Міністерство закордонних справ, Міністерство юстиції, Міністерство охорони здоров’я, Міністерство аграрної політики та продовольства, Держветфітослужба, Національна комісія, що здійснює державне регулювання у сферах енергетики та комунальних послуг, Національна рада, України з питань телебачення і радіомовлення, Вищий господарський суд.
Оцінка якості опублікованих наборів даних
З 126 опублікованих наборів даних у структурованих форматах (CSV, XML, JSON) доступні 65.
Найпоширенішими помилками розпорядників даних є публікація наборів даних у не призначених для структурованих даних файлових форматах PDF і DOC(X), або ж публікація даних у немашиночитаному вигляді (наприклад, у форматах CSV та XLS(X), але з об’єднаними комірками).
Також присутні набори даних у невалідних файлових форматах. Так, Міністерство внутрішніх справ опублікувало набори даних у файлових форматах JSON, котрі не підлягають автоматичній обробці через помилки в структурі файлу (відсутність квадратних дужок на початку та в кінці, а також відсутність роздільникових ком між елементами).
Як ми оцінювали?
Дослідження враховує лише ті набори даних, які зазначені в Постанові для кожного окремого розпорядника. Себто, поза межами дослідження лишаються так звані типові набори даних, які мають опублікувати всі розпорядники, а також ті набори даних, які не зазначені в Постанові, але опубліковані на Порталі. За межами аналізу також лишилась публікація наборів даних у відповідних розділах на офіційних сайтах міністерств і відомств.
Для оцінки опублікованих наборів даних застосовувались наступні критерії:
- наявність набору даних (опублікований набір на порталі чи ні).
- відповідність файлового формату типу даних. Наприклад, чи структуровані дані публікуються у відповідних файлових форматах – (X)HTML, RDF, XML, JSON, CSV, XLS(X), ODS, YAML;
- машиночитаність набору даних. Тут дві складових – 1) чи файловий формат набору даних дозволяє його автоматичну обробку; 2) чи спосіб структурування даних у файлі дозволяє їх автоматичну обробку – себто, чи не містять таблиці об’єднаних комірок;
- наявність структури даних. Структура набору відкритих даних має включати елементів набору даних, їх формат, параметри та призначення. Структура повинна оприлюднюватись у форматах XSD, JSON, CSV або у аналогічних форматах.
Дослідження: Андрій Газін, Марія Щурська
Проект здійснено за підтримки «Ініціативи з розвитку аналітичних центрів в Україні», яку виконує Міжнародний фонд «Відродження» (МФВ) за фінансової підтримки Посольства Швеції в Україні (SIDA) та фонду NED.
Думки та позиції, викладені у цій публікації, є позицією автора та не обов’язково відображають позицію уряду Швеції.
Контакти: texty.org.ua