Тема
3. Основи науки про дані для IoT та IоE
Архітектура IoT та
IoE
IoT архітектура
складається з декількох рівнів, кожен з яких відіграє ключову роль у
забезпеченні взаємодії між пристроями, даними і користувачами.
·
Фізичний
рівень. Сенсори та пристрої, що збирають дані з
навколишнього середовища. Приклади: датчики температури, камери, GPS.
·
Мережевий
рівень. Забезпечує передачу даних від пристроїв до
серверів або хмарної інфраструктури. Використовуються різні комунікаційні
протоколи, такі як Wi-Fi, Bluetooth, Zigbee, LoRaWAN.
·
Рівень
обробки. Збір та обробка даних. Включає сервери,
датацентри або хмарні платформи, де дані обробляються для подальшого аналізу.
·
Рівень
застосування. Інтерфейс користувача, аналітика та
візуалізація даних. Приклади: мобільні додатки для керування розумним будинком,
промислові панелі моніторингу.
IoE архітектура
розширює цю модель, включаючи додаткові компоненти:
·
Люди.
Користувачі, що взаємодіють із системою через різні інтерфейси та пристрої.
·
Дані.
Аналітичні моделі та великі дані, які генеруються та обробляються для створення
нових інсайтів.
·
Процеси.
Автоматизовані бізнес-процеси, які взаємодіють з іншими компонентами для
досягнення конкретних цілей.
Моделі наукової
аналітики у вертикалях IoT є:
1.
Predictive
Modeling (Моделі передбачення).
Алгоритми.
Використовуються різні алгоритми машинного навчання, такі як дерева рішень,
випадкові ліси, градієнтний бустинг, та глибокі нейронні мережі.
Застосування.
Прогнозування поломок обладнання на основі аналізу історичних даних про роботу
машини. Це дозволяє здійснювати планове технічне обслуговування, що знижує час
простою і витрати.
Аналіз даних пацієнтів для прогнозування
ризиків захворювань, таких як діабет або серцево-судинні захворювання.
2.
Classification
Modeling (Моделі класифікації).
Алгоритми.
Логістична регресія, SVM (опорні векторні машини), нейронні мережі.
Застосування.
Класифікація транспортних засобів для оптимізації руху на основі даних з камер
та сенсорів.
Виявлення небезпечних подій або вторгнень в
мережу на основі класифікації мережевого трафіку.
3.
Clustering
(Моделі кластеризації).
Алгоритми.
K-means, DBSCAN, ієрархічна кластеризація.
Застосування.
Групування домогосподарств за рівнем споживання енергії для персоналізованих
рекомендацій щодо економії.
Аналіз поведінки споживачів для створення
цільових маркетингових кампаній.
4.
Regression
Modeling (Моделі регресії).
Алгоритми.
Лінійна регресія, поліноміальна регресія, Ridge та Lasso регресії.
Застосування.
Моделювання залежності споживання електроенергії від температури повітря та
інших факторів для прогнозування попиту.
Прогнозування врожайності сільськогосподарських
культур на основі погодних умов і історичних даних.
Злиття даних у IoT.
·
Centralized
Fusion. Збирання даних з усіх сенсорів на
центральному сервері, де вони обробляються. Це підвищує точність аналізу, але
створює проблеми з масштабованістю та затримкою в обробці.
·
Distributed
Fusion. Обробка даних локально на пристроях IoT. Це
знижує навантаження на центральні сервери і зменшує затримку, але може
призвести до втрати точності.
·
Hybrid
Fusion. Комбінація централізованого і розподіленого
підходів. Наприклад, попередня обробка даних здійснюється локально, а
остаточний аналіз – централізовано.
·
Edge
Computing. Обробка даних максимально близько до місця їх
генерації (на "краю" мережі), що дозволяє швидше реагувати на події в
реальному часі.
·
Fog
Computing. Розподілена обчислювальна інфраструктура, яка
розширює можливості хмари, дозволяючи обробку даних на пристроях, які
знаходяться між сенсорами і хмарою.
Обробка часових рядів
даних з IoT пристроїв
Основні
характеристики часових рядів:
·
Автокореляція.
Взаємозв'язок між поточним значенням і попередніми значеннями ряду.
·
Сезонність.
Повторювані шаблони в даних, пов'язані з певними періодами часу.
·
Тренди.
Загальна тенденція зміни даних протягом тривалого періоду.
Методи обробки:
·
Moving
Averages (Згладжування ковзного середнього). Метод згладжування,
який використовується для зменшення шуму і виявлення трендів.
·
Exponential
Smoothing (Експоненційне згладжування). Метод, що враховує
всі минулі дані, але надає більшу вагу останнім спостереженням. Часто
використовується для прогнозування короткострокових тенденцій.
·
Fourier
Analysis (Фур'є-аналіз). Використовується для аналізу
періодичних сигналів, виявлення частотних компонентів в часових рядах.
·
Autoregressive
Models (AR, MA, ARMA, ARIMA). Моделі, які використовують
залежність між поточним значенням ряду та його попередніми значеннями для
прогнозування. Використовуються для короткострокового прогнозування на основі
часових рядів.
Екосистема
IoT та IoE є складною і багатогранною, з великим потенціалом для трансформації
різних галузей. Сучасні моделі наукової аналітики, методи злиття даних та
обробки часових рядів відкривають нові можливості для підвищення ефективності,
безпеки та інноваційності систем IoT.