Яке застосування DGIM?
20241.4 Алгоритм Datar-Gionis-Indyk-Motwani (DGIM) Ця версія алгоритму використовує O(log2 N) бітів для представлення вікна з N бітів, і дозволяє оцінити кількість одиниць у вікні з похибкою не більше 50%. Для початку кожен біт потоку має мітку часу, позицію, в яку він надходить.
DGIM – використовує біти Olog2N для представлення вікна з N бітів і дозволяє оцінити кількість одиниць у вікні з помилкою не більше 50%. В алгоритмі DGIM кожен біт, який надходить, має мітку часу для позиції, до якої він надходить.
Є шість правил, яких необхідно дотримуватися при представленні потоку відрами. Правий кінець ковша завжди є позицією з 1. Кожна позиція з 1 знаходиться в певному відрі. Жодна позиція не міститься більш ніж в одному сегменті.
Алгоритм DGIM є корисний інструмент для оцінки кількості одиниць у бітовому потоці заданої довжини. Це робиться шляхом поділу потоку бітів на сегменти розміром, що відповідає ступеням двійки. Потім алгоритм підраховує кількість одиниць у кожному відрі та відстежує останні додані відра.
Великі дані можна класифікувати структуровані, напівструктуровані та неструктуровані дані. Структуровані дані добре впорядковані та акуратно вписуються в традиційні бази даних. Напівструктуровані дані, такі як JSON або XML, є частково організованими, тоді як неструктуровані дані, такі як текст або мультимедіа, не мають попередньо визначеної структури.
Інтелектуальний аналіз потоків даних використовується в різних програмах і галузях, наприклад системи спостереження в реальному часі, телекомунікаційні системи, сенсорні мережі, розумні будинки, сонячна фізика та фінанси.