Що таке велика база даних?
2024Великі дані стосуються надзвичайно великі та різноманітні колекції структурованих, неструктурованих і напівструктурованих даних, які з часом продовжують експоненціально зростати. Ці набори даних настільки величезні та складні за обсягом, швидкістю та різноманітністю, що традиційні системи керування даними не можуть зберігати, обробляти та аналізувати їх.
Бази даних великих даних зберігати величезну кількість структурованих, напівструктурованих і неструктурованих даних без суворих схем. Неймовірно швидка та масштабована база даних NoSQL може збирати дані з різних джерел, включаючи соціальні дані, машинні дані (IoT) і транзакційні дані (додатки).
Бази даних великих даних: сутність великих даних багатоджерельні масивні дані різної природи (структуровані, напівструктуровані та неструктуровані), які потребують особливого підходу до зберігання та обробки.
Які приклади великих даних? Великі дані надходять із багатьох джерел, у т.ч системи обробки транзакцій, бази даних клієнтів, документи, електронні листи, медичні записи, журнали кліків в Інтернеті, мобільні програми та соціальні мережі.
Великі дані можна класифікувати структуровані, напівструктуровані та неструктуровані дані. Структуровані дані добре впорядковані та акуратно вписуються в традиційні бази даних. Напівструктуровані дані, такі як JSON або XML, є частково організованими, тоді як неструктуровані дані, такі як текст або мультимедіа, не мають попередньо визначеної структури.
Великі дані стосуються великі різноманітні набори інформації, які постійно зростають. Термін охоплює обсяг інформації, швидкість або швидкість, з якою вона створюється та збирається, а також різноманіття чи обсяг точок даних, які охоплюються (широко відомі як «три V» великих даних).
Традиційна система баз даних має справу зі структурованими даними. Система великих даних має справу зі структурованими, напівструктурованими, базами даних і неструктурованими даними. Традиційні дані генеруються за годину або за день або більше.