Які етапи перехресної перевірки?
2024… це п'ятикратна перехресна перевірка (CV). процес, коли всі дані випадковим чином розбиваються на k згорток, у нашому випадку k = 5, а потім модель навчається на k − 1 згортках, тоді як одна згортка залишається для тестування моделі (приклад наведено на рис. 9). Ця процедура повторюється k разів.
Один раунд перехресної перевірки передбачає поділ вибірки даних на додаткові підмножини, виконання аналізу на одній підмножині (званій навчальним набором) і перевірку аналізу на іншому підмножині (званому набором перевірки або набором для тестування).
Правила перехресної перевірки (CVR) є використовується в Гарвардській головній книзі (GL), щоб запобігти створенню недійсних облікових записів GL. Кожне правило перехресної перевірки визначає діапазони значень, які можна використовувати разом, і діапазони, які заборонено використовувати разом.
Ця техніка працює шляхом поділу даних на кілька непересічних навчальних і тестових підмножин (також званих згортками) і використання більшості згорток для навчання моделі навчання, а решта згорток для оцінки її ефективності (32–34).
10-кратна перехресна перевірка забезпечує баланс між надійною оцінкою та обчислювальною ефективністю. Він пропонує хороший компроміс, розділяючи дані на 10 підмножин для комплексної оцінки.
Виконання 4-кратної перехресної перевірки генерує чотири моделі, чотири джерела даних для навчання моделей, чотири джерела даних для оцінки моделей і чотири оцінювання, по одному для кожної моделі. Amazon ML створює показник ефективності моделі для кожної оцінки.