Чи слід видаляти викиди для лінійної регресії?
2024Це може покращити підгонку та продуктивність моделі лінійної регресії, але також зменшує розмір вибірки та може викликати зміщення або втрату важливої інформації. тому ви повинні видаляти викиди, лише якщо вони явно помилкові, нерелевантні або несумісні з рештою даних.16 листопада 2023 р
Деякі викиди представляють природні варіації населення, і їх слід залишити такими, як є у вашому наборі даних. Це так звані справжні викиди. Інші викиди є проблематичними та повинні бути видалені, оскільки вони представляють помилки вимірювання, помилки введення чи обробки даних або погану вибірку.
По-перше, для лінійної регресії потрібен лінійний зв’язок між незалежними та залежними змінними. Також важливо перевірити наявність викидів, оскільки лінійна регресія чутлива до викидів.
Як видалення цього викиду вплине на лінію регресії? Відповіді: Нахил лінії регресії зменшиться.
Видалення викидів створює нормальний розподіл у деяких моїх змінних і робить перетворення для інших змінних більш ефективними. Таким чином, здається, що видалення викидів перед трансформацією – кращий варіант.
Як поводитися з викидами?
- Крок 1: Обрізання/видалення викидів. У цій техніці ми видаляємо викиди з набору даних. …
- Крок 2: Квантильні підлоги та покриття. …
- Крок 3: Врахування середнього/медіани. …
- Крок 5: Візуалізація даних після обробки викиду.
Якщо викид не змінює результати, але впливає на припущення, ви можете відмовитися від викиду. Але зауважте, що у виносці вашої статті. Найчастіше викид впливає як на результати, так і на припущення. У цій ситуації неправомірно просто скинути викид.