Першасная апрацоўка даных
Першасная апрацоўка даных — этап падрыхтоўкі даных, у ходзе якога трансфармуецца іх фармат і структура, што можа прывесці да змены схемы даных[1]. Праводзіцца перад аналізам даных каб павысіць іх надзейнасць і паўнату, зрабіць прыдатнымі для ўжывання[2].
Прыклады правіць
Прыклады аперацый, якія могуць выконвацца ў працэсе першаснай апрацоўкі даных[1]:
- Змена парадку слупкоў у табліца .
- Стварэнне новых атрыбутаў на аснове ўжо прысутных.
- Аб’яднанне атрыбутаў.
- Выдаленне (фільтрацыя) непатрэбных запісаў.
- Змена гранулярнасці набору даных праз агрэгацыю і звядзенне .
- Запаўненне пропускаў у даных (напрыклад нулямі, сярэднім, медыянай) або выдаленне запісаў з пропускамі.
Крыніцы правіць
- ↑ а б Three Levels of ML Software (англ.). ML Ops: Machine Learning Operations. Праверана 13 снежня 2023.
- ↑ What Is Data Wrangling? Definition, Steps, and Why It Matters (англ.). Coursera. Праверана 14 снежня 2023.