Прыём даных

імпарт даных з розных крыніц на адзін носьбіт

Прыём даных (англ.: data ingestion) — працэс збору даных[en] з розных крыніц на адзіны воблачны[en] носьбіт[1]. Ажыццяўляецца з дапамогай розных сістэм, фарматаў[en] і падыходаў, такіх як унутраныя і вонкавыя базы даных, вітрыны даных[en], OLAP-кубы[en], сховішчы даных[en], OLTP-сістэмы[en], Spark[en], HDFS[en] і іншыя[2].

Этапы правіць

Прыём даных складаецца з наступных этапаў[2]:

  • Вызначэнне і дакументацыя крыніц даных.
  • Ацэнка месца на дыску, неабходнага для захоўвання даных.
  • Выдзяленне неабходнага месца для даных.
  • Атрыманне даных і перавод іх у зручны фармат.
  • Стварэнне рэзервовай копіі[en] даных.
  • Праверка даных на адпаведнасць прынцыпам канфідэнцыяльнасці[en], напрыклад GDPR[en], або прывядзенне іх у адпаведны выгляд.
  • Каталагізацыя метаданых[en] пра памер, фармат, час апошняга змянення, спіс кантролю доступу[en] і г.д.

Крыніцы правіць

  1. What is data ingestion? (англ.). Cognizant. Праверана 13 снежня 2023.
  2. а б Three Levels of ML Software (англ.). ML Ops: Machine Learning Operations. Праверана 13 снежня 2023.