Возера дадзеных — сістэма або бібліятэка даных  (англ.), якія захоўваюцца ў натуральным/неапрацаваным фармаце[1], звычайна ў выглядзе вялікіх бінарных вялікіх аб'ектаў  (руск.) або файлаў. Возера даных звычайна ўяўляе сабой адзінае сховішча даных, якое ўключае неапрацаваныя копіі зыходных сістэмных даных, даныя датчыкаў, сацыяльныя даныя і г. д.[2] і ператвораныя даныя, якія выкарыстоўваюцца для такіх задач, як справаздачнасць  (англ.), візуалізацыя  (руск.), пашыраная аналітыка  (руск.) і машыннае навучанне. Возера даных можа ўключаць структураваныя дадзеныя  (руск.) з рэляцыйных баз дадзеных  (руск.) (радкі і слупкі), паўструктураваныя даныя (CSV  (руск.), логі, XML, JSON), неструктураваныя даныя  (руск.) (электронныя лісты, дакументы, PDF-файлы) і бінарныя даныя  (англ.) (выявы, аўдыё  (укр.), відэа  (руск.))[3]. Возера даных можа быць створана «лакальна» (у цэнтрах апрацоўкі даных арганізацыі) або «у воблаку» (з выкарыстаннем воблачных сэрвісаў ад такіх пастаўшчыкоў, як Amazon, Microsoft або Google).

Дрэнна кіраваныя азёры даных жартам называюць балотамі даных[4].

Зноскі

  1. The growing importance of big data quality. The Data Roundtable. Праверана 1 June 2020.
  2. What is a data lake?. aws.amazon.com. Праверана 12 October 2020.
  3. Top Five Differences between DataWarehouses and Data Lakes(недаступная спасылка). Blue-Granite.com. Архівавана з першакрыніцы 15 верасня 2017. Праверана 19 May 2017.
  4. Olavsrud, Thor (June 8, 2017). "3 keys to keep your data lake from becoming a data swamp". CIO [англійская].