Korporacyjne jezioro danych

14,90

Opis

Korporacyjne jezioro danych

Koncepcja big data, nauka o danych i analityka danych wspomagają dziś procesy decyzyjne w przedsiębiorstwach w niespotykanym wcześniej zakresie. Zwiększają poziom efektywności pracy w wielu różnych branżach. Korporacje zaczęły więc eksperymenty z wykorzystaniem big data i technologii chmury, aby budować jeziora danych oraz tworzyć oparte na nich systemy podejmowania decyzji. Niejeden z tych projektów się nie powiódł, gdyż nie został dostosowany do kultury i potrzeb przedsiębiorstwa. Najwyraźniej zabrakło wiedzy, w jaki sposób skutecznie przeprowadzać tak radykalną transformację.Ta książka jest praktycznym przewodnikiem, który ułatwia wdrażanie architektury jeziora danych (ang. data lake) w przedsiębiorstwie. Omówiono tu różne podejścia do jej uruchamiania i rozwijania, w tym kałuże danych (analityczne piaskownice) i stawy danych (hurtownie danych), a także budowanie jezior danych od podstaw. Opisano konfigurowanie różnych stref, co pozwala na odpowiednie rozmieszczenie zarówno surowych, jak i starannie zarządzanych i przetworzonych danych. Wyjaśniono znaczenie zarządzania dostępem do stref. Zawarto tu również wskazówki umożliwiające zachowanie zgodności z regułami zarządzania danymi przedsiębiorstwa.W tej książce:wprowadzenie do hurtowni danych, big data i nauki o danychpraktyczne techniki budowania jezior danychnajlepsze praktyki dostarczania analitykom dostępu do danychprojektowanie architektury jeziora danych oraz różne techniki implementacjizalety i wady różnych podejść do budowania magazynów danych i zarządzania nimiJeziora danych i big data – ocean możliwości!Spis treści:Wstęp 91. Wprowadzenie do jezior danych 13Dojrzewanie jeziora danych 15Kałuże danych 17Stawy danych 17Udane tworzenie jeziora danych 18Właściwa platforma 18Właściwe dane 19Właściwy interfejs 20Bagno danych 22Wskazówki dotyczące sukcesu w budowaniu jezior danych 23Tworzenie jeziora danych 24Organizowanie jeziora danych 24Konfiguracja jeziora danych pod kątem samoobsługi 26Architektury jeziora danych 30Jeziora danych w chmurze publicznej 31Logiczne jeziora danych 31Podsumowanie 342. Perspektywa historyczna 37Dysk do danych samoobsługowych – narodziny baz danych 37Imperatyw analityczny – narodziny hurtowni danych 40Ekosystem hurtowni danych 41Przechowywanie i kwerendowanie danych 42Ładowanie danych – narzędzia do integracji danych 47Organizowanie danych i zarządzanie nimi 50Konsumowanie danych 55Podsumowanie 563. Wprowadzenie do big data i nauki o danych 57Hadoop przewodzi historycznemu przejściu na big data 57System plików Hadoop 58Współdziałanie przetwarzania i przechowywania w zadaniu MapReduce 59Schemat odczytu 60Projekty Hadoop 61Nauka o danych 62Uczenie maszynowe 66Zdolność wyjaśnienia 67Zarządzanie zmianami 68Podsumowanie 694. Budowanie jeziora danych 71Co to jest Hadoop i dlaczego z niego korzystamy? 71Zapobieganie rozprzestrzenianiu się kałuż danych 74Wykorzystanie big data 74Nauka o danych jako główny czynnik 75Strategia 1. – przeniesienie istniejącej funkcjonalności 77Strategia 2. – jeziora danych dla nowych projektów 79Strategia 3. – ustanowienie centralnego punktu zarządzania 79Który sposób jest odpowiedni dla Ciebie? 80Podsumowanie 825. Od stawów danych, czyli hurtowni danych big data, do jezior danych 83Podstawowe funkcje hurtowni danych 84Modelowanie wymiarowe dla analityki 85Integrowanie danych z różnych źródeł 86Zachowywanie historii za pomocą powoli zmieniających się wymiarów 86Ograniczenia hurtowni danych jako repozytorium historycznego 86Przejście do stawu danych 87Utrzymywanie historii w stawie danych 87Wdrażanie powoli zmieniających się wymiarów w stawie danych 88Rozrastanie się stawów danych w jeziora danych – ładowanie danych, które nie znajdują się w hurtowni danych 90Surowe dane 91Dane zewnętrzne 91Internet rzeczy (IoT) i inne dane strumieniowe 94Architektura Lambda 94Transformacje danych 97Systemy docelowe 99Hurtownie danych 100Operacyjne magazyny danych 100Aplikacje czasu rzeczywistego i produkty oparte na danych 100Podsumowanie 1016. Optymalizacja pod kątem samoobsługi 103Początki samoobsługi 103Analitycy biznesowi 105Znajdowanie i zrozumienie danych – dokumentowanie przedsiębiorstwa 106Budowanie zaufania 109Dostarczanie 115Przygotowanie danych do analizy 116Przygotowywanie danych w jeziorze danych 117Umiejscowienie przygotowywania danych w Hadoop 118Powszechne przypadki użycia dla przygotowywania danych 119Analiza i wizualizacja 120Podsumowanie 1237. Architektura jeziora danych 125Organizacja jeziora danych 125Strefa lądowania lub surowa 126Strefa złota 127Strefa robocza 129Strefa wrażliwa 129Wiele jezior danych 131Zalety utrzymywania osobnych jezior danych 131Zalety scalania jezior danych 131Jeziora danych w chmurze 132Wirtualne jeziora danych 135Federacja danych 135Wirtualizacja big data 136Eliminacja redundancji 137Podsumowanie 1398. Katalogowanie jeziora danych 141Organizowanie danych 141Metadane techniczne 142Metadane biznesowe 146Znakowanie 148Automatyczne katalogowanie 149Logiczne zarządzanie danymi 150Zarządzanie wrażliwymi danymi i kontrola dostępu 150Jakość danych 152Powiązanie różnych danych 154Ustanawianie pochodzenia 155Dostarczanie danych 156Narzędzia służące do budowania katalogu 157Porównanie narzędzi 158Ocean danych 159Podsumowanie 1599. Zarządzanie dostępem do danych 161Autoryzacja lub kontrola dostępu 162Zasady dostępu do danych oparte na znacznikach 163Anonimizacja wrażliwych danych 166Suwerenność danych i zgodność z przepisami 169Samoobsługowe zarządzanie dostępem 171Dostarczanie danych 174Podsumowanie 18010. Perspektywy dla różnych branż 181Big data w usługach finansowych 182Konsumenci, cyfryzacja i dane zmieniają znane nam finanse 182Ratowanie banku 183Nowe możliwości oferowane przez nowe dane 186Kluczowe procesy korzystania z jeziora danych 188Wartość dodana przez jeziora danych w usługach finansowych 190Jeziora danych w branży ubezpieczeniowej 191Inteligentne miasta 193Big data w medycynie 194Skorowidz 196O autorze: Alex Gorelik jest CEO i założycielem firmy Waterline Data. Wcześniej zakładał startupy, zajmował się marketingiem oraz badaniami produktów, zarządzał zespołem kilkuset inżynierów i pracował nad integracją danych w firmie IBM. Jego kariera jest nieodłącznie związana z nowoczesnymi technologiami przetwarzania danych i ich wdrażaniem dla potrzeb biznesu.

: Podręczniki szkolne

cmgmogilno, gruziński język, mechanik z dojazdem kraków, maria śpiewaczka operowa

yyyyy