Ultimate magazine theme for WordPress.

Озеро данных для предприятий

Озеро данных для предприятий: Архитектура Lambda для построения систем данных предприятия

0

Практическое руководство по внедрению корпоративного озера данных с использованием архитектуры Lambda в качестве основы

Описание книги

Термин «Озеро данных» недавно стал известным в большой индустрии данных. Ученые, занимающиеся сбором данных, могут использовать его для получения значимых сведений, которые могут быть использованы предприятиями для переосмысления или трансформации методов своей работы. Архитектура Lambda также становится одной из наиболее заметных закономерностей в ландшафте больших данных, поскольку она не только помогает извлекать полезную информацию из исторических данных, но и коррелирует данные в реальном времени, позволяя бизнесу принимать критические решения. В этой книге предпринимается попытка объединить эти два важных аспекта — архитектуру озера данных и архитектуры Lambda.

Оригинальное название: Data Lake for Enterprises: Lambda Architecture for building enterprise data systems
Язык книги: Английский
Автор: Томси Джон, Панкай Мисра (Tomcy John, Pankaj Misra)
Дата: 31 мая 2017 года
ISBN: 1787281345
Объём: 596 страниц

Книга разделена на три основных раздела. Первый знакомит вас с концепцией озер данных, важностью озер данных на предприятиях, а также с архитектурой лямбда. Во втором разделе рассматриваются основные компоненты построения озера данных с использованием архитектуры Lambda. Он знакомит вас с популярными технологиями обработки больших объемов данных, такими как Apache Hadoop, Spark, Sqoop, Flume и ElasticSearch. Третий раздел представляет собой весьма практическую демонстрацию того, как все это можно собрать воедино, и показывает, как можно реализовать корпоративное «озеро данных», а также несколько примеров его использования в реальных условиях. Он также показывает, как другие периферийные компоненты могут быть добавлены в озеро, чтобы сделать его более эффективным.

В конце этой книги Вы сможете выбрать правильные технологии больших данных, используя архитектурные шаблоны лямбда для построения Вашего озера данных предприятия.

Чему вы будете учиться

  • Постройте озеро данных на уровне предприятия, используя соответствующие технологии больших объемов данных.
  • Понять ядро архитектуры Lambda и то, как применять ее на предприятии.
  • Узнайте технические подробности о Sqoop и его функциях.
  • Интеграция Kafka с компонентами Hadoop для получения данных о предприятии
  • Использовать флюм с потоковыми технологиями для потоковой обработки
  • Понимание потоковой обработки со ссылкой на потоковую передачу Apache Spark
  • Объединяйте компоненты Hadoop и знайте, какие преимущества они обеспечивают для корпоративных озер данных.
  • Создавайте быстрые, потоковые и высокопроизводительные приложения с помощью ElasticSearch.
  • Обеспечьте согласованность процесса ввода данных в различных форматах с возможностью конфигурирования.
  • Обработка данных для получения интеллекта с использованием алгоритмов машинного обучения.

Для кого эта книга

Эта книга будет полезна разработчикам Java и архитекторам, которые хотели бы реализовать озеро данных для своего предприятия. Если вы хотите получить практический опыт работы с архитектурой Lambda и технологиями больших данных путем внедрения практического решения с использованием этих технологий, то эта книга также поможет вам.


Скачать книгу

В нашей электронной библиотеке собрано множество полных версий книг на русском, английском и других языках. Большой выбор книг, даёт возможность каждому человеку получать необходимые знания для его развития. В нашей библиотеке вы наверняка сможете найти необходимую для вас книгу в нужном формате. Все книги которые вы можете скачать бесплатно с нашего сайта проверенны на вирусы и имеют формат PDF или ePUB.

Скачать книгу в формате PDF
Скачано: 1, размер: 0, дата загрузки: 13 Апр. 2020
Скачать книгу в формате ePUB
Скачано: 1, размер: 0, дата загрузки: 13 Апр. 2020

Оставьте ответ

Ваш электронный адрес не будет опубликован.