Аналитикабольшихданныхдляруководителей
Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, безопасность озера данных, цифровизация бизнеса.
О продукте:
Сегодня...
BDAM: Аналитикабольшихданныхдляруководителей
Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, безопасность озера данных, цифровизация бизнеса.
О продукте:
Сегодня...
Часть 1. Основы GreenPlum: GreenPlum как реляционная MPP СУБД
Введение в GreenPlum
Архитектура GreenPlum
Партиционирование таблиц, индексы
Транзакции и блокировки
Оптимизация и планы запросов
Лабораторная работа
Часть 2. Внешние данные и код: GreenPlum как агрегатор данных и исполнитель кода...
PRAR: Практическая архитектура данных
Классические методы, современные подходы и лучшие практики архитектуры и интеграции данныхдля проектных команд.
На примерах платформенных решений, корпоративных фабрик данных, микросервисов и веб-приложений.
Архитектура данных (Data Architecture):
Это...
Программа курса Администрирование кластера Kafka
1. Введение в Kafka
Что такое Apache Kafka?
Сценарии использования Kafka
Компоненты Kafka и Kafka экосистемы
Архитектура Kafka
Кластер Zookeeper (Установка кластера Kafka без использования Zookeeper KIP-500)
2. Основные концепции Kafka
Как...
Описание
О чем эта книга
Автор этой книги понятным неспециалисту языком рассказывает о том, что такое большие данные, как они меняют мир и что нужно делать, чтобы повысить уровень аналитики в своей организации и принимать взвешенные решения, основанные на информации. Из этой книги вы узнаете...
О книге:
Data driven – стратегия принятия управленческих решений на основе данных. Основатель Valiotti Analytics и аналитик с 15-летним опытом работы в Ленте и Yota точно знает как сделать этот подход основой для ведения бизнеса. Он написал очень понятную книгу про аналитику дляруководителей...
Книга о том, как распознавать ложь, дезинформацию, фейковые новости и не попасться на удочку красивых графиков, убедительной статистики и наукообразных терминов.
В отличие от прямой лжи чушь звучит весьма правдоподобно. Это информация, про которую нельзя однозначно сказать, что она ложна, но...
The Big Data Developer Course
Master the most in-demand big data skills: Hadoop, Sqoop, Hive, Spark, Scala, Cassandra, HBase, NIFI, Kafka and more
Чему вы научитесь:
Понимание архитектуры Hadoop
Понимание форматов файлов и возможность выбрать правильный формат для данного варианта...
Цель нашего курса — помочь опытным аналитикам расширить свои компетенции и задать правильное направление для дальнейшего развития в профессии. Полученный практический опыт позволит углубить знания в области продуктовой аналитики и научиться подбирать правильные инструменты для решения задач в...
Технология хранения и обработки большихданных Hadoop (Тимур Машнин)
Apache Hadoop - это платформа для распределенной обработки больших наборов данных на кластерах компьютеров с использованием простых моделей программирования. В этой книге вы познакомитесь с общей архитектурой платформы...
Первая книга об HR-аналитике на русском языке
Понятно о том, где HR-специалисту найти данные в организации, как их собрать и проанализировать, а также как использовать для повышения эффективности бизнеса.
Передовой опыт компаний, использовавших HR-аналитику: AstraZeneca, Brompton Bikes...
Казалось бы, термин «большие данные» понятен и доступен только специалистам. Но автор этой книги доказывает, что анализ данных можно организовать и в простом, понятном, очень эффективном и знакомом многим Excel. Причем не важно, сколько велик ваш массив данных. Техники, предложенные в этой...
Аналитикадляруководителей.
Стратегия и развитие бизнеса на базе данных, а не на интуиции
Data driven – стратегия принятия управленческих решений на основе данных. Основатель Valiotti Analytics и аналитик с 15-летним опытом работы в Ленте и Yota точно знает как сделать этот подход основой для...
Apache Arrow – это программная платформа с открытым исходным кодом, предназначенная для разработки приложений, эффективно выполняющих обработку и анализ табличных данных за счет размещения в оперативной памяти. В обновленном втором издании представлен обзор формата Arrow с акцентом на его...
Этот курс предназначен для специалистов, анализирующих огромные наборы данных, а также разработчиков, использующих R в своих проектах.
Цель курса – предоставить слушателям знания и навыки, необходимые для создания и запуска сценариев анализа большихданных на сервере Microsoft R. Также в курсе...
Аннотация
В книге представлен исчерпывающий обзор SQL Server 2019 – инновационной версии популярной СУБД. Авторы рассказывают о производительности и безопасности, об использовании контейнеров и технологии Kubernetes, о работе с кластерами большихданных и средствах машинного обучения. Подробное...
В этой книге вы познакомитесь с тем, как администраторы баз данных могли бы использовать MySQL для обработки миллиардов записей и извлечения данных с производительностью, сравнимой или превосходящей коммерческие решения для СУБД с более высокими затратами.
Показано как реализовывать успешную...
Книга является пособием для изучения технологий большихданных, охватывая основные и продвинутые аспекты работы с данными в распределенных системах. Начав с основ, она объясняет значение БД, их эволюцию и экосистему Hadoop, включая компоненты и инструменты: HDFS, MapReduce, Hive, Pig, HBase...
О товаре:
Принятие решений на основе большихданных коренным образом меняет то, как мы работаем и живем. Имея доступ к почти не ограниченной корпоративной информации, руководители предприятий часто не понимают, что с ней делать.
Для тех, кто хочет модернизировать свой подход к обработке и...