The Big Data Developer Course
Master the most in-demand big data skills: Hadoop, Sqoop, Hive, Spark, Scala, Cassandra, HBase, NIFI, Kafka and more
Чему вы научитесь:
Понимание архитектуры Hadoop
Понимание форматов файлов и возможность выбрать правильный формат для данного варианта...
Аналитика большихданныхдля руководителей
Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, безопасность озера данных, цифровизация бизнеса.
О продукте:
Сегодня...
BDAM: Аналитика большихданныхдля руководителей
Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, безопасность озера данных, цифровизация бизнеса.
О продукте:
Сегодня...
Часть 1. Основы GreenPlum: GreenPlum как реляционная MPP СУБД
Введение в GreenPlum
Архитектура GreenPlum
Партиционирование таблиц, индексы
Транзакции и блокировки
Оптимизация и планы запросов
Лабораторная работа
Часть 2. Внешние данные и код: GreenPlum как агрегатор данных и исполнитель кода...
Программа курса Администрирование кластера Kafka
1. Введение в Kafka
Что такое Apache Kafka?
Сценарии использования Kafka
Компоненты Kafka и Kafka экосистемы
Архитектура Kafka
Кластер Zookeeper (Установка кластера Kafka без использования Zookeeper KIP-500)
2. Основные концепции Kafka
Как...
Этот курс предназначен для специалистов, анализирующих огромные наборы данных, а также разработчиков, использующих R в своих проектах.
Цель курса – предоставить слушателям знания и навыки, необходимые для создания и запуска сценариев анализа большихданных на сервере Microsoft R. Также в курсе...
Описание
О чем эта книга
Автор этой книги понятным неспециалисту языком рассказывает о том, что такое большие данные, как они меняют мир и что нужно делать, чтобы повысить уровень аналитики в своей организации и принимать взвешенные решения, основанные на информации. Из этой книги вы узнаете...
Перед вами полноценный путеводитель в увлекательный мир обработки данных при помощи Pandas, NumPy и Scikit-learn. Она содержит множество примеров, которые помогут вам научиться преобразовывать сырые крупицы данных в настоящий шедевр из ценной информации и аналитических выводов. Книга написана...
PRAR: Практическая архитектура данных
Классические методы, современные подходы и лучшие практики архитектуры и интеграции данныхдля проектных команд.
На примерах платформенных решений, корпоративных фабрик данных, микросервисов и веб-приложений.
Архитектура данных (Data Architecture):
Это...
Elasticsearch — мощный инструмент для работы с большими объемами данных. Это масштабируемая, надежная и быстрая система со множеством функций для анализа и поиска данных.
Книга представляет собой подробное руководство по использованию Elasticsearch для управления данными. В начале приводится...
Книга о том, как распознавать ложь, дезинформацию, фейковые новости и не попасться на удочку красивых графиков, убедительной статистики и наукообразных терминов.
В отличие от прямой лжи чушь звучит весьма правдоподобно. Это информация, про которую нельзя однозначно сказать, что она ложна, но...
Чему вы научитесь:
Dagger 2
Dependency Injection
Android
Архитектура приложений
Требования:
Kotlin/Java
Описание:
Dagger 2 - самое популярное решения для DI в современных Android проектах и официально рекомендуемое Google. Зачастую разработчики из-за поверхностных знаний по его применению...
Узнайте о науке о данных, машинном обучении и глубоком обучении и создайте 5 разных проектов.
Авторы: Raj Chhabria
Последнее обновление: 01.2023
Английский
Видео с русским переводом [авто]
Чему вы научитесь
Узнайте о таких библиотеках, как Pandas и Numpy, которые активно используются в науке о...
Технология хранения и обработки большихданных Hadoop (Тимур Машнин)
Apache Hadoop - это платформа для распределенной обработки больших наборов данных на кластерах компьютеров с использованием простых моделей программирования. В этой книге вы познакомитесь с общей архитектурой платформы...
Казалось бы, термин «большие данные» понятен и доступен только специалистам. Но автор этой книги доказывает, что анализ данных можно организовать и в простом, понятном, очень эффективном и знакомом многим Excel. Причем не важно, сколько велик ваш массив данных. Техники, предложенные в этой...
В этой книге вы познакомитесь с тем, как администраторы баз данных могли бы использовать MySQL для обработки миллиардов записей и извлечения данных с производительностью, сравнимой или превосходящей коммерческие решения для СУБД с более высокими затратами.
Показано как реализовывать успешную...
Курс посвящен изучению подходов к проектированию архитектуры веб-приложений таким образом, чтобы упрощать поддержку и разработку в процессе роста команды и продукта.
В нашем понимании архитектура — это «правила дорожного движения», но только в разработке. Без правил каждый будет делать, как...
Apache Arrow – это программная платформа с открытым исходным кодом, предназначенная для разработки приложений, эффективно выполняющих обработку и анализ табличных данных за счет размещения в оперативной памяти. В обновленном втором издании представлен обзор формата Arrow с акцентом на его...
Погрузитесь в мир алгоритмов! Разберитесь в их принципах, особенностях проектирования и практического применения.
Вы познакомитесь с различными видами алгоритмов, узнаете их сильные и слабые стороны, и поймете, в каких контекстах они лучше всего работают. На практических примерах увидите, как...
Чему вы научитесь
Научатся базовым понятиям языка программирования Python и его синтаксу
Получат практический опыт работы с библиотекой Pandas, научатся манипулировать и анализировать наборы данныхдля их подготовки к визуализации.
Научатся визуализировать данные и строить графики с помощью...