Обработка больших данных

5 недель, от 8 до 9 часов в неделю,

начало 30 июня

Тип обучения

Курс

Трудоустройство

Нет

Зач. единицы

Стоимость курса

бесплатно

Нет рассрочки

Ключ к успешному развитию любой компании в современном мире — это умение принимать быстрые и правильные решения, основываясь на данных. С каждым годом данные становятся все объемнее, а старые методы анализа перестают быть эффективными. На этом онлайн-курсе мы изучим основные технологии и приемы, используемые для работы с информацией, узнаем больше о природе возникновения информации, способах ее получения и необходимой инженерной подготовки для работы с ней.

Школа

Национальный исследовательский университет "Высшая школа экономики"

0 отзывов

Национальный исследовательский университет «Высшая школа экономики» — исследовательский университет, осуществляющий свою миссию через научно-образовательную, проектную, экспертно-аналитическую и социокультурную деятельности на основе международных научных и организационных стандартов.

Мы осознаем себя частью мирового академического сообщества, считаем международное партнерство, вовлеченность в глобальное университетское взаимодействие ключевыми элементами нашего движения вперед. Будучи российским университетом, мы работаем на благо России и ее граждан.

Наш университет — это коллектив ученых, сотрудников, аспирантов и студентов, которых отличает внутренняя приверженность к поддержанию высоких академических стандартов своей деятельности. Мы стремимся обеспечить наиболее благоприятные условия для развития каждого члена нашего коллектива.

Наши ценности:

Стремление к истине
Сотрудничество и заинтересованность друг в друге
Честность и открытость
Академическая свобода и политический нейтралитет
Профессионализм, требовательность к себе и ответственность
Активная общественная позиция

Сегодня Высшая школа экономики — это:

4 КАМПУСА: МОСКВА, САНКТ-ПЕТЕРБУРГ, НИЖНИЙ НОВГОРОД, ПЕРМЬ
~7000ПРЕПОДАВАТЕЛЕЙ И ИССЛЕДОВАТЕЛЕЙ
50 400+СТУДЕНТОВ
100 800ВЫПУСКНИКОВ

Открытое образование

3.7

31 отзыв

Новый элемент системы российского образования — открытые онлайн-курсы — cможет перезачесть любой университет. Мы делаем это реальной практикой, расширяя границы образования для каждого студента. Полный набор курсов от ведущих университетов. Мы ведём системную работу по созданию курсов для базовой части всех направлений подготовки, обеспечивая удобное и выгодное для любого университета встраивание курса в свои образовательные программы
«Открытое образование» – это образовательная платформа, предлагающая массовые онлайн-курсы ведущих российских вузов, которые объединили свои усилия, чтобы предоставить возможность каждому получить качественное высшее образование.

Любой пользователь может совершенно бесплатно и в любое время проходить курсы от ведущих университетов России, а студенты российских вузов смогут засчитать результаты обучения в своем университете.

Преподаватели

Космачев Алексей Дмитриевич

курса

Должность: Преподаватель: Факультет Математических Наук

Бардуков Анатолий Андреевич

курса

Аспирант Должность: Преподаватель: Факультет компьютерных наук / Департамент больших данных и информационного поиска

Зимонов Андрей Вадимович

курс

Должность: Старший преподаватель: Факультет компьютерных наук

Образование 2013: Специалитет: Московский государственный университет им. М.В. Ломоносова, специальность «Прикладная математика и информатика», квалификация «математик, системный программист»

Программа курса

1. Базовые подходы к хранению и извлечению информации

На этой неделе мы познакомимся с SQL и NoSQL базами данных и извлечением информации из Интернета. Ведь большие данные откуда-то нужно брать.

2. Bash для инженера данных

На этой неделе мы научимся работать с командной строкой в bash. Это очень полезное умение, которое пригодится на протяжении всего курса.

3. Начало работы с большим объемом данных: Hadoop, MapReduce

В этом модуле разберемся, как устроены два важных компонента экосистемы Hadoop: файловая система HDFS и API для вычислений MapReduce. Посмотрим, почему они устроены именно так и почему горизонтальная масштабируемость – это хорошо.

4. Знакомство со Spark

На этой неделе разберем фреймворк для распределенных вычислений Spark. С ним сильно проще работать из Python и он умеет много всего.

5. Продвинутое использование Spark

На этой неделе на примере задачи классификации текстов посмотрим, что еще умеет Spark и как это помогает решать задачи машинного обучения.

Рейтинг курса

Может быть интересно

Образовал