help@sirius.online ВЕРСИЯ ДЛЯ СЛАБОВИДЯЩИХ

Образовательный центр «Сириус» продолжает цикл учебных модулей в рамках программы «Уроки настоящего», направленной на знакомство школьников с лидерами науки и производства и решение исследовательских и научно-технологических проектных задач на базе школьных студий.

1 февраля открылся новый, шестой, цикл проекта — «Уроки настоящей обработки данных», — который Центр проводит совместно с компанией Яндекс. 

Яндекс — давний партнер проекта: за пять лет существования программы эксперты компании проводят уже третий цикл. Первые два модуля были посвящены машинному обучению (ребята учились распознавать текст на изображениях разной сложности) и алгоритмам (участники пробовали создать программу для управления дронами, роверами и автономными автомобилями для доставки заказов). На очереди — «Уроки настоящей обработки данных». Февральский цикл будет посвящен упорядочению и исключению избыточной информации (т.е. нормализации данных) в базах данных, автоматизированному анализу текстов на основные орфографические ошибки, их замене с помощью алгоритмов и моделей Machine Learning. 

4 февраля в 16:00 по мск на Youtube-канале «Сириуса» состоится открытая онлайн-лекция «Методы нормализации неструктурированных данных. Уточнение данных на практике». Ссылка на трансляцию: https://youtu.be/4xmmdvhhOnM. К участию приглашаются все желающие.

Перед началом цикла мы попросили научного лидера месяца Алексея Толстикова, старшего преподавателя факультета прикладной математики и информатики Белорусского государственного университета, куратора Школы анализа данных в компании «Яндекс» (г. Минск), тренера студентов и школьников на олимпиадах по программированию, подробнее рассказать о предстоящем кейсе и сфере аналитики данных в целом.

Алексей, расскажите, пожалуйста, над каким кейсом участникам предстоит работать.

В нашем модуле мы с коллегами решили предложить школьникам попробовать погрузиться в область анализа данных на примере первого этапа обработки данных: необходимо проанализировать «чистоту» данных. Дело в том, что данные обычно приходят из разнородных источников, и для корректной обработки в автоматизированном режиме обычно требуется максимальное соответствие структуре. 

Мы предлагаем изучить методы сопоставления текстовой информации на основе регулярных выражений, исправления опечаток в названиях, нормализации названий. В первую очередь эта задача имеет профориентационный характер: ребята попробуют разные приемы в программировании, получат наиболее чистый набор данных. Описанные выше техники и приемы являются активно используемыми в профессии, так что участники станут на несколько шагов ближе к анализу данных.

Чем вообще занимаются аналитики данных? Расскажите немного об этой специальности.

В современном IT аналитики данных занимаются очень разнообразными задачами: от анализа аномалий в поведении сервисов до предсказания показателей в краткосрочной и долгосрочной перспективе. Т.е. с использованием математического аппарата и программирования приходится пристально рассматривать прошлое, а порой с оценкой возможных ошибок заглядывать в будущее. Лично я бы назвал эту специальность программированием для математиков, тех, кому по каким-то причинам не очень нравится реализовывать большие программные продукты, но кому нравится цифровой мир и нравится «расследовать» аномалии и искать их первопричины.

Почему сфера анализа и обработки данных приобрела такую популярность в последнее время? И можно ли простыми словами объяснить, что это такое?

Я бы не стал упрощать эту область слишком сильно и говорить, что могу описать ее несколькими словами. Но ответ о популярности данной области лежит на поверхности: за два десятилетия объем данных, которые подчиняются анализу и использованию для улучшения сервиса, вырос на множество порядков. И, конечно, тут речь не только про интернет, но и развитие технических инструментов, позволяющих анализировать природные явления, космос или физику микрочастиц.  

В каких сферах могут применяться большие данные?

В данный момент большие данные генерируются и обрабатываются повсеместно, поэтому оставлю ответ на этот вопрос участникам нашего модуля. Посмотрите вокруг себя, попробуйте представить, как изменились общественный транспорт, магазины или спорт за последние несколько десятилетий. Как вы думаете, какие изменения в этих областях произошли или могли бы произойти на основе данных?

Если шире говорить об обучении, как растить разработчиков, аналитиков? Чему вы учите у себя в Школе анализа данных?

Я уже более 10 лет занимаюсь образованием в Яндексе, и это доставляет мне огромное удовольствие. Наши программы нацелены на активное и глубокое изучение материала, при этом мы очень стараемся совместить практическую нацеленность информации и фундаментальные теоретические основы. Выпускники Школы имеют отличные знания в области разработки программного обеспечения, анализа данных и высокоэффективной разработки. 

Программа ШАД рассчитана на студентов старших курсов, магистрантов и выпускников. Обучение проходит по четырем направлениям: «Разработка машинного обучения», «Data science», «Инфраструктура больших данных» и «Анализ данных в прикладных науках». В целом в программу обучения входит более 40 курсов, из которых учащиеся компонуют интересную для себя  траекторию знаний.

ШАД — это часть Академии Яндекса. И в Академии есть активности в том числе и для школьников: в них можно попробовать очень разные области знаний и занятий. 

В этом смысле очень похоже на наши «Уроки настоящего».

Да. Именно поэтому наша компания активно участвует в образовательных программах с партнерами. Мы убеждены, что качественное образование должно быть доступным широкому кругу заинтересованных школьников. И «Уроки настоящего» являются в этом плане уникальным проектом, показывающим школьникам всей страны, какие области знаний сейчас наиболее востребованы, чем занимаются специалисты в различных отраслях. Это прекрасный пример продуманного профориентационного круглогодичного цикла.
 
Что бы вы могли пожелать участникам проекта?

Наслаждайтесь командной работой, учитесь друг у друга, помогайте товарищам узнавать что-то новое. Ваша совместная работа — наиболее ценный социальный капитал для достижения высоких целей. Знакомьтесь с ребятами из других студий, общайтесь, развивайтесь. Успехов, ребята!

Задать вопросы об участии в проекте «Уроки настоящего» можно в официальной группе проекта в социальной сети «ВКонтакте».

Поделиться
Подать заявку
© 2015–2024 Фонд «Талант и успех»
Нашли ошибку на сайте? Нажмите Ctrl(Cmd) + Enter. Спасибо!