Участники научно-технологической программы «Большие вызовы» разработали цифровой инструмент изучения аудитории для образовательного проекта Сириус.Курсы и выяснили, как выполняют задания разные группы учеников. Это поможет создать систему персональных рекомендаций, мотивации и поощрений.
Разработка велась по направлению «Большие данные, искусственный интеллект, финансовые технологии и машинное обучение».
Сириус.Курсы и их ученики
Сириус.Курсы – образовательный проект со 150-тысячной аудиторией. Ежедневно школьники со всей страны смотрят лекции, решают задачи и выполняют задания на 19 курсах по 6 направлениям: математика, программирование, физика, химия, лингвистика и биология.
В среднем ребятам, которые учатся на дистанционных курсах, от 12 до 17 лет, мальчиков и девочек примерно поровну, а основной интерес вызывают курсы по математике и программированию.
«Чтобы давать ученикам персональные рекомендации, которые помогут повысить успеваемость и преодолеть трудности в учебе, нужны более тонкие настройки. Необходимо знать не просто пол и возраст пользователей, а, например, то, в каком темпе ученик проходит курс, с какими проблемами сталкивается на пути, учится ли он на одном курсе или выбирает несколько, мешает ли это дойти до финиша или, наоборот, помогает», – объясняет Артем Волчихин, десятиклассник из Кургана.
Чтобы определить различные модели поведения аудитории, необходимо разбить учеников на несколько однородных групп. Впоследствии можно будет персонализировать обучение для каждой из них. На математическом языке задача разделения некоторого множества объектов на группы по принципу их схожести называется задачей кластеризации.
Именно эта задача стояла перед участниками — разработать инструмент для кластеризации аудитории и выявить различные модели поведения учеников.
Поиск уникальных параметров
Чтобы понять, чем ученики отличаются друг от друга, нужно решить, по каким параметрам их сравнивать. Сириус.Курсы предоставили данные о том, как решают каждую задачу на платформе. На основе этого исследователи вычисляли уникальные параметры, характеризующие ученика.
На следующем этапе ребятам предстояло выбрать наилучший алгоритм кластеризации.
«Для кластеризации существуют различные алгоритмы. Мы попробовали три из них: k-means++, dbscan и optics. Чтобы оценить качество работы каждого из алгоритмов, мы создали программу, которая по загруженному в нее файлу с данными и результатами кластеризации строит таблицы с различными метриками. Так оказалось, что все лучшие результаты были получены с помощью алгоритма optics», – рассказывает участница программы Марта Степашкина, ученица 10-го класса из Липецка.
Чтобы удостовериться в результате исследований, участники провели 22 различных кластеризации и сгенерировали отчеты по ним. Интерпретация получившихся кластеров и есть выявление различных моделей поведения учеников.
Математики и лингвисты
По результатам одной из кластеризаций, например, выяснилось, что стиль выполнения заданий учеников разных курсов может сильно отличаться. Так, слушатели курса по геометрии учатся в рваном ритме: бодро стартуют, к середине курса забрасывают учебу, а затем интенсивно нагоняют программу и сдают задачи в последние дни перед дедлайном (узнаете себя?). А вот их коллеги-лингвисты проходят курс без долгих пауз: посещают платформу регулярно, смотрят лекции и выполняют задания.
Предполагается, что опираясь на эти знания, платформа в будущем сможет персонализировать рекомендации ученикам в зависимости от их успеваемости, вовлеченности или темпа прохождения курсов.
Результаты исследований и программные наработки участники программы разметили в открытом доступе на GitHub, а также передали команде Сириус.Курсов для внедрения в работу.
Справочно
Сириус.Курсы – проект в сфере онлайн-образования. Команда Сириус.Курсов создает сервисы для проведения школьных олимпиад и продвинутые онлайн-курсы для школьников, учителей и всех желающих. Авторы курсов — преподаватели ведущих школ и вузов страны, педагоги очных программ Образовательного центра «Сириус». На Сириус.Курсах доступны 18 бесплатных онлайн-курсов по 6 научным дисциплинам: математика, физика, химия, биология, информатика, лингвистика.