Сообщество Engee

Кластеризация результатов анкетирования

Автор
avatar-aigul678aigul678

В современном анализе данных часто возникает задача выявления скрытых закономерностей в результатах анкетирования, где встречаются как числовые, так и текстовые ответы. Для решения подобных задач применяются методы машинного обучения, в частности - кластеризация и обработка естественного языка. В статье рассмотрен анализ оценки обратной связи по образовательному курсу с применением этих методов.

В условиях цифровизации образования, задача структурирования и интерпретации обратной связи обучающихся становится особенно актуальной. Анкетирование является основным инструментом изучения мнений и предпочтений студентов, однако разнообразие форм ответов (от числовых оценок до развернутых текстов) усложняет анализ. Для повышения эффективности выделения паттернов в таких данных применяются современные методы машинного обучения, в частности - кластеризация, что позволяет не только структурировать аудиторию, но и выявить сегменты для последующей персонализации образовательных продуктов.

В рамках данного проекта проведён анализ оценки обратной связи по курсу Маркетинг с использованием комплексного подхода: были обработаны как числовые, так и текстовые ответы. Основные задачи - выявить группы респондентов с помощью различных методов кластеризации и визуализировать результаты в удобном для интерпретации виде.

К статье прилагается скрипт, позволяющий автоматически обрабатывать результаты анкетирования, выделять ключевые темы в текстовых отзывах и формировать кластеры по схожим оценкам.