Основная суть проекта
Networks of Opportunity — это интерактивное веб-приложение для анализа данных о вакансиях, собранных в рамках проекта РосНавык.
Функционал приложения
- Визуализировать связи 🔗 между навыками, специальностями, регионами, работодателями и другими переменными через двумодальные и одномодальные графы.
- Анализировать данные 📊 с помощью фильтров (работодатель, навыки, заработная плата, опыт работы и др.).
- Искать схожие узлы в графе 🔍 через векторное сходство.
- Определять целевые навыки 🎯, необходимые для получения сразу нескольких квалификаций.
- Анализировать кластеры компетенций 🧠 с помощью выделения сообществ в графе.
- Оценивать ценность навыков 💰 через привязку к зарплатным предложениям.
Как можно использовать веб-приложение для анализа рынка труда и компетенций 🌐
- Выявлять, какие навыки чаще всего требуются совместно в вакансиях, чтобы строить актуальные профили компетенций для разных специальностей.
- Определять пересекающиеся навыки между различными специальностями, чтобы находить универсальные и смежные компетенции для переквалификации или расширения профиля кандидата.
- Находить группы похожих между собой специальностей по требуемым навыкам для планирования карьерных переходов и построения альтернативных карьерных траекторий.
- Анализировать спрос на навыки и профессии со стороны компаний, чтобы выявлять возможности для партнерств, стажировок или усиления кадровой политики.
- Разрабатывать новые продукты и сервисы в области образования, HR или рекрутинга на основе анализа текущего рынка требований к навыкам.
- Фокусироваться на дорогостоящих и актуальных для топ-компаний навыках для создания коммерчески успешных программ и проектов.
Основные компоненты приложения
1. Боковая панель 📑
- Загрузка данных: Загрузка Excel-файла с вакансиями.
-
Фильтры данных:
- Дата публикации, регион, заработная плата, опыт работы, специальность.
- Автоматическое обновление диапазонов фильтров на основе структуры загруженного датасета.
- Настройки графа: Выбор переменных для двумодального графа (например, "Специальность ↔ Навыки").
- Порог фильтрации для графов по силе связей и настройка параметров визуализации (размер узлов, размер ребер, цветовая кодировка).
2. Основные панели для анализа данных 📚
-
Вкладка "Сеть":
- Двумодальный граф: Визуализация связей между двумя категориями (например, "Работодатель ↔ Навыки").
- Одномодальный граф:
- Построение графа со-встречаемости по частоте совместного появления в вакансиях (например, "Навыки ↔ Навыки")
- Построение графа схожести по связующей переменной (например, "Работодатель ↔ Работодатель" через Навыки)
-
Вкладка "Рекомендации":
- Схожие узлы: Топ-N элементов, наиболее похожих на выбранный узел.
- Соседние узлы: Топ-N прямых соседей выбранного узла.
Технические особенности ⚙️
- Визуализация графов: Библиотека ipysigma на основе Sigma.js и Graphology.
- Сетевой анализ: Расчет метрик центральности (степень, близость, посредничество) через NetworkX.
- Рекомендательная система: Поиск схожих узлов через обобщенную меру Жаккара.
Как начать работу 🏁
- Загрузите данные через боковую панель.
- Настройте фильтры (работодатель, навыки, специальности, регион и др.).
- Изучите графы: Выберите переменные для одномодальных и двумодальных графов, настройте визуализацию узлов и ребер.
- Проведите сетевой анализ: Оцените структуры сообществ, центральность и схожесть узлов.
- Получите рекомендации: Выберите узел и получите персонализированные рекомендации на основе структуры графа.
Инструкция по загрузке и фильтрации данных
Пошаговое руководство по загрузке и фильтрации данных в приложении
Шаг 1: Загрузка данных
Действия:
- На боковой панели найдите раздел "Обработка данных".
- Нажмите кнопку "Обзор" и выберите Excel‑файл с данными о вакансиях, выгруженными из раздела "Данные" в личном кабинете аналитической платформы РосНавык.
Результат:
После загрузки файла обновляются фильтры и аналитические панели.
Шаг 2: Фильтрация загруженных данных
Действия:
- Нажмите на секцию "Фильтрация загруженных данных", чтобы развернуть список доступных фильтров.
- В зависимости от столбцов, присутствующих в загруженных данных, выберите подходящие фильтры.
- Используйте опцию мульти‑выбора для целевой фильтрации данных.
Результат:
После настройки фильтров автоматически обновятся аналитические панели "Сеть" и "Рекомендация".
Шаг 3: Фильтрация двумодального графа
Действия:
- Нажмите на секцию "Фильтрация двумодального графа", чтобы развернуть список доступных переменных.
- Выберите требуемые переменные для построения графа, демонстрирующего взаимосвязь двух категорий.
- Для просмотра графа выберите панель "Сеть" и перейдите в раздел "Двумодальный граф".
Примечание:
Двумодальный граф — это визуальное представление взаимосвязей между двумя разными категориями, например, работодателями и навыками, которые они требуют.
Эти графы позволяют анализировать спрос на навыки и профессии, выявлять возможности для партнерств, разрабатывать новые продукты и сервисы.
Шаг 4: Фильтрация графа со-встречаемости
Действия:
- Нажмите на секцию "Фильтрация графа со-встречаемости", чтобы развернуть список доступных переменных.
- Выберите переменную для построения графа, который покажет, как часто одни и те же навыки встречаются в вакансиях.
- Для просмотра графа выберите панель "Сеть" и перейдите в раздел "Граф со-встречаемости".
Примечание:
Граф со-встречаемости — это визуальное представление того, как часто встречаются одни и те же элементы, например, навыки в вакансиях.
Такой граф помогает выявить востребованные комбинации навыков, что может быть полезно для оптимизации образовательных программ и разработки новых продуктов или сервисов.
Шаг 5: Фильтрация графа схожести
Действия:
- Перейдите в секцию "Фильтрация графа схожести".
- Выберите переменную для построения графа и настройте связующие переменные для анализа сходства вакансий.
Примечание:
Граф схожести — это визуальное представление, которое показывает, насколько близки объекты (например, работодатели, специальности, регионы) по своим характеристикам через общие связующие переменные (например, навыки).
Такой граф позволяет выявить группы с одинаковыми требованиями к навыкам.
Инструкция по работе с двумодальным графом
Пошаговое руководство по работе с визуализацией двумодального графа
Шаг 1: Выбор переменных
Действия:
- Откройте секцию "Фильтрация двумодального графа" на боковой панели.
- Выберите переменные, определяющие взаимосвязи между категориями (например, специальности и навыки).
- Перейдите на панель "Сеть" и выберите раздел "Двумодальный граф" для просмотра визуализации.
Примечание:
Выбор переменных задаёт основу для построения графа, определяя, какие данные будут сопоставлены друг с другом.
Шаг 2: Общие фильтры
Действия:
- Используйте ползунок "Порог силы связей" для задания минимальной величины связи между узлами. Это помогает исключить слабые взаимосвязи.
- Настройте диапазоны для размеров узлов и ребер, чтобы задать визуальные свойства графа.
- Задайте значение "Разрешение Louvain" для разделения узлов на сообщества.
Примечание:
Фильтры контролируют базовые параметры графа: отсекают слабые связи, задают размеры узлов/ребер и помогают выявить структуру сообществ в сети.
Шаг 3: Выделение цвета узла
Действия:
- Выберите опцию "Выделение цвета узла" в панели фильтров.
- Определите критерий окраски:
- Модулярность – узлы окрашиваются в зависимости от принадлежности к сетевым сообществам.
- Модальность – одна категория узлов выделяется одним цветом, а другая - другим (например, специальности - синем цветом, а навыки - красным).
- Уникальность/общность – уникальные узлы из второй переменной (например, навыки) выделяются одним цветом, а общие – другим.
Примечание:
Выбор цвета узла помогает визуально различать группы элементов.
Шаг 4: Метрика размера узла
Действия:
- Выберите опцию "Метрика размера узла" для определения важности узлов в графе.
- Обратите внимание на предлагаемые опции:
- Центральность по степени – оценивает количество прямых связей узла.
- Центральность по близости – измеряет, насколько узел расположен близко к другим.
- Центральность по посредничеству – показывает роль узла как связующего элемента между разными группами.
- Настройте диапазон размеров узлов с помощью ползунка для визуального отражения выбранной метрики.
Примечание:
Метрика размера узла определяет, насколько важен каждый элемент. Узлы с большим количеством связей или критической ролью в сети будут отображаться крупнее.
Инструкция по работе с графом со-встречаемости
Пошаговое руководство по работе с визуализацией графа со-встречаемости
Шаг 1: Выбор переменных
Действия:
- Откройте секцию "Фильтрация графа со‑встречаемости" на боковой панели.
- Выберите доступную переменную (например, ключевые навыки) для определения взаимосвязей между навыками.
- Перейдите на панель "Сеть" и выберите раздел "Граф со‑встречаемости" для просмотра визуализации.
Примечание:
Этот шаг задаёт основу для построения графа на основе частоты совместного появления навыков в вакансиях.
Шаг 2: Общие фильтры
Действия:
- Используйте ползунок "Порог силы связей" для задания минимальной величины связи между узлами. Это помогает исключить слабые взаимосвязи.
- Настройте диапазоны для размеров узлов и ребер, чтобы задать визуальные свойства графа.
- Задайте значение "Разрешение Louvain" для разделения узлов на сообщества.
Примечание:
Фильтры контролируют базовые параметры графа: отсекают слабые связи, задают размеры узлов/ребер и помогают выявить структуру сообществ в сети.
Шаг 3: Выделение цвета узла
Действия:
- Выберите опцию "Выделение цвета узла" в панели фильтров.
- Определите критерий окраски:
- Модулярность – узлы окрашиваются в зависимости от принадлежности к сетевым сообществам.
- Целевые узлы навыков – узлы, соответствующие выбранным навыкам в секции "Фильтрация загруженных данных", выделяются одним цветом, а остальные - другим.
- Заработная плата – узлы окрашиваются градиентом (от светло-зелёного до тёмно-зелёного) в зависимости от медианного уровня зарплаты.
Примечание:
Выбор цвета узла помогает визуально различать группы элементов.
Шаг 4: Метрика размера узла
Действия:
- Выберите опцию "Метрика размера узла" для определения важности узлов в графе.
- Обратите внимание на предлагаемые опции:
- Центральность по степени – оценивает количество прямых связей узла.
- Центральность по близости – измеряет, насколько узел расположен близко к другим.
- Центральность по посредничеству – показывает роль узла как связующего элемента между разными группами.
- Настройте диапазон размеров узлов с помощью ползунка для визуального отражения выбранной метрики.
Примечание:
Метрика размера узла определяет, насколько важен каждый элемент. Узлы с большим количеством связей или критической ролью в сети будут отображаться крупнее.
Инструкция по работе с графом схожести
Пошаговое руководство по работе с визуализацией графа схожести
Шаг 1: Выбор переменных
Действия:
- Откройте секцию "Фильтрация графа схожести" на боковой панели.
- Выберите необходимые переменные (например, работодатели и навыки) для определения схожести объектов.
- Перейдите на вкладку "Сеть" и выберите раздел "Граф схожести" для просмотра визуализации.
Примечание:
Выбор переменных задаёт основу для анализа схожести между объектами, определяя, какие данные будут сравниваться.
Шаг 2: Общие фильтры
Действия:
- Используйте ползунок "Порог схожести" для задания минимального уровня схожести между объектами. Значение устанавливается от 0 до 100%.
- Настройте диапазоны для размера узлов и ребер с помощью соответствующих ползунков.
- Задайте параметр "Разрешение Louvain" для более детального выделения сообществ в графе.
Примечание:
Общие фильтры управляют базовыми параметрами графа, исключая слабые связи и задавая визуальные пределы для узлов и ребер.
Шаг 3: Выделение цвета узла
Действия:
- Выберите опцию "Выделение цвета узла" в панели фильтров.
- Определите способ окраски:
- Модулярность – узлы окрашиваются в зависимости от принадлежности к сетевым сообществам.
- Заработная плата – узлы окрашиваются градиентом (от светло-зелёного до тёмно-зелёного) в зависимости от медианного уровня зарплаты.
Примечание:
Выбор цвета узла помогает визуально различать группы элементов.
Шаг 4: Метрика размера узла
Действия:
- Выберите опцию "Метрика размера узла" для определения важности узлов в графе.
- Обратите внимание на предлагаемые опции:
- Центральность по степени – оценивает количество прямых связей узла.
- Центральность по близости – измеряет, насколько узел расположен близко к другим.
- Центральность по посредничеству – показывает роль узла как связующего элемента между разными группами.
- Настройте диапазон размеров узлов с помощью ползунка для визуального отражения выбранной метрики.
Примечание:
Метрика размера узла определяет, насколько важен каждый элемент. Узлы с большим количеством связей или критической ролью в сети будут отображаться крупнее.
Инструкция по работе с панелью "Рекомендация"
Пошаговое руководство по работе с визуализацией рекомендаций
Шаг 1: Выбор переменных
Действия:
- Откройте секцию "Фильтрация двумодального графа" на боковой панели.
- Выберите переменные, определяющие взаимосвязи между категориями (например, специальности и навыки).
- Двумодальные графы используются для рекомендации схожих и соседних узлов.
Рекомендация схожих узлов
Действия:
- Перейдите на вкладку "Рекомендация" и выберите раздел "Рекомендация схожих узлов" для просмотра визуализации.
- Выберите интересующий вас узел (например, специальность или навык) из выпадающего списка.
- Укажите количество рекомендуемых узлов в поле "Количество наблюдений".
- Система рассчитает схожесть выбранного узла с другими на основе весовых характеристик их связей и отобразит столбчатую диаграмму с результатами.
Примечание:
Столбчатая диаграмма иллюстрирует процентное соотношение схожести между узлами, позволяя выявить наиболее похожие объекты внутри графа.
Рекомендация соседних узлов
Действия:
- Перейдите на вкладку "Рекомендация" и выберите раздел "Рекомендация соседних узлов" для просмотра визуализации.
- Выберите из списка узел, для которого необходимо найти непосредственно связанные соседние узлы.
- Укажите количество рекомендуемых соседних узлов через поле "Количество наблюдений".
- Система сформирует столбчатую диаграмму, отображающую вес (интенсивность связи) между выбранным узлом и его ближайшими соседями.
Примечание:
Отображается информация о сильнейших связях выбранного узла, что помогает выявить его ключевых соседей в графе
Рекомендации рассчитываются на основе анализа взаимосвязей в графе с применением обобщённого коэффициента Жаккара. Этот коэффициент вычисляется путем сравнения двух векторов, представляющих весовые характеристики связей выбранного узла и другого узла. Он определяется как отношение суммы минимальных значений к сумме максимальных, что дает значение от 0 до 1. Узлы с более высоким коэффициентом схожести (ближе к 1) рекомендуются как схожие.
Аналогично, при рекомендации соседних узлов система анализирует прямые связи и их весовые показатели, позволяя выделить ближайших и наиболее влиятельных соседей.