Статья "Применение метода случайного леса для выявления де..."

Наименование статьиПрименение метода случайного леса для выявления детерминантов заработной платы.
Страницы30-36
АннотацияСтатья посвящена анализу предикторов заработной платы на основе данных о вакансиях, публикуемых в открытом доступе на интернет-портале федеральной государственной информационной системы Федеральной службы по труду и занятости «Работа России». Рассматривается вопрос о том, какие детерминанты вакансий определяют уровень заработной платы и делают их наиболее высокооплачиваемыми на рынке труда. Для их выявления автор использует метод машинного обучения «случайный лес». Качество прогноза методом случайного леса оценивается путем применения показателя средней абсолютной ошибки, который является лучше интерпретируемым в контексте используемой шкалы зависимой переменной. Помимо этого, рассчитаны значения средней квадратичной ошибки и оценки коэффициента детерминации, показывающего долю дисперсии зависимой переменной, объясненной предикторами. Для повышения точности модели проведена настройка гиперпараметров с помощью алгоритма RandomizedSearchCV, позволяющего выбрать из большого множества вариантов наилучшие. Результаты исследования показали, что в наибольшей мере на размер заработной платы влияет такая характеристика вакансий, как «регион, в котором открыта вакансия», и в относительно меньшей степени (но также существенно) – признаки «профессиональная сфера» и «график работы». Полученные выводы могут быть полезны для понимания факторов формирования конкурентной заработной платы и реализации эффективных мер поддержки на рынке труда.
Ключевые словазаработная плата, вакансии, рынок труда, метод случайного леса, точность модели, машинное обучение
ЖурналВопросы статистики
Номер выпуска5
Автор(ы)Салмина А. А.