Магуча #magucha — лингвистическая онтология для чтения вакансий и резюме

Программное обеспечение «Магуча» для машинного чтения вакансий и резюме современного рынка труда.

Магуча - язык машинного чтения вакансий и резюме

Машинное обучение в сфере распознавания и «понимания» текста русскоязычных вакансий и резюме

Сотрудниками проекта «Цифровая модель рынка труда» разработана языковая надстройка для ЯП Python под названием «МАГУЧА», позволяющая организовать машинное чтение и «понимание» вакансий и резюме российского рынка труда.

В частности, «Магуча» расшифровывает внутреннее содержание, которое находится в описаниях вакансий и резюме; понимает и классифицирует требования к соискателям, должностные инструкции, условия труда и другие поля.

Атлас рынка труда

«Магуча» существенно приближает нас к идеальной работе «Атласа современных профессий, специальностей и должностей», который в онлайн-режиме формирует актуальный портрет профессии, собирая его из требований к компетенциям соискателей, предлагаемой оплаты и условий труда, указанных в сотнях тысяч вакансий.

Также «Магуча» суммирует описания компетенций, которые специалисты указали в своих резюме, таким образом формируя обобщенный фактический портрет современного соискателя. Такой портрет соискателя можно сформировать как по России в целом, так и по каждому региону в отдельности.

Такое знание «портрета компетенции» может помочь крупным работодателям своевременно спроектировать образовательные программы для внутреннего переобучения, для курсов повышения квалификации.

Ясность в мире профессий

Важнейшей особенностью «Магуча» является возможность определения принадлежности вакансии к реальной профессии, в соответствии с таксономией профессий. Проблема заключается в том, что для множества профессий существуют десятки (а есть примеры и сотен) синонимов, профессиональных жаргонизмов, сокращений и отличающихся написаний.

 Очень часто обычная профессия (например, менеджера по продажам) «маскируется» под красивые должности («менеджер по работе с клиентами», «менеджер фронт-офиса», «менеджер проекта», «главный специалист по клиентской лояльности» и так далее), в то время как должностные обязанности полностью совпадают с обычным функционалом менеджера по продажам. Но встречаются ситуации, когда «менеджер проектов» — это именно менеджер, руководящий проектом, без функции продажи.

Бывает, что у одной и той же трудовой функции просто разные названия, в зависимости от предпочтений работодателя. Так, буровик, машинист буровой машины, оператор бура, буровой мастер и так далее – могут быть одной и той же профессией. Но могут и отличаться: не узнаешь, пока не заглянешь внутрь.

«Магуча» помогает точно ответить на вопрос, сколько именно требуется специалистов, если в вакансиях встречается больше десятка разных названий профессий, специальностей и должностей, но все они с одинаковым функционалом.

«Магуча» разделяет вакансии с абсолютно одинаковыми названиями, но совершенно разными функциями. Например: «инспектор».

Многочисленная профессия «инспектор» — требуется 23 000! На самом деле нет, это требуется 50+ разных профессий

По заголовку нельзя определить кто конкретно нужен: инспектор в ФСИН занят охраной правопорядка, инспектор в ЦЗН ведет учет отдельных категорий граждан; есть инспектор в комитете по опеке, в аэропорту (на входном контроле и внутренний), в отделе образования (проверяет здоровье школьников) и еще встречается свыше 50 типов «инспекторов». Это различные профессии, с отличающимися условиями труда, требованям к образованию и навыкам соискателя, уровнем заработной платы.

Еще более массовая профессия «оператор». Их разновидностей свыше 400.

«Магуча» помогает отличить одну вакансию от другой и классифицировать ее принадлежность к конкретной профессии или должности за счет чтения и «понимания» описания внутри вакансии: должностных обязанностей, требований к соискателю, условий труда и так далее.

Аналогично «Магуча» работает для чтения резюме соискателей. «Прочитываются» компетенции, учитываются предыдущие места работы, полученное образование.

В этом формате «Магуча» может сравнить «цифровой портрет соискателя» с наиболее подходящими именно для него вакансиями — независимо от того, как они называются, именно сравнивая их на уровне требований к знаниям, опыту, компетенциям, при этом также учитывая регион проживания, готовность к переезду, материальные ожидания и многие другие, указанные соискателем, требования.

Также «Магуча» позволяет обрабатывать «миражные резюме и вакансии», идентифицировать вакансии и резюме из разных источников (баз данных различных job-сайтов), сводить к единой архитектуре, обрабатывая имеющиеся отличия в структуре БД, а также учитывать орфографические ошибки и опечатки.

В работе используется специально созданный словарь «Magucha dictionary», а также свыше 20 000 мультишаблонов, соответствующих уникальным наименованиям профессий, специальностей и должностей, встречающихся на современном рынке труда.

Разработчики продолжают «обучать» новую программную надстройку в понимании текстов вакансий и резюме, формируя новые модели и шаблоны.

Следующий шаг

Благодаря базам данных вакансий и резюме, накопленным нами за несколько лет, появилась возможность использовать высококачественное машинное обучение для совершенствования системы прогнозов и выявления скрытых трендов рынка труда.

Сейчас мы тестируем программы прогнозирования в ретроспективном режиме, используя данные прошлых лет, настраивая программу, ориентируясь на процент сбывшихся предсказаний. Программы, показавшие высокий процент, используются нами на актуальных данных рынка труда.

#магуча
#magucha
#рыноктруда
#лингвистическаяонтологиярынкатруда
#лингвистическаяонтологиявакансийирезюме