Vismart/Resume

Материал из NLPub
Перейти к: навигация, поиск

Разбор резюме

Цель

Оптимизировать работу кадровых служб предприятий и кадровых агентств при поиске надлежащих кандидатов для вакансии или, если точнее, автоматизировать процесс совмещения требований вакансии и навыков претендентов.

Этапы

Научиться разбирать разнородные по своей структуре резюме по полям в СУБД или размечать резюме тегами, которые обеспечат автоматизацию разбора размеченных документов по полям СУБД.

Срок: 2 месяца.

На основе разработанного решения будут формулировать новые задачи, развивающие и дополняющие функционал

Функциональные требования

  • Решение должно распознавать следующие поля резюме:
    • Опыт работы:
      • должность,
      • период,
      • компания (обязательно с городом, если указан),
      • обязанности
    • Желаемая позиция
    • Образование:
      • Название вуза,
      • Годы обучения
      • Город - желательно, если указано
      • Страна - желательно, если указано
      • Специальность - желательно, если указано
  • Прочие поля распознавать не нужно:
    • имя,
    • фамилия,
    • телефон,
    • увлечения,
    • семейный статус
  • Решение должно работать на русском и английском языках. Подавляющая часть резюме будет на русском.
  • Пример исходного резюме - см. Приложение 1
  • В начале работ необходимо сформулировать ожидаемые параметры точности распознавания создаваемого решения.
  • Пример результата разбора в виде XML-файла - см. Приложение 2. Не является руководством к действием, а служит только иллюстрацией разбора. Также в примере даны комментарии относительно полей.

Технические требования

  • Разбор одного резюме на лету должен занимать не более 10 секунд
  • Решение должно поставляться в виде стороннего сервиса, который будет вызываться извне и результат работы которого будет доводиться до веб интерфейса.
  • Язык программирования не принципиален

Входящие данные

  • Документ Microsoft Word (.doc + .docx) - обязательно
  • Документы PDF (только текст, без OCR) - желательно
  • Для отладки будет представлено более 1000 резюме

Исходящие данные

Документ XML c тегами разметки, однозначно указывающими на поля в резюме, которые необходимо разметить в соответствии с функциональными требованиями.

Критерии приемки

Решение в соответствии с техническими требованиями и функциональными требованиями размечает резюме со скоростью до 1 резюме в 10 секунд.