В теории вероятностей существует классическая задача, известная под разными названиями: задача разборчивой невесты, задача привередливого жениха или задача остановки выбора. С учетом специфики портала Executive.ru назовем ее задачей выбора лучшего кандидата на работу, потому что именно ее каждый день решает HR-менеджер в своей компании.
Условия задачи
- HR-менеджеру необходимо подобрать сотрудника на вакансию.
- На эту должность имеется N кандидатов, и значение N известно.
- Кандидаты проходят собеседование последовательно в случайном порядке, и каждого кандидата можно однозначно оценить по общей для них всех шкале ранжирования, скажем от 0 до 1.
- Решение о приеме или отклонении кандидата основано только на рангах кандидатов, прошедших собеседование к данному моменту времени.
- Сразу после собеседования прошедший его кандидат либо безвозвратно отклоняется, либо принимается на вакансию, и это решение является окончательным. В случае принятия положительного решения по кандидату – собеседование кандидатов останавливается.
- Нужно найти общее решение, состоящее в выработке оптимальной стратегии, гарантирующей выбор лучшего кандидата из всей группы N с наибольшей вероятностью. Другими словами – стратегия должна максимизировать ожидаемый выигрыш.
HR-менеджер выигрывает, когда принимает лучшего кандидата из N.
Впервые эта задача была опубликована Мартином Гарднером в журнале Scientific American за февраль 1960 года. Хотя до того ей уже уделялось большое внимание в научных кругах. На тему ее решения написаны целые тома. В том числе – по различным модификациям этой задачи, например, когда заранее неизвестно общее количество кандидатов N.
Примечательно, что в докторской диссертации Бориса Березовского, известного бизнесмена и политического деятеля, впоследствии члена-корреспондента РАН, на соискание ученой степени доктора наук «Разработка теоретических основ алгоритмизации принятия предпроектных решений и их применения», защищенной в 1983 году, рассматривается обобщение нашей задачи о разборчивой невесте.
Решение
Для решения этой задачи можно применять различные подходы. В силу их сложности и громоздкости приводить здесь я их не буду – при желании подробности можно найти в сети. Не вдаваясь в математические выкладки и доказательства, приведу сразу решение этой замечательной задачи.
Оптимальная стратегия найма выглядит так: отсобеседовать N/e первых кандидатов, где e=2,71828 – число Эйлера или основание натурального логарифма, а затем выбрать из оставшихся первого, который окажется лучше всех предыдущих.
Предположим, что HR-менеджер отобрал 8 резюме кандидатов, которые по его мнению соответствуют вакансии и требованиям компании. Следовательно, N в нашей формуле = 8.
Далее HR-менеджер:
- Провел собесдеования с первыми N/e = 8/2,71828... = 2,9430... ≈ 3 кандидатами, пока не принимая никаких решений.
- Зафиксировал для себя максимальный ранг среди отсобеседованных кандидатов. Предположим, первые 3 кандидата имели ранги 0,4; 0,25; 0,6. И тогда максимальным рангом будет 0,6.
- Продолжает собеседовать кандидатов далее до момента, пока не попадется кандидат с рангом больше 0,6. Именно этому кандидату сделать предложение о работе, а дальнейшие собеседования не проводить.
Описанное выше решение подходит для стратегии выбора лучшего кандидата. С увеличением числа кандидатов N вероятность выбора лучшего кандидата стремится к 1/e = 36,8...%. Не густо?
Расширим условия задачи
Предположим, что HR-менеджер руководствуется менее строгим выбором: согласен выбрать одного из двух лучших кандидатов. В этом случае:
- Рекрутер должен провести собеседования приблизительно у 34,7% первых кандидатов, не принимая решений, лишь фиксируя их ранги, определив лучшего.
- Из следующих приблизительно 32% кандидатов (вплоть до 66,7% от всех) выбрать того соискателя, который окажется лучше всех предыдущих.
- Из оставшихся 33,3% претендентов соглашаться на выбор и второго по качеству среди уже всех отсобеседованных.
При данном подходе с увеличением числа кандидатов N вероятность выбора одного из двух лучших кандидатов стремится к 57,4%, что уже заметно выше.
Можно было бы пойти дальше и расширить выбор, например, один из трех лучших кандидатов, но не будем усложнять. Во-первых, в реальной жизни HR не принимает решений о найме самостоятельно, а лишь предлагает лучших кандидатов руководителю. Во-вторых, обычно двух лучших кандидатов бывает вполне достаточно для руководителя, чтобы он принял окончательное решение, кого из них принять на работу.
Вывод
После выбора рекрутером лучшего кандидата или одного из двух лучших кандидатов из N отобранных резюме с применением вышеописанных подходов достаточно будет пригласить на финальное собеседование с руководителем именно его и любого другого среди тех, кто прошел собеседование, но минимально уступает «лучшему», если он еще будет находиться в поиске работы к тому моменту и готов будет пройти финальное собеседование с руководителем.
Благодаря такому системному подходу:
- Шансы заполучить на работу в компанию лучшего кандидата будут чрезвычайно высоки.
- Руководитель получит на выбор двух заведомо лучших кандидатов от HR-менеджера.
- Затраты времени HR-менеджера на закрытие вакансии будут существенно снижены, чем при бессистемном интуитивном подборе.
- Риски потерять лучшего кандидата будут минимальными.
Читайте также:
Это вполне рабочее интуитивное решение, которое, думаю, первым приходит в голову многим, но оно не оптимальное :)
Да :)
Если исходить из того, что уровни согласия по 1-ой и 2-ой шкатулке одинаковый, то при уровне 500 юаней матожидание будет 687 юаней.
Оптимальным при этих условиях будет уровень согласия по 1-ой и 2-ой шкатулке 577 юаней, матожидание будет 692 юаня.
Тут надо решать систему уравнений от двух неизвестных.
Посмотрю попозже.
Для разных уровней согласия у меня получилось, что оптимальный вариант это уровень согласия по 1-ой шкатулке 625 юаней, по 2-ой шкатулке 500 юаней.
Матожидание при этих условиях 695 юаней.
Это очень близко к моему решению. О котором я вскоре напишу здесь.
Примем, что вы успешно решили кейс :) Поздравляю!
Запись с вашим именем на моей Аллее Славы в профиле сделал :)
Как решали?
Ну для начала я уровни согласия и количество денег а шкатулке рассматривал в перемнных от 0 до 1, нормировал по шкале 0 - 1, потом развернул обратно.
В первой шкатулке уровень согласия x, во второй у.
Тогда с вероятностью 1-х в первой шкатулке будет монет больше x, в этом случае матожидание количества монет (1+x)/2.
Тогда с вероятностью 1-у во второй шкатулке будет монет больше у, в этом случае матожидание количества монет (1+y)/2, и еще надо учесть, что вероятность перехода ко второй шкатлке будет х.
Вероятность перехода к третьей шкатулке будет x*y, а матожидание денег в третьей шкатулке 0,5.
Общее матожидание полученных монет по всем 3-м шкатулкам будет:
M = (1-x)*(1+x)/2 + x*(1-y)*(1+y)/2 + x*y*0,5
M = (1+x-x^2-x*y^2+x*y)/2
Ищем оптимум 2*M (умножаем на 2 для красоты преобразований).
Берем частные производные 2*M по x и y:
по x -> 1 - 2*x - y^2 + y
по y -> -2*x*y + x
Приравниваем частные производные к 0:
1 - 2*x - y^2 + y = 0
-2*x*y + x =0
Из второго уравнения сокращаем x (он не нулевой):
-2*y + 1 =0
y=0,5
Подставляем y=0,5 в первое уравнение:
x = (1 - y^2 + y)/2 = 0,625
То есть, уровень согласия по 1-ой шкатулке 625 юаней, по 2-ой шкатулке 500 юаней.
M = 0,695
Матожидание при этих условиях 695 юаней.
Кстати, строго говоря надо отдельно рассмотреть вариант x = 0, тогда мы не можем второе уравнение сократить на x.
Это значит, что мы всегда открываем первую шкатулку, матожидание в этом случае будет 500 юаней, это меньше 695 юаней, которые получаются в нашем решении.
Тогда:
Вне зависимости сколько шкатулок изначально, и сколько осталось открыть -- уровни согласия одни и те же.
По-моему, мы где-то раньше по треду задавались вопросом какова будет стратегия, гарантирующая максимальный выигрыш (речь шла о выборе летчиком ВПП), если заведомо известно, что оцениваемые объекты равномерно распределены на интервале 0..1 или в данном случае от 0 до 1000. Вот это она :) И здесь НЕ нужен тестовый период.
Кстати, я подготовил вчера публикацию и отправил ее на проверку в Редакцию.
Там эта задача про три шкатулки фигурирует лишь как пример.
А тема -- Симуляция. Там я показываю как можно решать такие вероятностные задачи с помощью имитационного моделирования.
Надеюсь, скоро опубликуют :)
Небольшое уточнение к изложенному выше решению.
Если в 1-ой шкатулке число монет больше или равно x, то берем монеты из этой шкатулки, а если число монет меньше x, то переходим ко 2-ой шкатулке.
Если во 2-ой шкатулке число монет больше или равно y, то берем монеты из этой шкатулки, а если число монет меньше y, то переходим к 3-ой шкатулке.
За счет этого надо учитывать влияние дискретизации на вероятность, что не было учтено в описанном выше решении.
Вероятность того, что в 1-ой шкатулке число монет больше или равно x, будет не 1-х, а 1-х+0,001, а вероятность того, что число монет меньше x, будет не х, а х-0,001. Это за счет того, что пограничная монета будет учтена в одном событии и не учтена в другом.
Аналогично, вероятность того, что во 2-ой шкатулке число монет больше или равно y, будет не 1-y, а 1-y+0,001, а вероятность того, что число монет меньше x, будет не y, а y-0,001.
То есть надо учитывать влияние дискретизации на вероятность d, для 1000 монет d=0,001.
Поэтому, формула матожидания будет:
M = ((1-x+d)*(1+x) + (x-d)*(1-y+d)*(1+y) + (x-d)*(y-d))/2
В приведенном выше решении d=0.
Поэтому, надо уточнить как параметр d влияет на параметры, рассмотренные в задаче.
Привожу таблицу расчета.
Мы видим, что оптимум для тех же значений.
Каково влияние d видно из таблицы для d=0
0,6952
То есть влияние небольшое.
Но если монет будет меньше, то это влияние надо учитывать.
Еще одно дополнение к учету влияния дискретизации.
В расчете матожидания для 3-ей шкатулки нужно учесть, что нужно использовать не медианную точку отрезка 0 ... 1, а медианную точку отрезка d ... 1, поскольку диапазон числа монет не 0 ... 1000, а 1 ... 1000.
С учетом этого формула матожидания:
M = ((1-x+d)*(1+x) + (x-d)*(1-y+d)*(1+y) + (x-d)*(y-d)*(1+d))/2
Привожу таблицу расчета.
Таким образом, изменения минимальные.
Замечу, что при решении таких задач "математическая" часть может делаться с учетом некоторых упрощений, а окончательная "расчетная" часть должна учитывать все моменты.
Приведу окончательную таблицу по условиям задачи с указанием количества монет.
Различие в значении матожидания в 3-м знаке после запятой числа монет.