В теории вероятностей существует классическая задача, известная под разными названиями: задача разборчивой невесты, задача привередливого жениха или задача остановки выбора. С учетом специфики портала Executive.ru назовем ее задачей выбора лучшего кандидата на работу, потому что именно ее каждый день решает HR-менеджер в своей компании.
Условия задачи
- HR-менеджеру необходимо подобрать сотрудника на вакансию.
- На эту должность имеется N кандидатов, и значение N известно.
- Кандидаты проходят собеседование последовательно в случайном порядке, и каждого кандидата можно однозначно оценить по общей для них всех шкале ранжирования, скажем от 0 до 1.
- Решение о приеме или отклонении кандидата основано только на рангах кандидатов, прошедших собеседование к данному моменту времени.
- Сразу после собеседования прошедший его кандидат либо безвозвратно отклоняется, либо принимается на вакансию, и это решение является окончательным. В случае принятия положительного решения по кандидату – собеседование кандидатов останавливается.
- Нужно найти общее решение, состоящее в выработке оптимальной стратегии, гарантирующей выбор лучшего кандидата из всей группы N с наибольшей вероятностью. Другими словами – стратегия должна максимизировать ожидаемый выигрыш.
HR-менеджер выигрывает, когда принимает лучшего кандидата из N.
Впервые эта задача была опубликована Мартином Гарднером в журнале Scientific American за февраль 1960 года. Хотя до того ей уже уделялось большое внимание в научных кругах. На тему ее решения написаны целые тома. В том числе – по различным модификациям этой задачи, например, когда заранее неизвестно общее количество кандидатов N.
Примечательно, что в докторской диссертации Бориса Березовского, известного бизнесмена и политического деятеля, впоследствии члена-корреспондента РАН, на соискание ученой степени доктора наук «Разработка теоретических основ алгоритмизации принятия предпроектных решений и их применения», защищенной в 1983 году, рассматривается обобщение нашей задачи о разборчивой невесте.
Решение
Для решения этой задачи можно применять различные подходы. В силу их сложности и громоздкости приводить здесь я их не буду – при желании подробности можно найти в сети. Не вдаваясь в математические выкладки и доказательства, приведу сразу решение этой замечательной задачи.
Оптимальная стратегия найма выглядит так: отсобеседовать N/e первых кандидатов, где e=2,71828 – число Эйлера или основание натурального логарифма, а затем выбрать из оставшихся первого, который окажется лучше всех предыдущих.
Предположим, что HR-менеджер отобрал 8 резюме кандидатов, которые по его мнению соответствуют вакансии и требованиям компании. Следовательно, N в нашей формуле = 8.
Далее HR-менеджер:
- Провел собесдеования с первыми N/e = 8/2,71828... = 2,9430... ≈ 3 кандидатами, пока не принимая никаких решений.
- Зафиксировал для себя максимальный ранг среди отсобеседованных кандидатов. Предположим, первые 3 кандидата имели ранги 0,4; 0,25; 0,6. И тогда максимальным рангом будет 0,6.
- Продолжает собеседовать кандидатов далее до момента, пока не попадется кандидат с рангом больше 0,6. Именно этому кандидату сделать предложение о работе, а дальнейшие собеседования не проводить.
Описанное выше решение подходит для стратегии выбора лучшего кандидата. С увеличением числа кандидатов N вероятность выбора лучшего кандидата стремится к 1/e = 36,8...%. Не густо?
Расширим условия задачи
Предположим, что HR-менеджер руководствуется менее строгим выбором: согласен выбрать одного из двух лучших кандидатов. В этом случае:
- Рекрутер должен провести собеседования приблизительно у 34,7% первых кандидатов, не принимая решений, лишь фиксируя их ранги, определив лучшего.
- Из следующих приблизительно 32% кандидатов (вплоть до 66,7% от всех) выбрать того соискателя, который окажется лучше всех предыдущих.
- Из оставшихся 33,3% претендентов соглашаться на выбор и второго по качеству среди уже всех отсобеседованных.
При данном подходе с увеличением числа кандидатов N вероятность выбора одного из двух лучших кандидатов стремится к 57,4%, что уже заметно выше.
Можно было бы пойти дальше и расширить выбор, например, один из трех лучших кандидатов, но не будем усложнять. Во-первых, в реальной жизни HR не принимает решений о найме самостоятельно, а лишь предлагает лучших кандидатов руководителю. Во-вторых, обычно двух лучших кандидатов бывает вполне достаточно для руководителя, чтобы он принял окончательное решение, кого из них принять на работу.
Вывод
После выбора рекрутером лучшего кандидата или одного из двух лучших кандидатов из N отобранных резюме с применением вышеописанных подходов достаточно будет пригласить на финальное собеседование с руководителем именно его и любого другого среди тех, кто прошел собеседование, но минимально уступает «лучшему», если он еще будет находиться в поиске работы к тому моменту и готов будет пройти финальное собеседование с руководителем.
Благодаря такому системному подходу:
- Шансы заполучить на работу в компанию лучшего кандидата будут чрезвычайно высоки.
- Руководитель получит на выбор двух заведомо лучших кандидатов от HR-менеджера.
- Затраты времени HR-менеджера на закрытие вакансии будут существенно снижены, чем при бессистемном интуитивном подборе.
- Риски потерять лучшего кандидата будут минимальными.
Читайте также:
HR -- иногда это махровый гуманитарий, который ставит у экрана своего компьютера кактус, чтобы снизить радиацию.
Статья рассчитана НЕ на такого HRа. А на человека с некоторым уровнем подготовки в восприятии таких вещей.
Это классический кейс Теории Вероятностей. Задача остановки выбора.
Если вы прочитаете мой 1-й коммент в треде (и 2-й по общему счету), то увидите, что это классика жанра. Универсальная для любого кейса, где в условиях неопределенности нужно решать -- хватать ли предложенное или искать (ожидать) дальше в надежде поймать лучше.
1. Шанс проигрыша (когда в сети HR попадается НЕ самый лучший из N или не один из двух лучших из N) есть всегда. Стратегии его минимизируют.
1.1. Ранги -- это фундаментальное свойство кандидатов. HR их просто считывает.
Или, если угодно, результат преобразования считанного свойства посредством функции HRа. Это совершенно непринципиально.
N известно заранее. Из 1000 поступиших резюме HR выбрал 8 наиболее подходящих и работает с ними. N = 8
А выбор HRа может остановиться раньше. Если HR дошел до N и никого не выбрал (или вынужденно выбрал последнего заведомо нелучшего) -- значит он проиграл. Вероятность проигрыша не исключена. И тогда, вероятно, HRу придется либо запускать поиск кандидатов по резюме заново, либо прозванивать тех посредственных, кого уже отвергли (кто еще пока в поиске), если время горит.
Что делать, если проиграл -- это уже другая задача :) А наша -- о том как и какую планку выбрать при собеседовании кандидатов, качество которых заведомо и заранее неизвестно достоврено, чтобы принятие решения максимизировало шансы на выигрыш.
И тут важно понимать, что стратегия дает максимизацию выигрыша по выборке кейсов, а не гарантирует выигрыш в каждом случае. То есть, носит вероятностный характер.
О том как принимать решения и чем руководствоваться, чтобы максимизировать шансы на выигрыш.
Вообще, чем больше N, тем лучше работает стратегия. Если HR замотивирована на лучший результат, то N нужно повышать. Пусть вместо N = 8 кандидатов выберет N = 28, если располагает силами и временем.
2. Ну, почему же? Кандидат обычно ведет переговоры с рядом потенциальных работодателей и хорошие кандидаты находят работу быстрее посредственных.
Поэтому, если вы как HR не дали внятного ответа кандидату в течение какого-то времени -- то можете считать его потерянным, особенно если он был реально хорош. Хороший товар на полке не залеживается.
Это упрощение, которое ужесточает условия игры для HRа. Если реальность мягче -- то это отличная возможность HRу отмотать немного назад.
Если вы внимательно прочитали мою статью, то увидели, что в Выводах я отступаю от этого правила, чтобы HR выложил на поднос Руководителя к лучшему кандидату и какого-нибудь попроще именно из тех, кого уже отвергли, но кто все еще в поиске.
3. Какие шутки? Все серьезно.
Прочитайте мой 1-й коммент в этом треде (или 2-й по общему счету) -- там есть пара примеров.
Любой поток предложений со случайным рангом и их ограниченным числом, где НЕпринятие вами решения влечет потерю этого выбора -- готовый кейс.
Пример из жизни:
Вы в отпуске и путешествуете из города в город. Гуляете, посещаете достопримечательности и магазины. Вам нужно прикупить что-то себе или что-то на подарок.
Вам в каждом городе попадаются хорошие товары, покупку которых вы откладываете на потом.
А потом в спешке покупаете всякий хлам, кусая локти, что не купили себе тот модный пинжачок с малиновыми карманАми, который встретили вон в том городе.
А все просто -- если вы планируете объехать 11 городов, то вам нужно первые 11/e = 4 просто смотреть что и почем и ничего не покупать пока.
А вот начиная с 5-го уже принимать решения исходя из того, что увидели в первых 4-х. Если вы встретили товар заведомо лучше тех, что увидели в первых 4-х, то брать не задумываясь.
Отличный реальный кейс из жизни.
Мне кажется, что эту стратегию надо дополнить еще одним элементом - уровнем ранжирования, когда надо брать кандидата и все останавливать.
Например, при уровне 0,9 вы берете кандидата из первых N/e собеседуемых.
Представьте себе, что разборчивая невеста отклонила молодого симпатичного миллиардера, который оказался первым или вторым в группе поиска.
Кстати, в Вашей задаче про аэродромы, если самолет первым приблизится к идеальному аэродрому, то глупо на него не приземлиться.
Нет, не надо.
Так как заведомо неизвестны параметры распределения рангов.
Если матожидание >0,9, то вы скорее всего проиграете хапнув первого с рангом 0,9.
Нет, не глупо.
Что такое идельный аэродром? Понятие идеальности -- относительное. Оно относительно чего-то, что нам заведомо неизвестно.
Вот если бы в условиях было сказано, что качество полос 0 до 1 и равномерно распредено на интервале (с матожиданием 0,5), то тогда можно вообще опустить первую часть балета, где мы вырабатываем уровень с которым будем работать во второй части.
И сразу оперировать неким Q=f(N) для заданного уровня P прямо с первой полосы. Как только качество выше -- садиться на нее.
Вот 3D график z(x, y) = p(q, n) -- вероятность выигрыша при выборе критерия q для n независимых равномерно распределенных в интервале (0; 1) рангов.
x = q = [0..1]
y = n = [1..15]
z = p = [0..1]
Тогда с вероятностью p=0,9 для n=5 полос мы прогарантируем себе посадку на лучшую полосу, если выберем q=0,64.
Но при этом Вы можете потерять очень редкий вариант.
Например, при поиске работника Вы можете потерять сотрудника, хорошо знающего китайский язык, а это достаточно редкий навык.
Спасибо автору, что напомнил нам о Гарднере. Гарднер много сделал для популяризации математики в нашей стране, как и Яков Перельман, их читали, любили и обсуждали.
Для тех, кто не спит: посмотрите на небольшой и хорошо написанный текст Сабира Гусейн-Заде в жанре для умных школьников и интересующихся.
Его автор решил эту задачу (вслед за профессором Дынкиным) и показал несколько вариантов условия и подходов к решению. Это существенно для понимания применимости выводов на практике. Детали постановки задачи, как обычно в математике, очень важны, тем более - если говорить о задачах оптимизации. Небольшие изменения в условии радикально влияют на результат.
https://www.mccme.ru/mmmf-lectures/books/books/book.25.pdf
История обсуждения и решения описана также здесь
https://intellect.icu/zadacha-o-razborchivoj-neveste-ili-problema-sekretarya-8546
Стратегии остановки и некоторые аргументы в легком для понимания табличном виде приведены, например, в
https://habr.com/ru/companies/skillfactory/articles/522634/
Когда-то мне понравилась книга Гриффитса "Алгоритмы для жизни: Простые способы принимать верные решения". Математики там немного, но примеры могут быть кому-то интересны. Эта задача там тоже есть.
https://www.litres.ru/book/brayan-kristian/algoritmy-dlya-zhizni-prostye-sposoby-prinimat-vernye-resh-25013923/
---
Вернемся к статье.
С точки зрения использования теории вероятности и общего решения для N=8 и одной попытки - боюсь, что для описанного в статье примера это обычное упражнение в нумерологии. Расчеты каких угодно вероятностей здесь не имеют смысла, как бы нам этого не хотелось.
Единственное, что можно (теоретически) улучшить - убедить специалиста HR в том, что - возможно - можно проводить не все интервью, но вряд ли в условиях реального бизнеса это так важно с точки зрения расходов его времени. Лишний час? В конце концов, это его работа, и любая информация о кандидатах может быть полезна в дальнейшем. Полный перебор для N=8 не может быть проблемой.
Ситуация при отборе кандидатов ближе к сюжету "Женитьбы" Гоголя. Как уже было отмечено в комментариях выше, принцип ранжирования кандидатов и детали корпоративной процедуры найма может быть ключевым фактором для принятия решения. Если это решение принимает не робот, на следующих раундах интервью многое прояснится.
Еще раз спасибо автору за тему.
Если факты противоречат теории - тем хуже для фактов.
А пилот, естественно, приземлится там, где сочтет нужным - у него жёсткие инструкции, правила безопасности, большие часы налёта и прочее после профеесионального обучения и подготовки.
Серьезно?
Это слишком сильное утверждение.
Еще раз - в чём состоит выигрыш в Вашем понимании для N=8?
Да. Бывает. Как Вы понимаете, это очень заманчиво и хорошо выглядит на бумаге.
Важно не забыть, а что мы, собственно, называем в данном случае вероятностью, зачем бы нам её считать, как нам себя проверить, и можем ли мы использовать подобные расчеты буквально и без обсуждения.
Этим бизнес и отличается, в частности, от математического моделирования и/или решения общей задачи, когда часть факторов убирается из модели.
Я не работал в кадрах, но подбором персонала, как и все коллеги здесь, занимался неоднократно. Можно сказать много.
Сергей предложил интересный вариант подбора. Но у меня никогда не возникало ситуаций массового отбора из десятков человек. Ну видел, как нанимают нижний персонал в некоторых компаниях. В торговле, например. Но это не наши случаи.
Обычно у меня это происходит так. Публикуешь вакансию. В описании кадровикам ставишь рамки, но стараюсь не ставить дурацкие завышенные требования, стараешься описать то, что действительно нужно. Это важно. В первых строках описания вакансии даю ключевые требования. В хорошей команде на базе ключевых навыков опыт набирается быстро.
Кадровики, как правило, всех направляют ко мне, отсеивают только совсем явно несоответствующих. Я беседую со всеми, обычно на 3-4 кандидате могу остановится из-за того что кандидат получает предварительную высокую оценку. Затем следующая партия 3-4 человека, если там выделяется более способный кандидат, то этого для меня достаточно для принятия решения. То есть двумя партиями выявляются два лучших, из которых выбрать довольно просто.
Но в ИТ есть некая специфика - кандидата нельзя долго держать в неведении, они проходят массу собеседований в других организациях. Чтоб не переходить к третьей партии, решение надо принимать быстро.
Смущает следующее:
"каждого кандидата можно однозначно оценить по общей для них всех шкале ранжирования, скажем от 0 до 1".
Это, на мой взгляд, лишнее и слишком субъективное. Для оценки можно хоть двоичную ситему применять - нравится/не нравится. Подходит/не подходит. Есть опыт/нет опыта. Мне трудно представить как можно одному присвоить ранг 0,6, а другому 0,7.
HR выигрывает, если выбирает
1) лучшего из N кандидатов
или
2) одного из двух лучших из N кандидатов.
Если он руководствуется стратегией 1) или 2) (описаны в моей статье, то вероятность выигрыша будет максимальной и равна для стратегий соотвественно
1) 36,8%
2) 57,4%
N выбирайте любое. Но чем N больше, тем лучше будут работать стретегии.
Будет меньше сказываться шум округления, дискретизации, шум случайности.
Яблоки можно сравнивать с яблоками. А груши с грушами.
Поэтому, даже если у вас всего 2 метрики оценки кандидата, то чтобы кандидаты были сравнимы -- вам приедтся свести эти метрики в одну универсальную метрику.
Например, суммированием с весовыми коэффициентами. И нормированием.
Поэтому то, что мы имеем для всех них ранжирование от 0 до 1 -- вообще не должно смущать. Это стандартная вещь.
Если этого не сделать, то вам не удастся их ранжировать для сравнения, так как Метрика1 несравнимас Метрикой2, итд.
И дилемма какие раки лучше -- огромные но за дорого или небольшие, но доступно -- останется неразрешимой.