Formulação:
Imagine que você está entrevistando candidatos para um emprego de secretária, e quer contratar o melhor possível.

Há algumas regras adicionais, em relação a um processo comum: você só pode entrevistar um candidato por vez, deve tomar uma decisão imediatamente após a entrevista e não pode voltar atrás em uma decisão já tomada.
Se rejeitar o candidato, não pode tentar contratá-lo novamente, terá que contratar algum dos candidatos posteriores.
Se eu contratar o primeiro que aparecer, a escolha é por puro acaso. Se esperar até o último, não vou ter escolha a não ser pegar quem ficou por último, não tenho ação.
A estratégia ideal é, primeiro entrevistar alguns candidatos para obter informação, e a partir daí, pegar o primeiro candidato melhor do que os obtidos anteriormente.
Resposta: 37%
O livro “Algoritmos para viver” aponta que o ponto ideal é de 37%: Entrevisto 37% dos n candidatos, e a seguir, pego o primeiro que for melhor do que os anteriores.

Podemos fazer uma simulação para ilustrar o algoritmo.
Escrevi uma simulação em Python, para sortear valores aleatórios para os N candidatos, e aplicar o método descrito acima. O código está disponível em https://github.com/asgunzi/paradaotima
Alguns exemplos a seguir.
Com N = 16, avalio os cinco primeiros candidatos (de 0 a 4, em verde no gráfico abaixo, e chamo o melhor candidato acima dos primeiros avaliados (em vermelho). Neste caso, o candidato escolhido é também o melhor candidato global.

Outro caso análogo:

Há casos em que o melhor está entre os primeiros avaliados – ou seja, não vou encontrar ninguém melhor do que os candidatos já avaliados. Neste caso, sou obrigado a pegar o último:

Dá para mudar o critério. Por exemplo, avaliar 20% – encurtar o período de “acumular conhecimento” aumenta o risco de tomar decisões precipitadas. Note que há menos barras verdes no gráfico abaixo.

Ou avaliar mais (só que ficar coletando informações demais vai aumentar o risco de acabar as opções e ficar com o último).

Um detalhe importante a notar é que o critério pode não garantir que escolhamos o melhor. Por exemplo, no gráfico abaixo, escolhemos um candidato acima das notas de avaliação, porém, abaixo do melhor possível.

Rodando a simulação acima, para diversos pontos de corte para obtenção de informação, e com 1000 trials, chegamos numa tabela como a seguinte.

Realmente, para % Corte de 37% chegamos ao melhor ponto de parada, o que dá maior resultado, quando o critério é o de escolher o melhor dentre os N candidatos. Porém, note que na faixa de 20% também chegamos a um resultado próximo.
Fiz um outro pequeno experimento, mudando ligeiramente a pergunta. Ao invés de escolher o melhor dos melhores, queremos avaliar a média das pessoas selecionadas.
Aí, chegamos à tabela abaixo:

O resultado é semelhante ao anterior, ou seja, na faixa entre 20% – 37% temos o melhor percentual de acerto.
Vale a pena fazer diversos comentários sobre as hipóteses.
No mundo real, não “descartamos” os candidatos selecionados imediatamente. Há uma janela de tempo em que a decisão pode esperar. No mundo real também, podemos avaliar todos os candidatos e tomar uma decisão sobre.
Além disso, fazer entrevistas, provas e todo o processo de seleção demandam tempo e esforço. Entrevistar 37% das pessoas só para obter informação parece muita coisa.
Outro método mais próximo ao real. Temos um limiar mínimo de qualidade, para o trabalho em questão, por já conhecermos o trabalho, já termos gente que trabalha conosco. Um algoritmo alternativo possível é o seguinte: vá entrevistando, até encontrar alguém que supere o limiar mínimo, e o contrate. A diferença entre o melhor dos melhores e o segundo ou terceiro melhor não será tão grande, na prática.
Outra diferença para a vida real é que diversas outras restrições podem pesar para a decisão: digamos, o candidato pode desistir da vaga, por exemplo.
Bom, de qualquer forma, o algoritmo da parada ótima gera inúmeros bons insights, e dá um plano de ação claro. Entrevistar pessoas de menos antes de tomar uma decisão é precipitado, por outro lado, esperar para obter informação demais para tomar uma decisão vai deixar passar oportunidades. Além disso, as simulações mostraram que o resultado é bastante robusto: um pouquinho para cima ou para baixo não muda o resultado.
