La stratégie est la suivante. Pour commencer, le logicien choisit une des deux enveloppes avec probabilité 1/2. Notons \(V\) le nombre qu'il voit.
Il tire ensuite un nombre réel \(\omega \in \mathbb{R}\) au hasard (selon une loi de probabilité strictement positive sur \(\mathbb{R}\) -une loi gaussienne par exemple).
Enfin, il compare \(V\) et \(\omega\) : si \(V \ge \omega\), il dit que son nombre est plus grand, et sinon, il dit qu'il est plus petit.
Pourquoi ça marche ? On note \(a < b\) les nombres choisit par le diable. Donc \(V = a\) ou \(V=b\) avec probabilité \(1/2\). Trois cas peuvent se présenter:
- Soit \(\omega < a\). Dans ce cas, on a toujours \(\omega < V\), et le logicien va toujours dire que son nombre est plus grand. Si \(V = a\), il perd, et si \(V = b\), il gagne. Donc il va au paradis avec probabilité \(1/2\) exactement.
- Soit \(\omega \ge b\). Avec le même raisonnement, il va au paradis avec probabilité \(1/2\).
- Soit \(a \le \omega < b\). Dans ce cas, si \(V = a\), alors comme \(V \le \omega\), le logicien va dire que son nombre est plus petit, et va avoir raison, et si \(V = b\), alors \(V > \omega\), le logicien va dire que son nombre est plus grand, et va encore avoir raison. Dans les deux cas, le logicien gagne.
Ainsi, si on note \(p > 0\) la probabilité que le logicien choisisse \(\omega\) dans l'intervalle \([a,b]\), le logicien va au paradis avec probabilité
$$
(1-p)\frac12 + p = \frac12 + \frac{p}{2} > \frac12.
$$