Jak Thomas Bayes vlastně odvodil ten svůj teorém?
Velmi jednoduše, jak už to u geniálních myšlenek bývá... Posuďte sami:
Máme dva jevy, A a B, které mohou nastat každý zvlášť, ale také současně. Jejich pravděpodobnosti si můžeme zobrazit pomocí tzv. Vennových diagramů:
P(A) je pravděpodobnost jevu A, P(B) je pravděpodobnost jevu B a P(A∩B) je pravděpodobnost jejich průniku, tedy pravděpodobnost, že nastanou oba současně.

Thomas Bayes si uvědomil, že pravděpodobnost průniku obou jevů je možné vyjádřit pomocí podmíněných pravděpodobností, a to hned dvěma způsoby.
Za prvé, pravděpodobnost, že jevy A a B nastanou současně, lze vyjádřit jako pravděpodobnost, že nastane jev A, krát pravděpodobnost, že při jevu A nastává jev B:

Za druhé, pravděpodobnost, že jevy B a A nastanou současně, lze vyjádřit jako pravděpodobnost, že nastane jev B, krát pravděpodobnost, že při jevu B nastává jev A:

Obě pravděpodobnosti průniku - P(A∩B) i P(B∩A) - jsou ale přece stejné (je to ta fialová plocha v našem obrázku Vennových diagramů), a tedy se sobě rovnají, neboli

Teď už stačí maličká úprava - převedení P(A) na pravou stranu rovnice - a dostáváme vzorec Bayesova teorému v celé jeho kráse:
