В задаче «у двух фабрик закупают детали, у каждой свой процент брака» формула полной вероятности даёт прямую оценку: какова вероятность, что случайная деталь бракованная. А что если ты обнаружил, что деталь бракованная, и хочешь узнать, с какой фабрики она скорее всего пришла? Это обратный вопрос, и здесь работает формула Байеса.

Сама формула

Пусть B1,B2,,BnB_1, B_2, \ldots, B_n — гипотезы (полная группа), AA — наблюдённое событие. Формула Байеса:

P(BiA)=P(Bi)P(ABi)P(A)P(B_i|A) = \frac{P(B_i) \cdot P(A|B_i)}{P(A)}

В знаменателе — полная вероятность события AA:

P(A)=j=1nP(Bj)P(ABj)P(A) = \sum_{j=1}^n P(B_j) \cdot P(A|B_j)

То есть формула Байеса = «вес одной гипотезы делим на сумму весов всех гипотез», где «вес» — это произведение априорной вероятности гипотезы и условной вероятности AA при этой гипотезе.

Откуда берётся формула

Возьмём определение условной вероятности дважды:

P(BiA)=P(BiA)P(A),P(ABi)=P(ABi)P(Bi)P(B_i|A) = \frac{P(B_i \cap A)}{P(A)}, \quad P(A|B_i) = \frac{P(A \cap B_i)}{P(B_i)}

Из второго: P(ABi)=P(Bi)P(ABi)P(A \cap B_i) = P(B_i) \cdot P(A|B_i). Подставляем в первое:

P(BiA)=P(Bi)P(ABi)P(A)P(B_i|A) = \frac{P(B_i) \cdot P(A|B_i)}{P(A)}

Это и есть формула Байеса. А знаменатель P(A)P(A) обычно расписываем через полную вероятность.

Пример 1: две фабрики, бракованная деталь

Условие. Завод закупает у двух фабрик. А поставляет 60% деталей, у неё 2% брака. Б поставляет 40%, у неё 5% брака. На контроль попала бракованная деталь. Какова вероятность, что она с фабрики Б?

Решение. Гипотезы:

  • B1B_1 — деталь от А, P(B1)=0,6P(B_1) = 0{,}6.
  • B2B_2 — деталь от Б, P(B2)=0,4P(B_2) = 0{,}4.

AA — деталь бракованная. Условные:

  • P(AB1)=0,02P(A|B_1) = 0{,}02, P(AB2)=0,05P(A|B_2) = 0{,}05.

Сначала полная вероятность:

P(A)=0,60,02+0,40,05=0,012+0,020=0,032P(A) = 0{,}6 \cdot 0{,}02 + 0{,}4 \cdot 0{,}05 = 0{,}012 + 0{,}020 = 0{,}032

Теперь Байес для B2B_2:

P(B2A)=0,40,050,032=0,0200,032=0,625P(B_2|A) = \frac{0{,}4 \cdot 0{,}05}{0{,}032} = \frac{0{,}020}{0{,}032} = 0{,}625

Ответ: 0,6250{,}625.

Обрати внимание: до информации «деталь бракованная» вероятность фабрики Б была 0,4 (априорная). После — стала 0,625. Это потому, что у Б в полтора раза больше брака — и обнаружение брака повышает шанс, что деталь именно от неё.

Пример 2: тест на болезнь (классика Байеса)

Условие. Болезнью болеет 1% людей. Тест на эту болезнь даёт правильный результат в 95% случаев у больных и в 90% случаев у здоровых. Случайному человеку сделали тест, и он положительный. Какова вероятность, что человек действительно болен?

Решение. Гипотезы:

  • B1B_1 — человек болен, P(B1)=0,01P(B_1) = 0{,}01.
  • B2B_2 — здоров, P(B2)=0,99P(B_2) = 0{,}99.

AA — тест положительный.

  • P(AB1)=0,95P(A|B_1) = 0{,}95 (тест видит болезнь).
  • P(AB2)=10,9=0,1P(A|B_2) = 1 - 0{,}9 = 0{,}1 (тест ошибается у 10% здоровых, давая ложный положительный).

Полная вероятность:

P(A)=0,010,95+0,990,1=0,0095+0,099=0,1085P(A) = 0{,}01 \cdot 0{,}95 + 0{,}99 \cdot 0{,}1 = 0{,}0095 + 0{,}099 = 0{,}1085

Байес:

P(B1A)=0,010,950,1085=0,00950,10850,0876P(B_1|A) = \frac{0{,}01 \cdot 0{,}95}{0{,}1085} = \frac{0{,}0095}{0{,}1085} \approx 0{,}0876

Ответ: 0,0876\approx 0{,}0876, то есть около 8,76%.

Парадокс: тест очень точный (95% / 90%), но при положительном результате вероятность болезни всего 8,8%. Почему? Потому что болезнь редкая (1%), и большинство положительных тестов — это ложные срабатывания у здоровых. Этот пример важен — он показывает, почему интуитивный «тест точный, значит почти точно болен» — неверный ход.

Пример 3: два стрелка

Условие. Два стрелка: первый попадает с вероятностью 0,8, второй — с вероятностью 0,5. Случайно выбирают одного из них и делают выстрел. Выстрел попал в цель. Какова вероятность, что стрелял первый?

Решение. Гипотезы (выбор стрелка случайный, равновероятный):

  • B1B_1 — выбрали первого, P(B1)=0,5P(B_1) = 0{,}5.
  • B2B_2 — выбрали второго, P(B2)=0,5P(B_2) = 0{,}5.

AA — попадание.

  • P(AB1)=0,8P(A|B_1) = 0{,}8, P(AB2)=0,5P(A|B_2) = 0{,}5.

Полная вероятность:

P(A)=0,50,8+0,50,5=0,4+0,25=0,65P(A) = 0{,}5 \cdot 0{,}8 + 0{,}5 \cdot 0{,}5 = 0{,}4 + 0{,}25 = 0{,}65

Байес для первого стрелка:

P(B1A)=0,50,80,65=0,40,650,6154P(B_1|A) = \frac{0{,}5 \cdot 0{,}8}{0{,}65} = \frac{0{,}4}{0{,}65} \approx 0{,}6154

Ответ: 0,6154\approx 0{,}6154.

Здесь априорная вероятность была 0,5 (случайный выбор), а после факта попадания — 0,615. Логично: попал значит более вероятно, что стрелял точный.

Самопроверка через сумму апостериорных

Полезный приём: после расчёта Байеса для всех гипотез сумма должна быть 1. Если не получилась — где-то ошибка.

В Примере 3: P(B1A)0,6154P(B_1|A) \approx 0{,}6154, P(B2A)=0,50,50,65=0,250,650,3846P(B_2|A) = \frac{0{,}5 \cdot 0{,}5}{0{,}65} = \frac{0{,}25}{0{,}65} \approx 0{,}3846. Сумма 1\approx 1. ✓

Дерево вероятностей и Байес

Дерево даёт визуальную интерпретацию. Возьмём пример с фабриками:

            (0.6)         (0.02) брак    → 0.6·0.02 = 0.012
       ┌───── фабрика А ──┤
      ╱            └── (0.98) ок      → 0.6·0.98 = 0.588
старт              ┌── (0.05) брак    → 0.4·0.05 = 0.020
       └───── фабрика Б ──┤
            (0.4)         (0.95) ок      → 0.4·0.95 = 0.380

Все «брак»-листья: 0,012 + 0,020 = 0,032 (полная вероятность брака).

Доля «брак, фабрика Б» в общей сумме браков: 0,0200,032=0,625\dfrac{0{,}020}{0{,}032} = 0{,}625. То же, что Байес дал.

Дерево удобно при двух-трёх гипотезах. При большем числе сразу пиши формулу.

Когда Байес в задаче ЕГЭ

В задаче №5 ЕГЭ Байес распознаётся по обратной формулировке. Сравни:

  • Прямая (полная вероятность): «Найди вероятность, что случайно взятая деталь бракованная».
  • Обратная (Байес): «Случайно взятая деталь оказалась бракованной. Найди вероятность, что она с фабрики А».

Ключевые слова:

  • «при условии, что произошло...»
  • «оказалось, что...»
  • «вычислили / измерили / увидели, что..., найти вероятность гипотезы».

Если в задаче дано «случилось AA, найти вероятность, что причиной была BiB_i» — это прямой повод применить Байес.

Частые ошибки

Ошибка 1: путают P(AB)P(A|B) и P(BA)P(B|A). Это разные вещи. Например, P(положительный тестболен)P(боленположительный тест)P(\text{положительный тест}|\text{болен}) \neq P(\text{болен}|\text{положительный тест}). Первая — точность теста, вторая — то, что мы реально ищем.

Ошибка 2: забывают про знаменатель. Многие пишут «вероятность гипотезы BiB_i это вес гипотезы умножить на условную вероятность AA» — без деления на полную вероятность. Это формула умножения для P(BiA)P(B_i \cap A), а не Байес.

Ошибка 3: ошибка в полной вероятности. Если P(A)P(A) посчитан с ошибкой, всё дальнейшее тоже ошибочно. Сначала аккуратно полная вероятность, потом Байес.

Ошибка 4: применяют Байес там, где надо просто полную. Если в условии не сказано «А произошло, найти вероятность гипотезы», а просто «найти вероятность AA» — это полная вероятность, не Байес.

Краткий алгоритм

  1. Выпиши гипотезы BiB_i и их априорные вероятности P(Bi)P(B_i). Проверь, что сумма = 1.
  2. Выпиши условные вероятности P(ABi)P(A|B_i) для каждой гипотезы.
  3. Посчитай полную вероятность P(A)=P(Bi)P(ABi)P(A) = \sum P(B_i) \cdot P(A|B_i).
  4. Подставь в формулу Байеса для нужной гипотезы: P(BiA)=P(Bi)P(ABi)P(A)P(B_i|A) = \dfrac{P(B_i) \cdot P(A|B_i)}{P(A)}.
  5. Самопроверка: сумма P(BiA)P(B_i|A) по всем ii должна быть 1.
Подготовься к заданию 5 ЕГЭ — Байес и полная вероятность с разбором решений по 7 принципам Сот. Адаптивная траектория сама подстраивается под твой уровень.
Попробовать бесплатно

Что запомнить

  • Байес отвечает на обратный вопрос: «AA произошло — какова вероятность гипотезы BiB_i?».
  • Формула: P(BiA)=P(Bi)P(ABi)P(A)P(B_i|A) = \dfrac{P(B_i) \cdot P(A|B_i)}{P(A)}, в знаменателе — полная вероятность.
  • Априорная P(Bi)P(B_i) → апостериорная P(BiA)P(B_i|A): переоценка после наблюдения.
  • Сумма апостериорных по всем гипотезам = 1 (самопроверка).
  • В задаче ЕГЭ: «случилось AA, найти вероятность что причина BiB_i» — это Байес.
  • Часть/целое: посчитай вес одной гипотезы и подели на сумму весов всех — это и есть Байес.