В задаче «у двух фабрик закупают детали, у каждой свой процент брака» формула полной вероятности даёт прямую оценку: какова вероятность, что случайная деталь бракованная. А что если ты обнаружил, что деталь бракованная, и хочешь узнать, с какой фабрики она скорее всего пришла? Это обратный вопрос, и здесь работает формула Байеса.
Сама формула
Пусть — гипотезы (полная группа), — наблюдённое событие. Формула Байеса:
В знаменателе — полная вероятность события :
То есть формула Байеса = «вес одной гипотезы делим на сумму весов всех гипотез», где «вес» — это произведение априорной вероятности гипотезы и условной вероятности при этой гипотезе.
Откуда берётся формула
Возьмём определение условной вероятности дважды:
Из второго: . Подставляем в первое:
Это и есть формула Байеса. А знаменатель обычно расписываем через полную вероятность.
Пример 1: две фабрики, бракованная деталь
Условие. Завод закупает у двух фабрик. А поставляет 60% деталей, у неё 2% брака. Б поставляет 40%, у неё 5% брака. На контроль попала бракованная деталь. Какова вероятность, что она с фабрики Б?
Решение. Гипотезы:
- — деталь от А, .
- — деталь от Б, .
— деталь бракованная. Условные:
- , .
Сначала полная вероятность:
Теперь Байес для :
Ответ: .
Обрати внимание: до информации «деталь бракованная» вероятность фабрики Б была 0,4 (априорная). После — стала 0,625. Это потому, что у Б в полтора раза больше брака — и обнаружение брака повышает шанс, что деталь именно от неё.
Пример 2: тест на болезнь (классика Байеса)
Условие. Болезнью болеет 1% людей. Тест на эту болезнь даёт правильный результат в 95% случаев у больных и в 90% случаев у здоровых. Случайному человеку сделали тест, и он положительный. Какова вероятность, что человек действительно болен?
Решение. Гипотезы:
- — человек болен, .
- — здоров, .
— тест положительный.
- (тест видит болезнь).
- (тест ошибается у 10% здоровых, давая ложный положительный).
Полная вероятность:
Байес:
Ответ: , то есть около 8,76%.
Парадокс: тест очень точный (95% / 90%), но при положительном результате вероятность болезни всего 8,8%. Почему? Потому что болезнь редкая (1%), и большинство положительных тестов — это ложные срабатывания у здоровых. Этот пример важен — он показывает, почему интуитивный «тест точный, значит почти точно болен» — неверный ход.
Пример 3: два стрелка
Условие. Два стрелка: первый попадает с вероятностью 0,8, второй — с вероятностью 0,5. Случайно выбирают одного из них и делают выстрел. Выстрел попал в цель. Какова вероятность, что стрелял первый?
Решение. Гипотезы (выбор стрелка случайный, равновероятный):
- — выбрали первого, .
- — выбрали второго, .
— попадание.
- , .
Полная вероятность:
Байес для первого стрелка:
Ответ: .
Здесь априорная вероятность была 0,5 (случайный выбор), а после факта попадания — 0,615. Логично: попал значит более вероятно, что стрелял точный.
Самопроверка через сумму апостериорных
Полезный приём: после расчёта Байеса для всех гипотез сумма должна быть 1. Если не получилась — где-то ошибка.
В Примере 3: , . Сумма . ✓
Дерево вероятностей и Байес
Дерево даёт визуальную интерпретацию. Возьмём пример с фабриками:
(0.6) (0.02) брак → 0.6·0.02 = 0.012
┌───── фабрика А ──┤
╱ └── (0.98) ок → 0.6·0.98 = 0.588
старт ┌── (0.05) брак → 0.4·0.05 = 0.020
└───── фабрика Б ──┤
(0.4) (0.95) ок → 0.4·0.95 = 0.380
Все «брак»-листья: 0,012 + 0,020 = 0,032 (полная вероятность брака).
Доля «брак, фабрика Б» в общей сумме браков: . То же, что Байес дал.
Дерево удобно при двух-трёх гипотезах. При большем числе сразу пиши формулу.
Когда Байес в задаче ЕГЭ
В задаче №5 ЕГЭ Байес распознаётся по обратной формулировке. Сравни:
- Прямая (полная вероятность): «Найди вероятность, что случайно взятая деталь бракованная».
- Обратная (Байес): «Случайно взятая деталь оказалась бракованной. Найди вероятность, что она с фабрики А».
Ключевые слова:
- «при условии, что произошло...»
- «оказалось, что...»
- «вычислили / измерили / увидели, что..., найти вероятность гипотезы».
Если в задаче дано «случилось , найти вероятность, что причиной была » — это прямой повод применить Байес.
Частые ошибки
Ошибка 1: путают и . Это разные вещи. Например, . Первая — точность теста, вторая — то, что мы реально ищем.
Ошибка 2: забывают про знаменатель. Многие пишут «вероятность гипотезы это вес гипотезы умножить на условную вероятность » — без деления на полную вероятность. Это формула умножения для , а не Байес.
Ошибка 3: ошибка в полной вероятности. Если посчитан с ошибкой, всё дальнейшее тоже ошибочно. Сначала аккуратно полная вероятность, потом Байес.
Ошибка 4: применяют Байес там, где надо просто полную. Если в условии не сказано «А произошло, найти вероятность гипотезы», а просто «найти вероятность » — это полная вероятность, не Байес.
Краткий алгоритм
- Выпиши гипотезы и их априорные вероятности . Проверь, что сумма = 1.
- Выпиши условные вероятности для каждой гипотезы.
- Посчитай полную вероятность .
- Подставь в формулу Байеса для нужной гипотезы: .
- Самопроверка: сумма по всем должна быть 1.
Что запомнить
- Байес отвечает на обратный вопрос: « произошло — какова вероятность гипотезы ?».
- Формула: , в знаменателе — полная вероятность.
- Априорная → апостериорная : переоценка после наблюдения.
- Сумма апостериорных по всем гипотезам = 1 (самопроверка).
- В задаче ЕГЭ: «случилось , найти вероятность что причина » — это Байес.
- Часть/целое: посчитай вес одной гипотезы и подели на сумму весов всех — это и есть Байес.