Хочется добавить немного ясности во все эти тесты и интерпретацию результатов.
Для начала, про оценивание тестов.
Очевидно, что есть 4 возможных теоретических исхода:
1) человек болен и тест нашёл вирус (true positive, TP)
2) человек не болен и тест не нашёл вирус (true negative, TN)
3) человек болен и тест не нашёл вирус (false negative, FN)
4) человек не болен, но тест нашёл вирус (false positive, FP)
Если первое слово "true", то ошибка не произошла, а если "false" - то наоборот, произошла ошибка. "positive" и "negative" - это сами результаты теста.
Можно сразу понять, что ошибки бывают двух видов, это FN и FP. Т. е. одного числа, например, "точность 70%", будет явно недостаточно. И вообще, не понятно, о чём здесь идёт речь.
Поэтому, тесты нужно оценивать минимум 2 числами. Например, можно считать чувствительность и специфичность.
Чувствительность - это доля TP, которую находит тест, среди всех заболевших.
Специфичность - это доля TN, которую находит тест, среди всех незаболевших.
Отсюда следует, что если человек болен, то тест с высокой чувствительностью будет часто помечать таких людей как больных. А если человек не болен, то тест с высокой специфичностью будет помечать таких людей как не больных.
Хороший тест будет максимизировать чувствительность и специфичность одновременно.
Теперь про тест ПЦР на ковид.
70% - это чувствительность. Что из этого следует: если человек болен, то с вероятностью 70% тест вирус у него найдёт. Соответственно, с 30% вероятностью человек будет болен, но вирус не найдётся.
Что касается специфичности, то обычно она намного больше, около 95-98%. Что из этого следует: FP практически не бывает. Тест с 2-5% вероятностью помечает незаболевших людей как больных, т. е. ошибки FP достаточно редки.
Что в итоге имеем про ПЦР:
1) если результат положительный, то ковид практически наверняка есть (FP очень редки).
2) если результат отрицательный, то тут по прежнему сохраняется какая-то неопределённость.
Несколько слов, откуда берётся неопределённость отрицательных результатов.
Что имеем:
Если человек болеет, то ПЦР с 30% вероятностью отрицательный
Что хочется:
Если ПЦР отрицательный, то какая вероятность, что человек болеет?
Заметьте, тут причина и следствие поменялись местами.
Теорема Байеса, которую здесь упоминали, "умеет" менять местами причину и следствие.
Но тут есть проблема, что для этой теоремы, надо знать априорную вероятность, т. е. какая доля людей, из пришедших сдавать тест, в данный момент болеет. Априорная вероятность - это больше экспертная оценка, а теорема Байеса корректирует её на основе данных. В разных ситуациях эта оценка может быть разной. Одно дело - проводить тесты в больнице, где априори очень много людей заболевших, а другое - на работе, где очень высокий процент здоровых. Брать среднюю температуру по больнице, сколько в России болеет в данный момент, в качестве априори, я бы не стал.
Сообщение отредактировал Spaun91 - Dec 1 2020, 15:39
--------------------
ping ::1