У американского писателя Эдгара По есть рассказ «Похищенное письмо». По сюжету из королевских апартаментов похищается письмо величайшей важности, и похититель шантажирует его владелицу. Многочисленные обыски в доме похитителя ничего не дают, и только детективу Дюпену удается разгадать тайну «похищенного письма» — оно было спрятано на самом видном месте.
Что-то похожее мы наблюдаем и в ситуации со статистикой — эти данные у всех на виду, мы знаем, что цифры не умеют лгать, но нет никакой гарантии и того, что они точно сообщат все, что вы хотели знать. Слова и числа, если ими ловко пользоваться, способны вызывать нужные эмоции и решения, поэтому все-таки слепо доверяться им нельзя. На самом деле это старая философская проблема. Мы можем доверять наукам, опирающимся на количественные измерения (в том числе современной медицине) или даже верить вслед за великим Галилеем, что «книга природы написана языком математики», но мы никогда не получим стопроцентного подтверждения того, что наши цифры исчерпывающе описывают реальность. Конечно, чтобы решать проблемы, полная информация порой не нужна, нужна более-менее приближенная к реалиям. И в этом смысле многие сводки по коронавирусу действительно дают общее представление. Но как это часто бывает — дьявол в деталях.
Ложная уверенность от статистики — много или мало 1%?
Давайте обратим внимание на пару моментов, касающихся статистики, которые регулярно встречаем в СМИ и официальных отчетах.
Мы знаем, что статистика сильна на больших числах, в небольших выборках она слишком усредняет, а в отношении единичных случаев почти слепа. Как шутил один из отечественных специалистов по статистике: «В реке, где средняя глубина по колено, утонула корова». Но ведь большинство интересует именно личная судьба и судьба близких, а не абстрактные тысячи или миллионы человек. Поэтому, к сожалению, статистика порой ведет к ложной уверенности: мол, если смертность — 1%, да еще и в основном у пожилых, то мне молодому ничего не грозит. Интересно, что такие люди скажут, когда им не повезет оказаться в числе того малого процента? Ведь один процент — это не так уж и мало, если процент отсчитывается от огромного числа. На этой же когнитивной ошибке строятся завлекательные ценники в духе 9.99 р.
Статистическая выборка — смотря как считать
Общие цифры распознанных случаев за день — именно за ними многие пристально следят. Что даже породило грустную шутку о том, что в 2020 очень необычная Олимпиада. Как ни странно, эти показатели могут быть далеки от реальности. Если смотреть за динамикой, то можно сделать обобщенные выводы о происходящем: идет рост, уже плато или спад? Но только при условии постоянства метода, или, простыми словами, если тест один и тот же, количество тестов не меняется и сильно рандомизировано (выборка более-менее случайна).
Выборка играет огромную роль в статистике, о чем забывают: нет смысла выяснять общий процент курильщиков, проводя опрос перед табачным киоском. То есть если мы каждый день в среднем выявляем 5% от всех заболевших, то можно прикинуть и общие цифры, и динамику. В остальных случаях полученные цифры подобны верхушке айсберга, по которой никогда точно не скажешь: мы сегодня зафиксировали то же отношение от целого или нам сильно повезло? Вчера мы обнаружили 2% от всех заболевших, а сегодня 7% — но обыватель видит другое. Он видит, что все плохо, потому что вчера было 500 человек, а сегодня уже 1750 (на деле: обнаружить больше — все-таки лучше).
Актуальный пример такого манипулирования статистикой — выступление главы Роспотребнадзора Анны Поповой, которая 28 апреля в прямом эфире пожаловалась Владимиру Путину на нарушающих самоизоляцию новосибирцев, в результате чего рост заболеваемости в регионе скакнул сразу с 7% до 17%, что было в два раза больше, чем в среднем по России. Однако массовое тестирование на коронавирус запустили в Новосибирске только 6 апреля, и тогда в городе проверяли всего около 100 проб за сутки. К 24 апреля в городе работало уже восемь лабораторий, которые проверяли 1800-1900 проб за сутки. Соответственно увеличению количества тестируемых росло и увеличение количества выявленных больных. И связывать рост количества случаев однозначно только с нарушениями самоизоляции, которые в нашем городе тоже имеют место, неправильно.
Смертность и летальность — не одно и то же
Стоит напомнить о том, что в медицинской статистике важно различать показатели «смертности» и «летальности» (в которых и многие журналисты изрядно запутались). Смертность – показатель определенной группы, а она может быть какая угодно. Для наглядности: если смертность от коронавируса 0,01% среди долларовых миллионеров, то конкретно про вас эти цифры вообще ничего не говорят, это же очевидно. У простых смертных нет тех ресурсов, которые есть даже хотя бы у нашего премьер-министра Михаила Мишустина, который проходит лечение от covid-19 в Центральной клинической больнице в Москве в специальном отделении, которое занимается лечением только важных чиновников. В регионе и на местах условия все-таки разнятся.
Летальность же — показатель умерших к общему количеству обладателей того же диагноза в конкретный период. И это тоже запутывает: если учесть всех с положительным тестом на ковид, но без симптомов (их много), то получаем очень низкие цифры, которые совсем не отражают того ада, который происходит в отделениях реанимации и интенсивной терапии, работающих с самими сложными проявлениями болезни (и смертность для попавших в реанимацию уже не маленькая).
В общем неспециалистам часто неведомы нюансы терминов и методов статистики, поэтому они делают упрощенные выводы, часто по аналогии (больше = плохо), а это чревато ошибками. Отсюда заголовки — «каждый третий болеет бессимптомно», «каждый четвертый больной covid-19 лежит в реанимации», которые ничего не говорят о реальной ситуации. Каждый раз нужно разбираться, каждый третий по отношению к чему? Каждый четвертый по отношению к чему? Рост статистики выявленных пациентов может говорить как о том, что ситуация вышла из-под контроля, так и о том, что власти очень эффективно отслеживают контакты уже выявленных больных, и поэтому проведенные тестирования оказались очень эффективны. Поэтому время от времени следует включать голову и проверять информацию.
Простые советы
Конечно, самое сложное препятствие: чтобы что-то узнать — нужно захотеть знать. А этим нужно суметь где-то заразиться, например, увидев как другие поступают иначе: оценивают информацию на адекватность, задают вопросы. Учиться критическому мышлению никогда не поздно и в отношении статистики полезно обращать внимание на следующее:
– задавать вопрос «что это значит?» Ту же разницу между «смертностью» и «летальностью» любой может узнать в один клик, прочитав статью «Википедии».
– обращать внимание на выборку. Если вам сообщают о каких-то показателях или процентах, полезно вчитаться и найти «про кого» эти цифры, и подумать, имеете ли вы какое-то отношение к этой группе.
– не пропускать недосказанности, особенно когда речь идет о сравнениях. Классический ход недобросовестной рекламы — фразы в духе «стало в три раза дешевле/в пять раз вкуснее/на 50% больше натуральности и т. п.» Каждый раз здесь опущено «по сравнению с чем». В текстах, упоминающих статистику, такое тоже не редкость. Например, сравнивая общую смертность сейчас с прошлым годом, мы ничего не узнаем о ковиде, зато можем испытать удивление о того, сколько жизней от смерти в ДТП спас карантин.
– уточнять источник и способ получения информации. Это занимает время, поэтому стоит прибегать к этому, если вы собираетесь на основе этой информации принимать важное решение. Наверное, нет нужды объяснять, что данные, полученные объективным методом, лучше, чем полученные со слов. Социологические опросы очень ограничены: и я всегда пытаюсь выяснить как спрашивали (сам вопрос часто кривой или некорректный, да и люди не обо всем скажут правду первому встречному). Ну и, конечно, отсутствие ссылки на официальный источник или явная заинтересованность источника — тоже повод начать сомневаться.
Иван Кудряшов