Почему не стоит бояться коронавируса: мифы и почти правда о COVID-2019
чередная волна эпидемии коронавируса (теперь уже пандемии) принесла и очередную волну публикаций, посвященных опасностям нового вируса со страшными предсказаниями и графиками.
Поднявшаяся паника подействовала и на меня, но сопротивляясь ей из последних сил, я попытался найти для себя ответы на некоторые вопросы, которые обошли вниманием другие авторы, но кажутся мне важными, или хотя бы прояснить, действительно ли миру и мне угрожает смертельная опасность, и что с этим можно сделать.
R0 и скорость эпидемии
Чего уж проще – взять и прочитать определение, что такое R0, и убедиться, что этот показатель никак не связан со скоростью реальной эпидемии, но является всего лишь искусственным параметром конкретной математической модели. Тем не менее базовое репродуктивное число склоняют во всех падежах при любом удобном моменте, когда хотят сказать об опасности той или иной инфекции, как только его не называя – индексом контагиозности (такой существует, но означает совсем другое), уровнем заразности инфекции и т. д. Но ведь это не так, у R0 есть вполне определенное значение и для этого и нужно применять, а не для красного словца.
Что точно – если модель заболеваемости соответствует R0 < 1, то эпидемия не начнется, а если началась, то пойдет на спад, ведь если в среднем каждый больной будет генерировать меньше 1 нового больного, рано или поздно «последний больной» не передаст болезнь никому. Поэтому R0 можно и нужно уменьшать, ведь основное определение таково:
R0 = βγ, где
β – количество контактов, приводящих к новым больным, за определенное время;
γ – период, на протяжении которого болеющий контактирует со здоровыми.
Например, если больной заражает в среднем 1 нового человека за 1 день контактирования с другими людьми, и делает это в среднем на протяжении 5 дней, пока его не выявят и изолируют, R0 этого конкретного заболевания в конкретной среде будет равен 5, так как он успеет сгенерировать 5 новых случаев.
Конечно, точных значений R0 нет и не может быть, поскольку математические модели являются только приближением к реальному процессу, но это значение позволяет понять, будет ли распространяться заболевание в виде эпидемии в каком-то конкретном регионе при тех или иных условиях.
Повторюсь, оценить не скорость эпидемии, а оценить, возможна ли эпидемия. R0 коронавируса по оценкам нескольких источников точно больше 1, следовательно, если ничего не предпринимать для его уменьшения, эпидемия возможна, что мы и наблюдаем.
И вот тут самое важное следствие – чтобы уменьшить R0, нужно выполнить одно или несколько условий:
Пункт 1. Уменьшить количество контактов больных с другими людьми – изолировать точно болеющих и помещать на карантин подозрительных.
Пункт 2. Уменьшить период контактирования больного с другими людьми – быстрее выявлять болеющих и далее действовать по п. 1.
Но есть важный нюанс:
β – это произведение количества контактов на индекс контагиозности (attack rate) – реальный показатель конкретной инфекции или патогена – процент заболевших от числа контактировавших с больным ли носителями инфекции, характерный именно для данного заболевания (обычно определяется из практики).
То есть β будет тем больше, чем больше контагиозность заболевания и чем с большим количеством здоровых непривитых людей пообщается больной.
Например, контагиозность кори оценивается в 50-90%, то есть из 10 человек, контактировавших с больным, заболеют больше половины. Например, если в среднем с больным будут общаться 5 людей ежедневно, то каждый день будет появляться в среднем 3-4 заболевших (β = 5 х 0,5–0,9 = 2,5–4,5), а если в среднем больного корью будут изолировать через 3 дня (γ = 3), всего появится около от 8 до 14 новых больных (R0 = βγ = 2,5–4,5 х 3). Так мы получим R0 кори, равный 8-14.
При этом если объявить карантин и тем самым снизить количество общающихся с больным до 2 людей ежедневно, то за те же 3 дня «общения» появится всего 3-5 новых больных (2 х 3 х 0,5–0,9), то есть R0 в такой модели распространения станет ниже 5, но будет все еще выше 1.
Чтобы добиться снижения R0 до значения меньше 1, нужно ограничить количество контактов с больным до максимум 1 за 3 дня, за которые больного изолируют – (1 х 0,9 = 0,5–0,9) или сильно уменьшить время от момента выявления до изоляции больного – до нескольких часов и меньше, тем самым снизив вероятность и количество контактов с другими людьми.
У легочной чумы контагиозность на уровне кори – 80%, но при этом R0 чумы (6-7) намного ниже R0 кори (14-15) – потому, что инкубационный период чумы ниже, чем у кори, а также потому, что период, когда больной заразен, при чуме короче и заметнее по симптомам, а значит, пообщаться с больным и заразиться весь период, пока больного не изолируют, успевают меньшее количество людей.
Как видно, между R0 и контагиозностью существует некоторое соответствие, но совсем не прямое, да и пугаться стоит не болезней с высоким R0, а болезней с высокой летальностью, даже если их R0 небольшой. У той же Эболы R0 = 2, а летальность достигает 90%. По сравнению с ней нынешний коронавирус – легкая простуда.
У коронавируса SARS-CoV-2 (новое название 2019-nCoV), вызывающего COVID-19, контагиозность намного ниже, чем у чумы и кори (оценочно 3-10% в домашних условиях), но есть другая проблема – длительный инкубационный период, на протяжении которого больной может быть распространителем.
Именно это обстоятельство сильно повышает β, а значит, и R0, повышая тем самым вероятность эпидемии – врачи бы и рады быстро изолировать больных или поместить в карантин предположительно больных, да вот находят их уже тогда, когда они успели неделю или больше пообщаться со здоровыми и заразить их.
Большие скопления людей тоже сильно повышают вероятность заражения, если среди всех присутствующих есть хотя бы один больной, что показывает история с суперраспространителем в Южной Корее – одна женщина за несколько дней побывала в нескольких общественных местах, проконтактировав с более чем 1000 человек.
Вывод – в идеале нужен глобальный карантин, который максимально уменьшит количество контактов людей друг с другом и позволит больным дождаться явных симптомов заболевания с минимальным количеством контактов.
На практике это, конечно, трудноосуществимо, поэтому применяется частичный карантин, исходя из условий распространения конкретного заболевания. Кстати, карантин в детских садах в случае с коронавирусом, возможно, излишен, так как по статистике среди заболевших всего около 1% детей до 7 лет, в отличие от той же кори и ОРВИ, при которых дети являются основной группой заболевших, а значит, и основными переносчиками инфекции.
Когда еще имеет смысл упоминать R0 – если нужно оценить, например, какой процент населения нужно вакцинировать, чтобы предупредить развитие эпидемии, например, для кори с оценочным R0 около 15 нужно вакцинировать, соответственно, не меньше (100 – 100/15)% населения – 93,3%. Но опять же, это цифры по какой-то модели, реальность такова, что в некоторых странах с высоким процентом вакцинации все же случаются вспышки кори, хотя до эпидемий дело, действительно, не доходит – такая оценка, получается, работает.
Что с коронавирусом? Оценочный R0 по разным моделям – от 2 до 4 примерно, то есть вакцинировать нужно хотя бы 50-75% населения. Вакцины, как мы знаем, нет, и в ближайшем будущем не предвидится, так что про это применение R0 можно пока не вспоминать.
Единственное — если бы можно было быстро оградить пожилых людей («отправить бабушку в деревню до осени»), то карантин вообще бы можно было не вводить — все молодые люди успели бы переболеть, необходимый процент получил бы иммунитет, и распространение вируса прекратилось бы, как если бы всех этих людей привили. Именно продолжительное время для создания вакцины мешает быстро пресечь эпидемии новых заболеваний.
Для тех, кому совсем интересно – пример расчета R0 нового коронавируса китайскими учеными.
Реальная скорость эпидемии
Сначала прикинем «идеальный» сценарий, чтобы было от чего отталкиваться – каждый больной на следующий день заражает количество людей, равное R0 (такого не бывает, конечно, но чтобы увидеть разницу с реальностью, нужно увидеть самый страшный сценарий).

На первый взгляд все выглядит устрашающе, мне эта картинка напомнила задачу про награду изобретателю шахмат – там тоже присутствует геометрическая прогрессия с множителем 2 (показатель R0 Эболы на картинке):
На 1 клеточку положить 1 зерно (1 больной сегодня)
На 2 клеточку – 2 зерна (плюс 2 больных завтра)
На 3 клеточку – 4 зерна (плюс 4 больных послезавтра) и т. д.
Нетрудно посчитать, что на 10 день прибавится 1000 новых больных, через 20 дней – 1 миллион, а через месяц – 1 миллиард, то есть все человечество может заболеть буквально за месяц. Но почему же этого не происходит?
Причин несколько:
Как мы уже выяснили, показатель R0 не определяет напрямую скорость эпидемии, он определяет лишь среднее количество заболевших за весь средний период контактирования больного со здоровыми людьми в математической модели. При этом в реальности новые зараженные могут появиться как за один день, так и в разные дни, например, в случае с Эболой двое новых больных могут появиться через 3 и 5 дней, поэтому экспонента растягивается по времени, становится более пологой.
Показатель R0 – это число в модели, на которое можно влиять, как мы выяснили выше – карантином, изоляцией и более быстрым выявлением больных. Поэтому при R0 = 2 Эбола распространялась, к счастью, намного медленнее, чем прибавлялись бы зерна на шахматной доске.
Если смоделировать количество заболевших для гипотетической болезни с R0=2, то можно видеть, что распространение двух заболеваний с одинаковым R0 может идти с разной скоростью, в зависимости от того, насколько много людей за 1 день успевает заразить больной и насколько быстро больного изолируют.
В нашем случае:
первая зависимость — это 2 новых заболевших в день и изоляция через 1 день;
вторая зависимость — это 1 новый заболевший в день и изоляция через 2 дня.
Пояснение к цифрам и цветовой разметке:

Реальный множитель прогрессии R в первом случае равен 2 (количество новых заболевших каждый день удваивается), а во втором равно 1,618, то есть болезнь с более длительным инкубационным периодом, но меньшей контагиозностью будет распространяться медленнее при одном и том же R0, равным 2. В частности, примерно то же количество заболевших (около 30 человек) будет достигнуто не на 5-й, а на 7-й день.
Становится очевидно, что при R0 = 4 коронавирус необязательно должен каждый день увеличить количество новых больных в 4 раза. Реальная статистика показывает, что показатель R коронавируса, он же – множитель геометрической прогрессии, приблизительно равен 1,1-1,2 (это значит, что количество новых больных удваивается каждые 5-8 дней).
Если для грубого расчета принять период от начала заражения до изоляции больного в 14 дней, а R0 = 4, то в среднем 1 больной коронавирусом заражает еще одного человека раз в 3-4 дня (14 / 4).
Но опять же, нельзя говорить ни про какое конкретное число для коронавируса в общем, можно говорить только про конкретные числа с учетом всех факторов:
а) месторасположение (в большом городе скорость распространения будет больше по причине большего количества контактов между людьми за один и тот же период);
б) условия карантина (есть или нет и насколько жесткий);
в) наличие дезинфекции;
г) наличие эффективного лекарства и его доступности и т. д.
Сочетание этих всех условий и определяет реальную скорость эпидемии, универсальных формул попросту нет, как бы их не старались найти интернет-прорицатели, генерирующие шокирующие теории одна за одной.
Парочка примеров от тех ребят, чье хобби — экстраполяция:
1. Теория заговора о параболе. Кому-то показалось интересным, что график количества заболевших в Китае, в частности, в провинции Хубэй, очень близок к параболе. А что, давайте-ка попробуем предсказывать по ней будущее:


Предсказателя не смутил тот факт, что графики степенной и показательной функции при некоторых значениях множителей могут быть близки, но это совсем не значит, что экспоненту можно предсказывать по параболе:

Разочарование наступило буквально на следующий день, когда график реальной статистики «как назло» перестал совпадать с предвидением:

2. Ну что ж, не вышло в лоб, попробуем привлечь искусственный интеллект – наверное, так подумал наш второй герой — James Ross. И таки привлек, по крайней мере, именно это заявлено в публикации на Forbes – «Я взял данные по ежедневному росту заболеваемости, загрузил их в нейронную сеть и запустил симуляцию 10 миллионов раз, которая выдала значение для следующего дня. Как только на следующий день опубликовали реальное значение, я добавил его в нейросеть и запустил симуляцию еще 10 миллионов раз.».
Как пишет дальше его друг-журналист, результаты ошеломляют. Еще бы, 2,5 миллиарда заболевших через 45 дней кого угодно ошеломят:

С одной стороны, почему бы и нет – искусственный интеллект – он же почти все умеет, наверное, и предсказать мог на 45 дней. С другой, при более подробном анализе начинают проявляться странности в таблице:
Во-первых, отношение смертей к заболевшим в зеленой таблице всегда практически равно 0,021 (2,1%):
1048 / 49924 = 0,0209919
4382 / 208690 = 0,020997 и т. д.
Ну ладно, взяли для удобства фиксированное значение, но почему за 7 первых дней прогноза количество заболевших увеличилось примерно в 4,18 раза (49 924 / 11 943), за следующие 7 дней – тоже в 4,18 раза (208 690 / 49 924), а за следующие 2 недели с 14 по 30 дни – сразу в 460 раз (95 млн / 208 тыс.), причем за последние 2 недели с 30 по 45 день – всего в 29 раз?
Какая-то странная эпидемия получается, зомби то наступают, то прячутся. Попробуем взять Excel и рассчитать значения по обычной геометрической прогрессии, чтобы получить за 7 дней 49924 из 11943: берем корень 7-й степени из 4,18, получаем множитель прогрессии 1,22671, подставляем его и растягиваем как можно дальше, до миллиардов.
Внезапно обнаруживаются занятные совпадения:
На 14 строке – число около 208 тысяч;
На 44 строке – около 95 миллионов;
На 60 строке – около 2,5 миллиардов.
Немного шаманства и вот находится волшебный множитель 1,22671042374, при котором числа на уже указанных строках в точности до единиц совпадают с таблицей, якобы рассчитанной искуственным интеллектом.
Сразу становится понятной аномалия со слишком быстрым ростом между 14 и 30 дней в таблице – на самом деле между ними не 16, а 30 дней, то есть 95 миллионов получаются не на 30-й, а на 44-й день с момента расчета, а 2,5 миллиарда – на 60-й вместо 45-го.
То есть вместо искусственного интеллекта нам подсунули банальную прогрессию с фиксированным множителем, а из итогового результата удалили несколько строк для более пугающего эффекта. Можно было хотя бы числа немного изменить, но над этим автор теории не стал напрягаться – и так сойдет, если написать про AI и 10 миллионов раз.
Кстати, ради интереса можно сравнить предсказание с реальным числом заболевших, раз уж в статье сказано про 3% погрешности:

Как видим, мир пока что не вымирает так быстро, как предсказывают доморощенные модели, это радует. Справедливости ради – прямо сейчас количество заболеваний в мире (если исключить Китай) действительно растет практически в геометрической прогрессии, причем с немаленьким множителем – около 1,19, так что если предположить, что ничего не изменится, то количество заболевших может стать примерно таким:

Конечно, называть это прогнозом у меня не повернется язык, просто демонстрация экспоненциального роста. Из-за того, что параметров, влияющих на рост эпидемии, несколько, и все их значения неизвестны, предсказать что-то более-менее точно на больших промежутках времени не получится, а учитывая, что многие страны уже активно борются с эпидемией, реальные числа, скорее всего, будут другими и значительно ниже.
Единственное, что можно сказать определенно, основываясь на статистике и знаниях о примененных мерах в текущей и прошлых вспышках коронавирусов – эпидемию возможно остановить с помощью жесткого карантина, тотальной дезинфекции и быстрой изоляции больных – впрочем, это было очевидно из примеров расчета R0, так что ничего нового, сидя на диване, сказать нельзя.
Подобным образом действовали в 1970, когда в Одессе началась эпидемия холеры – город был самым настоящим образом закрыт, что и позволило всего за месяц ликвидировать очаг заболевания. И именно такие меры позволили остановить эпидемию атипичной пневмонии в 2003 году – не понадобилось даже завершать разработку вакцины.
Этот вывод практически совпадает с выводами из статьи Tomas Pueyo, занимающегося виральным продвижением мобильных приложений, и написавшего по-настоящему виральную статью (хотя и несколько провокационную), перевод которой уже стал самой обсуждаемой статьей про коронавирус на Хабре.
Динамика заболеваемости и борьба с эпидемией
Рассмотрим график из статьи, который использовал Tomas Pueyo для анализа и предсказаний:

В принципе, автор прав, обратив внимание на возможное отставание официальной статистики – ведь из-за большого инкубационного периода COVID-19 заболевшие некоторое время могли не обращаться за врачебной помощью, а значит, составляли тот самый скрытый слой, который выявляется не сразу.
В итоге можно сделать вывод, что в реальности число инфицированных больше, чем показывает официальная статистика – правда, все разговоры про «на один-два порядка больше» и «десятки раз» справедливы только для начальной стадии, по прошествии некоторого времени превышение приближается к разам, нежели к десяткам, это видно и на графике:

Выводы
COVID-19 – противная штука и лучше ею не болеть, но если вы моложе 50 лет, то воспринимать это стоит, как грипп – последствия не особо отличаются. Если вам за 50 – ну вы поняли, коронавирус вам противопоказан, причем больше, чем грипп.
Если вас пугают миллионами возможных смертей – возможно, не стоит читать такие статьи перед завтраком. Перед обедом и ужином тоже не стоит, наверное, лишний стресс не даст ничего хорошего.
Если в вашей стране уже есть заболевшие, то эпидемии с большой вероятностью быть, но нужно ли бежать прямо сейчас за туалетной бумагой – не уверен. Сделать запас продуктов, чтобы реже ходить в магазин – возможно, правильное решение, но хорошо бы сделать это заранее.
Маски – не панацея, можно вполне обойтись без них. Если будут раздавать бесплатно – возьмите, конечно, но покупать втридорога не стоит точно. Важнее обеспечивать чистоту рук на улице — если не будете подходить близко к другим людям, то вероятность заразиться будет очень низкой.
Если до работы можно дойти меньше чем за полчаса – возможно, стоит предпочесть прогулку поездке в маршрутке рядом с потенциальными носителями ОРВИ и коронавируса. Свой автомобиль в этом плане безопаснее тоже.
Если заболели чем-то похожим на грипп – постарайтесь остаться дома, особенно если работаете в большом коллективе или в людном месте. Слава суперраспространителя – сомнительна.
Если вы работодатель, ваша задача номер один – позаботиться о недопуске больных людей.