Пик эпидемии пройден в Чувашии в первой половине июня и Чебоксары вошёл в Топ10 городов по доле заболевших
У многих людей нет никакого доверия к статистике по коронавирусу от Минздрава. Она может быть насколько точной, как и результаты подсчёта центризбиркомов или данные о средних зарплатах в Чувашии, над которыми откровенно смеются.
Интересны другие способы оценки происходящего, в основном независимые. Например, статистику заболеваемости предложили искать по поисковым запросам в том или ином регионе. Есть специфические поисковые запросы, которые вводят люди, заболевающие коронавирусом в поисках информации. Если анализировать их количество, можно понять насколько страшной является ситуация с эпидемией в том или ином регионе.
И вот такую статистику недавно представили в динамике. Для Чувашии она и позитивная и негативная одновременно. Получается, что пик запросов, посвящённых обонянию, был максимальным в первой половине июня. Если отслеживать серьёзность эпидемии по нему, то получается, что её пик у нас уже пройден! Это хорошая новость.
С другой стороны доля запросов по обоняние в % от всех запросов Яндекса на пиковой неделе у нас одно из самых высоких в стране. Чебоксары входит по этому показателю в Топ-10 городов из 90 исследованных. Это новость плохая.
Цитата
В продолжение разговора про "обоняние" как ключевое слово, статистика запросов по которому отражает динамику и сравнительную силу эпидемии коронавируса. У каждого города (из тех, в которых уже была заметная вспышка) своя динамика запросов. На приведенном здесь графике для каждого города показаны две характеристики: * дата, на которую пришелся пик запросов (Яндекс показывает динамику только по месяцам и неделям, но не по дням; однако вероятную дату пика можно оценить примерно через сопоставление показателей рекордной недели с предыдущей и последующей - если например количество запросов на неделе перед рекордной и после рекордной примерно одинаковое, значит максимум скорее всего пришелся на середину рекордной недели; если рекордная неделя лишь чуть выше предыдущей и сильно выше последующей - значит, максимум был ближе к началу рекордной недели)
* интенсивность пика - определяемую через долю запросов со словом "обоняние" от всех запросов к Яндексу из данного города на пиковой неделе (можно ожидать, что интенсивность пика запросов будет коррелировать не с общей силой эпидемии, определяемой через долю переболевших в населении, а именно с интенсивностью эпидемии на пике - с долей одновременно болевших; при равной высоте пика запросов больше переболевших следует ожидать в том городе, где рост и снижение запросов были более пологими, и пик шире). Чтобы не перегружать график еще больше, я показываю только города с интенсивностью пика 0,008% и больше
Тут уместно несколько слов про качество и надежность данных. Первое: большинство пиков ярко выраженные. Медианная разница между частотой запросов на пиковой неделе и в среднем за 2 недели до и после пика - 1,7 раза. Медианная разница между основным пиком и максимальным значением за периоды, отстающие от основного пика более чем на 2 недели, - 1,5 раза. И это с учетом фонового уровня (несвязанные с эпидемией запросы про обоняние + общая для всей России "медийная" компонента), если его вычесть, то разница между пиком и остальными периодами будет намного более выпуклой. Второе: помимо силы эпидемии, на соотношение относительного количества запросов про "обоняние" на пиках в разных городах может влиять множество других факторов - частота упоминания (на пике эпидемии) потери обоняния как симптома коронавируса в местных СМИ и неформальных коммуникациях; накопленная к моменту вспышки осведомленность населения о симптомах коронавируса; возрастной состав интернет-аудитории (притом не всей, а той примерно половины, которая пользуется Яндексом); различия в преобладающей лексике (количество запросов про потерю запахов или "не чувствую запахи" в %% от количества запросов про обоняние варьируется от 11% в Архангельске до 37% в Махачкале); возможные различия между "популяциями" вируса и, соответсвенно, частотой появления тех или иных симптомов; возможные различия - обусловленные культурой, средой обитания или климатом - по важности обоняния как органа чувств и т.д. Однако среди этих факторов я не вижу ни одного, который мог бы давать отклонения больше, чем примерно х1.3. Различия между городами по высоте пика намного больше - так что все же я считаю, что сравнение городов по частоте запросов про обоняние на локальных пиках индикативно для сравнения пиковой интенсивности эпидемии в этих городах.
Приведенный график - это такая хронология: где и когда прошел локальный для данного города пик количество запросов про "обоняние". И я предполагаю, что это совпадает или почти совпадает с пространственной хронологией самой эпидемии, с датами прохождения соответсвующими городами пиков по количеству новых заболевших.
Если исходить из этой логики, то первыми - в самом конце апреля или самом начале мая - пик прошли Махачкала и Ингушетия (в виду малочисленности населения и поисковых запросов для Ингушетии и Тывы я в порядке исключения учитываю запросы не по отдельным городам, а по региону в целом). При этом в силу повышенного уровня скепсиса и неверия на старте эпидемии скорость распространения и уровень на пике и в Дагестане, и в Ингушетии оказались существенно выше, чем в других регионах
Вторая "пространственная волна" - это Москва с областью, а также Обнинск (про то, что там в апреле-мае ситуация была существенно хуже, чем в областном центре, в Калуге, было известно и без поисковой статистики) и Тверь (вот Тверь меня удивила - я в это время уже находился на территории Тверской области, так что к местным новостям относился с повышенным вниманием, но вспышки в Твери, в отличие от Конаково и Кимр, не заметил ни по официальной статистике, ни по разговорам в соцсетях и оффлайне). Судя по статистике запросов со словом "обоняние", пик во всех перечисленных местах случился практически одновременно, 5-9 мая, и с одинаковой интенсивностью. При этом если Обнинск и Тверь совпали с Москвой по времени пика, то другие крупные города вокруг столицы не совпали.
Дальше наступила пауза - и до конца мая через пик из всех рассматриваемых мною городов (более 90) прошел еще только Владикавказ. Зато с приходом июня сразу началась третья "пространственная волна": 1-3 июня через пик прошли географически близкие Саранск, Пенза, Липецк, Курск и Брянск (притом это не сплошной ареал - в Тамбове пик был примерно на 10 дней позже, а в Орле и Белгороде всплеска запросов не было до сих пор), а также Тольятти. Выше всего интенсивность запросов на локальном пике из перечисленных городов была в Саранске.
Чуть позже, 5-6 июня, через пик прошли Северодвинск, Черкесск и Санкт-Петербург. Объединяет эти три кейса только время. Северодвинск - первый пример сверхмощной (превосходящей уровень Махачкалы и Ингушетии) локальной вспышки, ограниченной одним городом. Потом будут еще Норильск и Когалым. Черкесск (вспышка в котором судя по поисковой статистике на тот момент была четвертой по силе с момента начала эпидемии после Махачкалы, Ингушетии и Северодвинска) продолжил северокавказскую "традицию", в которой у каждого региона и регионального центра своя динамика и свое время прохождения пика; после Черкесска будет еще Нальчик - с пиком на неделю позже, тогда как Грозный доберется до пика только в июле, и то не факт, что это уже пик. Петербург же почти в точности совпал с Москвой по высоте пика, только на 4 недели позже (и "колокол" запросов в Питере сильнее растянут во времени, чем в Москве).
Более чем в десятке городов пик пришелся на 10-13 июня. Основу этой четвертой "пространственной волны" (в которой при этом только некоторые города связаны между собой тем, что можно назвать логикой движения эпидемии по карте) составляют города вокруг Московской области - Владимир, Рязань, Тула, Калуга, Смоленск (при этом Тверь и Обнинск прошли пик на месяц раньше, в Ярославле, Иваново и Рыбинске в начале июня тоже был подъем - но слабый, с максимумами на 0,006-00075%, а в Костроме, Вологде и Череповце подъема вовсе не было). Чуть раньше и слабее был пик в Нижнем Новгороде. В те же дни через пик прошли Архангельск (через неделю после Северодвинска - и с интенсивностью пика примерно в 5 раз меньше), уже упоминавшийся Нальчик и (с существенно большей интенсивностью) Петропавловск-Камчатский. И в эти же дни были пройдены пики в трех очень мощных всплесках - в Чебоксарах, Набережных Челнах и Воркуте (можно предположить, что интенсивность эпидемии на пике здесь, особенно в двух первых случаях, была обусловлена совпадением во времени нарастания эпидемии и снятия существенной части общероссийских ограничений в начале июня).
После 13 июня наступило новое затишье - и в следующие 3 недели через локальные пики прошли только 7 городов. Это (в хронологическом порядке) Новосибирск (в котором, как и в Нижнем Новгороде, запросы про обоняние росли долго и с небольшой скоростью, а пик был небольшим по высоте), Новый Уренгой (первая по времени вспышка в нефтегазовых округах), Тыва, "сверхмощные" вспышки в Норильске и Когалыме, Якутск и Красноярск.
7-11 июля - это пятая "пространственная волна" пиков с достаточно четкой географической локализацией: Среднее Поволжье и Урал. На эти дни пришлись пики (перечисляю в порядке нарастания интенсивности на пике) в Перми, Йошкар-Оле, Челябинске, Ульяновске, Нижнем Тагиле, Екатеринбурге, Уфе, Казани, а также в Мурманске и Омске. Омск и Казань - на данный момент рекордсмены среди всех городов-"миллионников" по высоте пика: в Омске он составил 0,0193% от всех запросов к Яндексу, в Казани 0,0166%, далее идут Уфа, Петербург, Москва и Екатеринбург с 0,0138-0,0126%.
В эти же дни или чуть позже свои пики прошли несколько городов в ХМАО - Сургут, Нефтеюганск и Нижневартовск. Во всех трех у пиков большая высота - примерно на уровне Омска или даже чуть выше (но все же ниже Нового Уренгоя и тем более Когалыма).
Неделя 13-19 июля стала рекордной по частоте "обонятельных" запросов для Грозного (у которого очень специфичный график количества запросов, с несколькими "полупиками" начиная еще с апреля, так что уверенности в том, что там пик действительно пройден, нет никакой), Южно-Сахалинска, Самары, Ноябрьска и Березников. Следующая неделя (последняя учтенная на данный момент) - рекордная для Астрахани. На графике для нее условно поставлена дата 26 июля (конец той недели) - но судя по доступным на сейчас неполным данным за следующую неделю, рост в Астрахани продолжается.
По мере появления данных за новые периоды на графике могут появляться новые города - в которых пока не пройден порог в 0,008% от всех запросов к Яндексу, но может быть пройден в будущем. Наиболее вероятные кандидаты на шестую "пространственную волну" - это юг России от Волгограда до Сочи.
Понимаю, что определять заболеваемость по поисковым запросам может быть делом не самым точным. Но из другой статистической информации, которой можно доверять, в моём понимании есть статистика смертности по сравнению с предыдущими годами. Когда такая статистика появится по Чувашии за апрель-май-июнь-июль, она наглядно покажет серьёзность проблемы.
Тоже читал несколько дней назад об этой методике определения заболеваемости. По ней можно сделать вывод, что в Чувашии одна из самых лукавых статистик в стране по короновирусу. Николаев, Луговская, Степанов и иже с ними превзошли в изворотливости многих. Дело это, конечно, с точки зрения закона, подсудное, но нашим орлам бояться нечего. Их даже могут наградить. Обратная сторона этой "деятельности" - пренебрежение людьми мерами безопасности, приводящее к новым заболеваниям и смертям. Здесь вклад указанных персон неоспорим.
Тоже читал несколько дней назад об этой методике определения заболеваемости. По ней можно сделать вывод, что в Чувашии одна из самых лукавых статистик в стране по короновирусу.
По данной статистике можно сделать абсолютно любые выводы. Например, что Чебоксары находятся в лидерах по числу ипохондриков. И десяток других выводов.
Абсолютно согласен, что
Цитата
Понимаю, что определять заболеваемость по поисковым запросам может быть делом не самым точным. Но из другой статистической информации, которой можно доверять, в моём понимании есть статистика смертности по сравнению с предыдущими годами. Когда такая статистика появится по Чувашии за апрель-май-июнь-июль, она наглядно покажет серьёзность проблемы.
Статистика смертности, будет самым точным показателем серьезности, как распространенности эпидемии, так и летальности.
В июне в поликлиниках были многочасовые очереди. Сейчас очередей нет, терапевты принимают по времени. В июне на работе было много болеющих, поэтому доверяю информации, что пик эпидемии пройден в этом месяце. Но эпидемия еще не закончилась и, к сожалению, продолжают умирать люди, чьи-то близкие, родные, любимые...