Американский футбол, системы безопасности в аэропортах, работа Уолл-стрит, страхование жизни, диагностика ВИЧ, расследование преступлений, телевизионные шоу… Многое в мире построено на статистике. Мы вращаемся в поле статистических данных и выкладок. Осознаем это или нет, но мы встречаем статистические данные в интернете, на страницах книг, в разговорах с коллегами и т. д. И если сведений недостаточно или статистические методы используются некорректно, такая информация способна ввести в заблуждение или даже нанести серьезный вред.
Как использовать статистику в жизни и не впасть в маразм, интерпретируя данные, рассказывает Чарльз Уилан в тринадцати главах своей книги. Если вы хотите научиться правильно оперировать статистическими данными, «Голая статистика» — книга, написанная специально для вас. А если вы, к тому же, не ладите с математическими формулами и заумными объяснениями, то Уилан — ваш автор навеки. Научные формулировки он променял на чувство юмора, а вместо формул использует примеры.
На протяжении книги автор доказывает, что статистика — прикладная, полезная наука. Из книги вы узнаете:
- как работают спортивные рейтинги команд и игроков;
- как принимать решения о страховании имущества, жизни и здоровья, как понять, выгодно ли приобретать расширенную гарантию на технику;
- как создатели сериалов используют статистику, чтобы заставить нас посмотреть все сезоны;
- как СМИ зависят от статистики в период выборов, и как им удается предсказывать исход голосования до объявления результатов;
- как чудовищная ошибка работе со статистикой на Уолл-стрит привела к катастрофе 2008-го;
- как полиции удается прибывать на место преступления еще до его совершения.
В итоге вы поймете, что работа со статистикой так же увлекательна, как работа детектива. Даже увлекательнее.
Сила математического ожидания
Математическое ожидание — сильная штука, которая научит понимать, стоит ли ввязываться в лотереи, розыгрыши призов, азартные игры. Если объяснить понятными словами, математическое ожидание — отдача от какого-то события (покупки лотерейного билета или игры в кости).
Предположим, вам предложили игру в кости. Подбрасывается только одна кость, и выигрыш равен выпавшему на ней числу: за единицу — $1, за двойку — $2, и так далее... Математическое ожидание для игры в кости — сумма возможных исходов. Вероятность каждого исхода здесь равна 1/6, и поэтому математическое ожидание равно:
1/6 ($1) + 1/6 ($2) + 1/6 ($3) + 1/6 ($4) + 1/6 ($5) + 1/6 ($6) = 21/6, или $3,50.
Предположим, за одно подбрасывание вы платите $3 доллара. Соглашаться ли на такую игру? Да, потому что стоимость игры ниже, чем возможный выигрыш. Это не гарантирует, что вы заработаете, но помогает оценить риск и выигрыш.
То же математическое ожидание, по словам Уилана поможет понять, почему участие в лотереях бессмысленно:
«Я купил за 1 доллар один билет мгновенной лотереи. На оборотной стороне напечатаны — микроскопическим шрифтом — шансы выиграть денежные призы или получить еще один такой же билет (бесплатно):
— 1 шанс из 10 (бесплатный лотерейный билет);
— 1 шанс из 15 (2 доллара); 1 шанс из 42,86 (4 доллара);
— 1 шанс из 75 (5 долларов) и т. д. вплоть до 1 шанс из 40 000 — 1000 долларов.
Я подсчитал ожидаемый доход для билета мгновенной лотереи. Получилось, что ожидаемый доход для однодолларового лотерейного билета — 0,56 доллара. А значит, покупка такого билета — бездарный способ потратить 1 доллар. Как назло, я выиграл 2 доллара».
Но несмотря на выигрыш, покупка лотерейных билетов — бессмысленное занятие. Даже если сегодня это принесет вам $2, в долгосрочной перспективе выигрывает тот, кто продает билетики, а не покупает их.
Ложноположительные больные и статистическая вероятность
Статистика помогает понять, почему экономика, система страхования, образования и здравоохранения построены так, а не иначе. Почему государство озабочено выявлением тяжелых, но редких заболеваний только у людей из групп риска, а не у всех людей? Ведь чем раньше обнаружено заболевание, тем благоприятнее и прогноз лечения. Парадокс в том, что при тестировании всех людей, большинство тех, кто получит положительный результат, на самом деле окажутся здоровыми.
Предположим, что точность тестирования составляет 99,9999%, а болезнь поражает одного человека из 100 тыс. Тест не покажет, что человек здоров, когда он на самом деле болен (не даст ложноположительного результата). Но в одном случае, из 10 тыс. здоровых людей тест покажет, что человек болен (хотя на самом деле здоров — ложноположительный результат). Что получим в итоге? Среди тех, кому сообщат плохой диагноз, 91% людей окажутся здоровы. А теперь представим, сколько стоит дополнительное обследование и лечение таких «ложнобольных». И поймем, почему медицина сосредоточена только на группах повышенного риска.
«Вещи, которые позволяют нам лучше понимать свою жизнь»
Марк Твен сказал однажды: «Есть три вида лжи: ложь, наглая ложь и статистика». Правда, виновата в этом не сама наука, а тот факт, что часто ее используют в ущерб здравому смыслу. Пример такого использования — внедрение оценочных таблиц в больницах штата Нью-Йорк. Эти таблицы отслеживают уровень смертности среди пациентов кардиохирургов, проводящих коронарное восстановление сосудов.
На первый взгляд, оценивать смертность после таких операций важно, и пациенты имеют право знать эту информацию, перед принятием решения о лечении. На практике же это привело вот к чему:
- Некоторые врачи признавались, что введение таблиц «повлияло на некоторые их профессиональные решения», ведь самый простой способ снизить смертность — отказаться оперировать самых тяжелых больных.
- 83% опрошенных кардиохирургов сказали, что часть пациентов, которым операция могла бы помочь, откажутся от нее из-за того, что владеют информацией о смертности.
Ведь пациенты не обучены обращению со статистическими данными, не знают, как правильно интерпретировать эти сведения. 10% смертности — много или мало? А что, если он окажется этим «каждым десятым»? Делать ему операцию или нет? Но кроме неумения обращаться со статистикой, есть еще причины по которым любой статистический индекс может ввести в заблуждение.
Индекс зависит от того, из каких показателей он сконструирован: «Если мы говорим об индексе развития человеческого потенциала (Human Development Index), то каким должен быть вес уровня грамотности по сравнению с уровнем дохода на душу населения? И должны ли простота и легкость применения, обеспечиваемые объединением многих показателей в одно число, иметь для нас большее значение, чем неточность, внутренне присущая такому объединению? Хорошее знание статистики помогает нечистым на руку людям манипулировать данными также, как знание уголовного кодекса не мешает преступникам заниматься своими темными делишками».
Добавьте к этому ошибки, которые возникают, когда люди неверно используют статистические выводы. Типичный пример — новость о том, что люди, делающие короткие перерывы во время рабочего дня, чаще умирают от рака, чем люди, не делающие таких перерывов. Первое, к чему подталкивает человека эта информация — отказаться от перерывов и избежать рака. Но если проанализировать для чего люди делают эти короткие перерывы в рабочее время, станет ясно, что эта новость рассказывает не о связи перерывов и рака, а о влиянии курения на здоровье. Ведь скорее всего, эти люди в перерыве отправляются курить, а не жевать листик салата. Как говорит сам автор, «суть в том, чтобы узнать вещи, которые позволяют нам лучше понимать свою жизнь».
И если вы мечтали понимать, в чем смысл анекдота про блондинку, которая на вопрос «Какова вероятность встретить на улице динозавра?», отвечает «50%50» (либо встречу, либо нет), обязательно прочитайте книгу Уилана. «Голая статистика» — захватывающее чтение, по увлекательности не уступающее детективу. Да что уж там, не каждый сериал принесет столько удовольствия, сколько эта книга.