Недавно мы говорили о том, как можно ввести в заблуждение людей, некорректно используя статистику. Но на этом список не закончился! Продолжаем разбирать хитрости маркетологов.
Так выглядит график «ящик с усами» из прошлого поста
Часто в новостях и рекламе можно услышать слово «среднестатистический». Но что такое среднее? Существует среднее арифметическое, среднее геометрическое, среднее гармоническое, и список можно продолжать! А неподходящий (случайно или осознанно) выбор среднего может существенно исказить результаты.
Рассмотрим такой пример. Пусть у нас имеются три человека: бабушка Елена Анатольевна с пенсией 8000, сисадмин Вася с зарплатой 30000 и миллионер Павел Умнов, зарабатывающий в месяц ровно миллион.
Тут есть пасхалки с:
Если мы попросту вычислим среднее арифметическое, сложив их зарплаты и поделив на 3, то получим, что оно равно 350 тысяч рублей! Осталось обрадовать этой новостью бабушку.
На логарифмической шкале эти значения даже не выглядят слишком далёкими друг от друга:
Красная линия — среднее арифметическое
Для таких случаев лучше подходит такое среднее, как медиана. Это значение, которое делит все наши данные на две равные части (по количеству). Медианным значением для этого примера была бы зарплата сисадмина Васи — 40000. До неё и после неё находится одинаковое количество людей (по одному). Тогда Васю мы могли бы назвать человеком со среднестатистической зарплатой, всех получающих менее Васи — с небольшим достатком, больше — богатыми.
Вспомните пятибалльную систему оценивания в школе. Представьте, что семиклассник Данил написал диктант на 5, а его одноклассник Леонардо решил написать его справа налево и получил двойку. Делим 5 на 2 и получаем, что Данил написал диктант в 2,5 раза лучше! Верно?
Неверно. Баллы — это придуманная номинальная переменная, которая выражает цифрами словесные оценки «отлично», «хорошо» и так далее. «Неудовлетворительно» ровно в 2,5 раза хуже, чем «отлично»?
Таким образом, считать средние баллы по оценкам или для каких-нибудь тестов математически не имеет смысла.
По данным интернет-голосования 100% людей пользуются интернетом
Ещё до всякой статистики можно солгать, если неправильно собрать данные. Классический пример — президентская гонка США 1948 года: Дьюи против Трумана. Газета Chicago Tribune сразу после закрытия избирательных участков провела опрос, обзвонив огромное количество людей. А по результатам, предсказывающим оглушительный успех Дьюи, выпустила газету с заголовком «ДЬЮИ ПОБЕЖДАЕТ ТРУМАНА». На фото — смеющийся Труман, победитель выборов 1948 года, с этой самой газетой в руках.
Как такое могло произойти?
Газета обзвонила достаточное для выборки число избирателей, причём действительно случайных. Неверным был лишь сам подход — телефон в то время не был доступен небогатому населению, основная масса которого и составляла поддержку Трумана.