Продолжаю ковыряться. Взял
данные переписи. Вот -- половозрастная структура погодно:

А вот по возрастным когортам, использованным ВЦИОМ при обработке данных (выше на рисунке их границы показаны красным пунктиром):

Если взять за основу возрастные группы, использованные ВЦИОМ при обработке данных, и посмотреть на распределение респондентов по ним, то получится вот что:
( Read more... )Как все это читать? Мы анализируем распределение по группам у всех (1), у мужчин (2) и у женщин (3). Везде отличия нашей выборки от данных по переписи наблюдаются на запредельных уровнях значимости (p-value -- вероятности того, что эти отличия могли быть обусловлены случайными причинами -- очень низкие). В каждой таблице сравниваются две колонки цифр -- C (Census -- перепись) и P (Poll -- опрос). Пять строчек в колонке соответствуют возрастным интервалам (см. рисунки выше). observed -- это наблюдаемые значения, expected -- теоретически ожидаемые (исходя из гипотезы о том, что в выборке ВЦИОМ возрастные группы населения представлены пропорционально), residuals -- оценка отскока наблюдаемого от теоретически ожидаемого, если больше двух по модулю, то вероятность того, что этот отскок обусловлен случайными причинами, достаточно мала, чтобы можно было считать его неслучайным (подробнее см. в статье Википедии про
хихиквадрат или в других разумных источниках про него же).
Коротко говоря, выборка ВЦИОМ и население Крыма по переписи в отношении распределения по половозрастным группам не имеют между собой ничего общего...
UPD: По просьбе коллег, выкладываю с вертикальной осью, отградуированной в частотах:

UPD2: По просьбе особо упрямых коллег -- в частотах и в одном масштабе по вертикальной оси:
