Предыдущая | Главная | Глава 7 | Следующая
7.1. Основы
математической статистики
Для эффективного функционирования органов внутренних дел требуется качественная информация о состоянии
преступности, которая должна определенным образом обрабатываться для получения
выводов и рекомендаций. Социально-демографические, уголовно-правовые и иные
характеристики лиц, совершивших преступление, носят случайный характер, а
изучением закономерностей случайных процессов занимается математическая статистика.
При изучении случайных процессов необходимо решить ряд задач. Первая такая
задача заключается в нахождении приближенного выражения для функции
распределения или плотности вероятности по эмпирическому материалу и в выводе
способа получения нескольких рационально выбранных числовых характеристик всей
совокупности этих характеристик, которые дали бы представление о всей совокупности. С этой задачей тесно связана вторая:
найти вероятность того, что случайно выбранный объект совокупности имеет
значение величины в заданных границах. Этими задачами можно было бы
ограничиться, если бы эмпирическая совокупность содержала все объекты исследуемого
типа; такие полные совокупности называют генеральными.
Простейший пример генеральной совокупности - материалы переписи населения,
в которых имеются сведения о всех гражданах. В обычных
задачах известна совокупность, представляющая выборку существующей, генеральной
совокупности, только часть которой удалось обнаружить
наблюдениями. Если одни объекты генеральной совокупности чисто случайно попадают
в результаты наблюдений, а другие не попадают, то мы имеем случайную выборку из
генеральной совокупности. В целом ряде задач
объекты генеральной совокупности не все попадают в статистический
материал не по случайным причинам, а потому, что нет возможности выделить у них тот признак, по которому
подобрана совокупность. В таких случаях говорят, что совокупность есть
результат селекции.
Если для выборочной совокупности
полностью решены первые две задачи, то возникает третья задача: выяснить, в
какой мере полученные числовые параметры выборочной совокупности описывают
генеральную совокупность.
Мы ограничимся рассмотрением вопроса о том, как разработать способы получения
нескольких чисел, которые можно было бы считать достаточно полно описывающими
данную статистическую совокупность.
До анализа и интерпретации
статистической информации, являющейся некоторой совокупностью количественных
данных, обычно необходимо их обобщить. На начальном этапе данные представляют в
виде несгруппированного ряда: осуществляется обычное упорядочивание
количественных оценок от минимальной до
максимальной или наоборот. Следующий
этап - распределение частот. Этот этап в большинстве задач можно пропустить и
приступить к представлению информации в
виде сгруппированных частот.
Для этого определяется или выбирается число интервалов, в каждом из
которых все попадающие в них значения наблюдений считаются равными друг другу.
Шаг интервала определяется из выражения:
,
где и - соответственно максимальное и минимальное значение измеряемой
величины;
k - число интервалов.
Определив середины интервалов и взяв полученные значения в качестве
вариант, получаем последовательность равноотстоящих вариант.
Для наглядности строят различные графики статистического распределения
выборки, например полигон и гистограмму. Полигоном частот называют ломаную, отрезки которой соединяют значения вариант выборки на соответствующих
им частотах.
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников,
основаниями которых служат интервалы частот, а высоты определяются количеством
значений измеряемой величины, попадающих в соответствующий интервал.
Гистограммой относительных частот называют ступенчатую фигуру, состоящую
из прямоугольников, основанием которых служат интервалы частот, а высотой -
частоты выпадения значений измеряемой величины в данном интервале частот.
Для анализа статистической информации используются следующие количественные
характеристики: среднее арифметическое, среднее геометрическое, медиана, мода,
дисперсия, среднее квадратическое отклонение. Такие статистические оценки
называют точечными.
Среднее арифметическое определяется из выражения:
,
где - значения наблюдений измеряемой величины,
-
общее число наблюдений,
Среднее геометрическое (используется для изучения динамики явлений)
определяется из выражения:
,
где - частоты выпадения измеряемой величины в соответствующем
интервале,
.
Медианой называют варианту,
которая делит поровну вариационный ряд.
Модой называют варианту, которая имеет максимальную частоту в
вариационном ряду.
Дисперсия измеряемой величины характеризует меру рассеяния результатов наблюдений
относительно средневзвешенного и определяется по формуле:
.
При большом числе наблюдений такая
оценка дисперсии является состоятельной. При малом числе наблюдений -
смещенной, т.к. ее математическое ожидание не равно дисперсии генеральной
совокупности , а меньше на
. Для устранения смещенности оценку дисперсии умножают на поправочный
множитель Бесселя. Тогда выражение для дисперсии перепишется в виде:
.
Состоятельная и несмещенная оценка СКО результатов наблюдений определится
из выражения:
,
где
- коэффициент, зависящий от числа наблюдений. При числе наблюдений
меньшем 60 значение больше 1 и определяется из таблиц.
Оценка СКО результата измерения определяется по формуле:
.
Точечные оценки результатов наблюдений необходимы
прежде всего для того, чтобы записать результат измерения в виде
,
где - доверительный интервал, в который попадает значение
измеряемой величины при заданном уровне
значимости .
Доверительный интервал определяется из выражения:
,
где - коэффициент
Стьюдента, определяемый из таблиц по числу наблюдений n и уровню
значимости .
Предыдущая | Главная | Глава 7 | Следующая