Статистическая оценка. Требования, предъявляемые к статистической оценке. Выборочное среднее и выборочная дисперсия Исполнитель
- Скачано: 27
- Размер: 154.13 Kb
Статистическая оценка. Требования, предъявляемые к статистической оценке. Выборочное среднее и выборочная дисперсия
План:
- Статистические оценки параметров распределения.
- Несмещенные, эффективные и состоятельные оценки.
- Генеральная и выборочная средние.
- Генеральная и выборочная дисперсии.
Теория статистического оценивания с точки зрения постановки задачи подразделяется на параметрические и непараметрические случаи.
Если требуется изучить количественный признак генеральной совокупности, то возникает задача оценки параметров, которыми определяется распределение этого признака. Например, если наперед известно, что изучаемый признак распределен в генеральной совокупности нормально, то необходимо оценить (приближенно найти) математическое ожидание и среднее квадратическое отклонение, так как эти два параметра полностью определяют нормальное распределение.
Обычно имеются лишь данные выборки, например, значения количественного признака , , ... , , полученные в результате наблюдений, причем эти наблюдения предполагаются независимыми. Через эти данные и выражается оцениваемый параметр. Рассматривая , , ... , как независимые случайные величины , , ... , , можно сказать, что нахождение статистической оценки неизвестного параметра теоретического распределения равносильно нахождению функции от наблюдаемых случайных величин, которая и дает приближенное значение оцениваемого параметра. Например, для оценки математического ожидания нормального распределения служит функция , которая является средним арифметическим наблюдаемых значений признака.
Таким образом, статистической оценкой неизвестного параметра теоретического распределения называется функция от наблюдаемых случайных величин, которая в определенном статистическом смысле близка к истинному значению этого параметра.
Важнейшими свойствами статистической оценки, определяющими ее близость к истинному значению оцениваемого параметра, являются свойства несмещенности, состоятельности и эффективности.
Пусть — статистическая оценка неизвестного параметра теоретического распределения. Многократно извлекая из генеральной совокупности выборки объема , можно получить оценки , , ... , , которые, вообще говоря, различны между собой. Таким образом, оценку можно рассматривать как случайную величину, а числа , , ... , — как ее возможные значения.
Если оценка дает приближенное значение с избытком, то каждое найденное по данным выборок число () больше истинного значения . Ясно, что в этом случае и математическое ожидание (среднее значение) случайной величины больше, чем , т.е. . Очевидно, что если дает оценку с недостатком, то .
Отсюда видно, что использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, приведет к систематическим ошибкам, которые являются неслучайными ошибками, искажающими результаты измерений в одну определенную сторону. По этой причине равенство математического ожидания оценки оцениваемому параметру хотя и не устраняет ошибок ввиду того, что одни значения больше, а другие меньше , однако гарантирует от получения систематических ошибок, так как ошибки разных знаков будут встречаться одинаково часто.
Статистическая оценка называется несмещенной, если ее математическое ожидание равно оцениваемому параметру при любом объеме выборки, т.е.
. (12.1)
Смещенной называется оценка, математическое ожидание которой не равно оцениваемому параметру.
Однако несмещенная оценка необязательно каждый раз дает хорошее приближение оцениваемого параметра. Действительно, возможные значения могут быть сильно рассеяны вокруг своего среднего значения, т.е. дисперсия может быть значительной. В этом случае найденная по данным одной выборки оценка может оказаться весьма удаленной от среднего значения , а значит, и от самого оцениваемого параметра . Если же потребовать, чтобы дисперсия была малой, то возможность допустить большую ошибку будет исключена.
Статистическая оценка называется эффективной, если при заданном объеме выборки она имеет наименьшую возможную дисперсию.
Статистическая оценка называется состоятельной, если она сходится по вероятности к оцениваемому параметру , т.е. для любого
при . (12.2)
Например, если дисперсия несмещенной оценки при стремится к нулю, то такая оценка оказывается и состоятельной.
{spoiler=Подробнее}
Пусть генеральная совокупность изучается относительно количественного признака Х.
Генеральной средней называется среднее арифметическое значений признака генеральной совокупности.
Если все значения , , ... , признака генеральной совокупности объема различны, то генеральная средняя равна
. (12.3)
Если же значения признака , , ... , имеют соответственно частоты , , ... , , причем , то в этом случае генеральная средняя равна
. (12.4)
Если рассматривать обследуемый признак Х генеральной совокупности как случайную величину и сопоставлять формулы (12.3) и (12.4) с формулами (6.1) и (6.2), то можно сделать вывод, что математическое ожидание признака равно генеральной средней этого признака:
. (12.5)
Пусть теперь для изучения генеральной совокупности относительно количественного признака Х извлечена выборка объема .
Выборочной средней называется среднее арифметическое наблюдаемых значений признака выборочной совокупности.
Если все значения , , ... , признака выборки объема различны, то выборочная средняя равна
. (12.6)
Если же значения признака , , ... , имеют соответственно частоты , , ... , , причем , то в этом случае выборочная средняя равна
(12.7)
или
. (12.8)
Убедимся, что выборочная средняя является несмещенной оценкой генеральной средней, т.е. покажем, что математическое ожидание равно . Будем рассматривать как случайную величину и , , ... , как независимые, одинаково распределенные случайные величины. Поскольку эти величины одинаково распределены, то они имеют одинаковые числовые характеристики, в частности одинаковое математическое ожидание, которое равно математическому ожиданию признака Х генеральной совокупности.
На основании этого, используя свойство 6.2, следствие 6.2, а также формулы (12.5) и (12.6), получаем
. (12.9)
Используя следствие 9.1, легко показать, что выборочная средняя является и состоятельной оценкой генеральной средней.
Для того, чтобы охарактеризовать рассеяния значений количественных признаков генеральной и выборочной совокупностей вокруг своих средних значений, вводятся сводные характеристики — соответственно генеральная и выборочная дисперсии, а также средние квадратические отклонения.
Генеральной дисперсией называется среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения .
Если все значения , , ... , признака генеральной совокупности объема различны, то генеральная дисперсия равна
. (12.10)
Если же значения признака , , ... , имеют соответственно частоты , , ... , , причем , то в этом случае генеральная дисперсия равна
. (12.11)
Генеральным средним квадратическим отклонением называется квадратный корень из генеральной дисперсии:
. (12.12)
Пример 1. Генеральная совокупность задана следующей таблицей распределения:
Т а б л и ц а 12.1
2 | 4 | 5 | 6 | |
8 | 9 | 10 | 3 |
Найти генеральную дисперсию и генеральное среднее квадратическое отклонение.
Решение. Найдем генеральную среднюю:
.
Найдем генеральную дисперсию:
.
Найдем генеральное среднее квадратическое отклонение:
.
Выборочной дисперсией называется среднее арифметическое квадратов отклонений наблюдаемых значений признака выборочной совокупности от их среднего значения .
Если все значения , , ... , признака выборки объема различны, то выборочная дисперсия равна
. (12.13)
Если же значения признака , , ... , имеют соответственно частоты , , ... , , причем , то в этом случае выборочная дисперсия равна
. (12.14)
Выборочным средним квадратическим отклонением называется квадратный корень из генеральной дисперсии:
. (12.15)
Пример 2. Выборочная совокупность задана следующей таблицей распределения:
Т а б л и ц а 12.2
1 | 2 | 3 | 4 | |
20 | 15 | 10 | 5 |
Найти выборочную дисперсию и выборочное среднее квадратическое отклонение.
Решение. Найдем выборочную среднюю:
.
Найдем выборочную дисперсию:
.
Найдем выборочное среднее квадратическое отклонение:
.
Дисперсии удобнее вычислять, используя следующие формулы:
, (12.16)
, (12.17)
(12.18)
и
. (12.19)
Теперь пусть требуется по данным выборки оценить неизвестную генеральную дисперсию . Выборочная дисперсия является смещенной оценкой , так как
. (12.20)
Если же в качестве оценки генеральной дисперсии принять исправленную дисперсию , которая получается путем умножения на дробь , то она будет несмещенной оценкой генеральной дисперсии. Действительно, учитывая (12.20), имеем
(12.21)
и
. (12.22)
Вопросы для повторения и контроля:
- Что называется статистической оценкой неизвестного параметра и какими важнейшими свойствами она может обладать?
- Что такое несмещенная оценка и чем обосновывается ее введение?
- Что такое эффективная оценка и в чем необходимость ее ввода?
- Что называется смещенной оценкой и состоятельной оценкой?
- Что такое генеральная средняя и по каким формулам она вычисляется?
- Что называется выборочной средней и по каким формулам она вычисляется?
- Какой оценкой генеральной средней является выборочная средняя?
- Что такое генеральная дисперсия и по каким формулам она вычисляется?
- Что называется выборочной дисперсией и по каким формулам она вычисляется?
- Что такое генеральное среднее квадратическое отклонение и выборочное среднее квадратическое отклонение, для чего они, а также генеральная и выборочная дисперсии вводятся?
- По каким формулам удобнее вычислять дисперсии?
- Что является несмещенной оценкой генеральной дисперсии?
Опорные слова:
Статистическая оценка неизвестного параметра, несмещенная оценка, смещенная оценка, эффективная оценка, состоятельная оценка, генеральная средняя, выборочная средняя, генеральная дисперсия, генеральное среднее квадратическое отклонение, выборочная дисперсия, выборочное среднее квадратическое отклонение, исправленная дисперсия.{/spoilers}