Необходимость проводить выборочные исследования, может быть вызвана различными причинами:
Пример:
Генеральная совокупность — это набор объектов, о которых необходимо получить информацию. Генеральная совокупность состоит из всех объектов, которые имеют качества, свойства, интересующие исследователя. Иногда генеральная совокупность — это все взрослое население определённого региона (например, когда изучается отношение потенциальных избирателей к кандидату), чаще всего задаётся несколько критериев, определяющих объекты исследования. Например, женщины 10-89 лет, использующие крем для рук определённой марки не реже одного раза в неделю, и имеющие доход не ниже 5 тысяч рублей на одного члена семьи. Выборка — это небольшой набор объектов, извлеченных из генеральной совокупности. Выборочная совокупность — это необходимый для исследования минимум результатов (случаев, испытуемых, объектов, событий, образцов) отобранных с помощью определённой процедуры из генеральной совокупности. Примеры:
Выборка может рассматриваться в качестве репрезентативной или нерепрезентативной. Выборка будет репрезентативной при обследовании большой группы людей, если внутри этой группы есть представители разных подгрупп, только так можно сделать верные выводы. • Репрезентати́вность — соответствие характеристик выборки характеристикам популяции или генеральной совокупности в целом. Репрезентативность определяет, насколько возможно обобщать результаты исследования с привлечением определённой выборки на всю генеральную совокупность, из которой она была собрана. Также репрезентативность можно определить, как свойство выборочной совокупности представлять параметры генеральной совокупности, значимые с точки зрения задач исследования. Пример: выборка, состоящая из 60 учеников старших классов, гораздо хуже представляет совокупность, чем выборка из тех же 60 человек, в которую войдут по 3 ученика из каждого класса. Главной причиной тому — неравное возрастное распределение в классах. Следовательно, в первом случае репрезентативность выборки низкая, а во втором случае репрезентативность высокая (при прочих равных условиях).
Задача 1. В городе, насчитывающем 253 000 жителей, имеющих право голосовать, исследуйте политические симпатии будущих избирателей. Решение
Итак, нужны такие способы образования выборки, которые представляли бы всю генеральную совокупность, т. е. выборка должна быть репрезентативной (представительной).
Задача 2. Определить, является ли репрезентативной выборка: 1) число автомобильных аварий в июне, если необходимо составить статистический отчет по авариям в городе за год; 2) городские жители при подсчете числа автомобилей на душу населения в стране; 3) люди в возрасте от 40 до 50 лет при выяснении рейтинга молодежной телепрограммы. Решение 1) Выборка не является репрезентативной. Летом нет снега и наледи на дорогах, а это одна из основных причин аварий. 2) Выборка не является репрезентативной. Понятно, что в городе машин намного больше, чем в сельских районах. Это необходимо учитывать. 3) Выборка не является репрезентативной. Люди в возрасте от 40 до 50 лет едва ли проявят интерес к программе, ориентированной на молодежную аудиторию. При использовании такой выборки рейтинг может сильно упасть, но это не отразит реального положения вещей. Для формирования выборочной совокупности применяются различные способы отбора. Статистические данные должны быть представлены так, чтобы ими можно было пользоваться.
Параметры генеральной совокупности и выборки N – генеральная совокупность, которая подразделяется на страты N1, N2 и так далее.
Страты представляют собой однородные объекты с точки зрения статистических характеристик (например, население делится на страты по возрастным группам или социальной принадлежности; предприятия — по отраслям). В этом случае выборки называются стратифицированными. n – объем выборки. В основе статистических выводов проведенного исследования лежит распределение случайной величины Х, наблюдаемые же значения х1, х2, х3 называются реализациями случайной величины x. Распределение случайной величины X в генеральной совокупности носит теоретический, идеальный характер, а ее выборочный аналог является эмпирическим распределением
Для выборки же функцию распределения определить трудно, а иногда невозможно, поэтому параметры оценивают по эмпирическим данным, а затем их подставляют в аналитическое выражение, описывающее теоретическое распределение. При этом предположение о виде распределения может быть как статистически верным, так и ошибочным. Но в любом случае восстановленное по выборке эмпирическое распределение лишь грубо характеризует истинное. Важнейшими параметрами распределений являются математическое ожидание а и дисперсия σ2 – мера разброса данных. Стандартное отклонение σ – степень отклонения данных наблюдений или множеств от среднего значения. Задача 3. Михаил вместе со своими друзьями решил измерить рост своих собак (по холке). Найдите: среднее значение; отклонение роста.
Решение
Стандартное отклонение это всего лишь квадратный корень из дисперсии. σ\ = 147,32 Таким образом, зная стандартное отклонение мы знаем, что значит «нормальный рост», и что является очень высокой и очень маленькой собакой. Ответ: 394, 21,704; 147,32.
Задача 4. Наблюдение в контрольной лаборатории за сроком годности 50 электроламп одинаковой мощности, взятых наудачу из большой партии выпущенных заводом ламп этой же мощности, привело к следующим данным о нарушении установленного гарантийного срока горения:
Требуется по этим выборочным данным найти параметры нормального распределения, которое отражает отклонение фактического срока горения лампочек от гарантийного. Решение. Среднее отклонение
Таким образом, искомое нормальное распределение характеризуется следующими значениями параметров: а = 0,4; σ2 = 318; σ = 17,8. Отсюда плотность вероятности:
Соответствующая этой плотности функция распределения будет выглядеть:
| |||||||||||||||||
| |||||||||||||||||
Просмотров: 10872 | | |
Всего комментариев: 0 | |