Что такое абсолютная частота
Абсолютная и относительная частота в пандах
Частота — это число появлений результата в выборке, которое известно как частота этого результата в данной выборке. Это можно назвать двумя различными способами.
1. Абсолютная частота:
Это количество наблюдений в определенной категории. Он всегда имеет целочисленное значение, или мы можем сказать, что он имеет дискретные значения.
Пример:
Following data are given about pass or fail of students in an exam held of Mathematics in a class.
P, P, F, P, F, P, P, F, F, P, P, P
where, P = Passed and F = Failed.
Solution:
From the given data we can say that,
There are 8 students who passed the exam
There are 4 students who failed the exam
Реализация в Python:
Пусть результат 12 человек, объявленных в двух категориях Pass (P) и Fail (F), классифицируется как 1 и 0 соответственно.
import pandas as pd
2. Относительная частота:
Это доля наблюдений определенной категории в данном наборе данных. Он имеет плавающие значения и также представлен в процентах. Рассмотрим приведенный пример пройденных и провальных студентов на экзамене по математике. Потом,
relative frequency of passed students = 8 / ( 8 + 4 ) = 0.666 = 66.6 %
relative frequency of failed students = 4 / ( 8 + 4 ) = 0.333 = 33.3 %
import pandas as pd
Абсолютные и относительные статистические величины
Понятие абсолютных величин
Абсолютные величины — это результаты статистических наблюдений. В статистике в отличие от математики все абсолютные величины имеют размерность (единицу измерения), а также могут быть положительными и отрицательными.
Единицы измерения абсолютных величин отражают свойства единиц статистической совокупности и могут быть простыми, отражая 1 свойство (например, масса груза измеряется в тоннах) или сложными, отражая несколько взаимосвязанных свойств (например, тонно-километр или киловатт-час).
Единицы измерения абсолютных величин могут быть 3 видов:
Абсолютные величины могут быть моментными или интервальными. Моментные абсолютные величины показывают уровень изучаемого явления или процесса на определенный момент времени или дату (например, количество денег в кармане или стоимость основных фондов на первое число месяца). Интервальные абсолютные величины — это итоговый накопленный результат за определенный период (интервал) времени (например, зарплата за месяц, квартал или год). Интервальные абсолютные величины, в отличие от моментных, допускают последующее суммирование.
Абсолютная статистическая величина обозначается X, а их общее число в статистической совокупности — N.
Количество величин с одинаковым значением признака обозначается f и называется частота (повторяемость, встречаемость).
Cами по себе абсолютные статистические величины не дают полного представления об изучаемом явлении, так как не показывают его динамику, структуру, соотношение между частями. Для этих целей служат относительные статистические величины.
Понятие и виды относительных величин
Относительная статистическая величина — это результат соотношения двух абсолютных статистических величин.
Если соотносятся абсолютные величины с одинаковой размерностью, то получаемая относительная величина будет безразмерной (размерность сократится) и носит название коэффициент.
Часто применяется искусственная размерность коэффициентов. Она получается путем их умножения:
Искусственная размерность коэффициентов применяется, как правило, в разговорной речи и при формулировании результатов, а в самих расчетах она не используется. Чаще всего применяются проценты, в которых принято выражать полученные значения относительных величин.
Чаще вместо названия относительная статистическая величина используется более краткий термин-синоним — индекс (от лат. index — показатель, коэффициент).
В зависимости от видов соотносимых абсолютных величин при расчете относительных величин, получаются разные виды индексов: динамики, планового задания, выполнения плана, структуры, координации, сравнения, интенсивности.
Индекс динамики
Индекс динамики (коэффициент роста, темп роста) показывает во сколько раз изменилось изучаемое явление или процесс во времени. Рассчитывается как отношение значения абсолютной величины в отчетный (анализируемый) период или момент времени к базисному (предыдущему):
.
Здесь и далее подиндексы означают: 1 — отчетный (анализируемый) период, 0 — базисный (прошлый) период.
Индекс планового задания
Индекс планового задания – это отношение планового значения абсолютной величины к базисному:
Например, автосалон в январе продал 100 автомобилей, а на февраль запланировал продать 120 автомобилей. Тогда индекс планового задания составит i пз = 120/100 = 1,2, что означает планирование роста продаж в 1,2 раза или на 20%
Индекс выполнения плана
Индекс выполнения плана – это отношение фактически полученного значения абсолютной величины в отчетном периоде к запланированному:
Например, автосалон в феврале продал 110 автомобилей, хотя на февраль было запланировано продать 120 автомобилей. Тогда индекс выполнения плана составит i вп = 110/120 = 0,917, что означает выполнение плана на 91,7%, то есть план недовыполнен на (100%-91,7%) = 8,3%.
Перемножая индексы планового задания и выполнения плана, получим индекс динамики:
В рассмотренном ранее примере про автосалон, если перемножим полученные значения индексов планового задания и выполнения плана, то получим значение индекса динамики: 1,2*0,917 = 1,1.
Индекс структуры
Индекс структуры показывает, какую долю составляет отдельная часть совокупности от всей совокупности.
Например, если в рассматриваемой группе студентов 20 девушек и 10 молодых людей, тогда индекс стурктуры (доля) девушек будет равен 20/(20+10) = 0,667, то есть доля девушек в группе составляет 66,7%.
Индекс координации
Индекс координации показывает, во сколько раз больше или сколько процентов составляет одна часть статистической совокупности по сравнению с другой ее частью, принятой за базу сравнения.
Например, если в группе студентов из 20 девушек и 10 молодых людей, принять за базу сравнения численность девушек, тогда индекс координации численности молодых людей составит 10/20 = 0,5, то есть численность молодых людей составляет 50% от численности девушек в группе.
Индекс сравнения
где А, Б — признаки сравниваемых объектов или территорий.
Индекс интенсивности
Например, хлебный магазин продал 500 буханок хлеба и заработал на этом 10000 руб., тогда индекс интенсивности составит 10000/500 = 20 [руб./бух.хлеба], то есть цена продажи хлеба составила 20 руб. за буханку.
Большинство величин с дробной размерностью представляют собой индексы интенсивности.
Частота абсолютная и относительная. Статистическое определение вероятности
Теория вероятностей имеет дело с испытаниями, исходы которых непредсказуемы: они зависят от случая. О таких испытаниях мы уже говорили – это подбрасывание монеты и кубика, проверка лотерейных билетов, падение бутерброда на пол и т.д.
Для всех таких испытаний характерно то, что их можно многократно повторять (хотя бы мысленно) в одних и тех же условиях. То есть условия проведения испытания не меняются, а результаты могут быть совершенно различными (такие испытания называют массовыми однородными испытаниями).
Чтобы выяснить, насколько вероятно то или иное случайное событие, связанное с испытанием, нужно подсчитать, как часто оно происходит. Для этого используют два важных теоретико-вероятностных понятия.
Определение. Пусть проводится n однородных испытаний. Число испытаний, в которых событие А произошло, называется абсолютной частотой появления события.
Определение. Пусть проводится n однородных испытаний, и пусть событие А произошло в m из них. Число равное отношению числа всех проведенных испытаний к числу испытаний, в которых событие А произошло, называется относительной частотой появления события А.
Относительная частота появления события А обозначается: W(А). Таким образом, по определению, .
Замечание. Относительную частоту можно найти, поделив абсолютную частоту на число испытаний. Иногда относительную частоту измеряют в процентах.
Рассмотрим пример: игральный кубик подбросили 50 раз, и исходы испытаний занесли в таблицу, в первом строке которой перечислены все возможные исходы, во второй и третьей строках фиксировались значения абсолютной и относительных частот соответственно
Исходы | ||||||
абсолютная частота | ||||||
относительная частота | 0,18 | 0,12 | 0,16 | 0,22 | 0,18 | 0,14 |
Полученная таблица обладает некоторыми замечательными свойствами, которые характерны для любой таблицы абсолютных и относительных частот:
1) сумма абсолютных частот по всем исходам испытания равна числу проведенных испытаний, для данной таблицы – 50;
2) сумма относительных частот по всем исходам испытания равна 1.
Замечание. Проверка этих свойств поможет в дальнейшем избегать ошибок при заполнении таких таблиц.
Наглядной иллюстрацией распределения абсолютных и относительных частот служат гистограммы, на которых каждая из частот изображается в виде столбика соответствующей высоты. Гистограмма относительных частот для рассмотренного примера изображена на следующем рисунке
По таблице и гистограмме легко оценивать, какой исход в данной серии испытаний появляется чаще остальных. В данном примере видно, что четверка выпадала в этой серии испытаний чаще остальных, а двойка реже. Но можно ли на этом основании сказать, что исход «4» более вероятен, чем исход «2»?
Пусть проводится серия испытаний, и фиксируются абсолютные и относительные частоты исходов испытаний. Выясним, как ведут себя частоты при увеличении числа испытаний в серии. Это удобно наблюдать на конкретном примере.
Пример. Игральный кубик подбрасывали 1000 раз, и после каждой серии из 100 подбрасываний фиксировали относительную частоту появления каждого исхода. В результате была получена следующая таблица.
Количество испытаний | Частота исходов | ||||
0,16 | 0,16 | 0,2 | 0,15 | 0,19 | 0,14 |
0,16 | 0,135 | 0,185 | 0,16 | 0,18 | 0,18 |
0,167 | 0,16 | 0,163 | 0,153 | 0,183 | 0,173 |
0,168 | 0,153 | 0,175 | 0,163 | 0,185 | 0,158 |
0,164 | 0,146 | 0,182 | 0,16 | 0,186 | 0,162 |
0,152 | 0,157 | 0,183 | 0,153 | 0,188 | 0,167 |
0,153 | 0,164 | 0,180 | 0,151 | 0,186 | 0,166 |
0,159 | 0,164 | 0,181 | 0,155 | 0,180 | 0,161 |
0,156 | 0,164 | 0,183 | 0,166 | 0,171 | 0,160 |
0,158 | 0,170 | 0,182 | 0,165 | 0,168 | 0,157 |
Построим график зависимости, например частоты выпадения тройки, от числа экспериментов.
По графику видно, что относительная частота появления тройки вначале проведения серии испытаний испытывает значительные колебания, но с ростом числа испытаний она стабилизируется около значения 0,18. Построив графики зависимостей относительных частот появления других исходов, от числа проведенных испытаний можно убедиться в аналогичном результате. Поэтому, можно сделать вывод, что относительная частота появления той или другой цифры, в данном случае, стабилизируется с ростом числа испытаний.
Оказывается, что такое свойство относительных частот имеет место и в общем случае. Говорят, что с ростом числа однородных испытаний относительная частота появления события приобретает свойство устойчивости, мало отличается от некоторого фиксированного числа. На этом факте основывается одно из определений вероятности.
Определение. Статистической вероятностью события А называется число вокруг которого колеблется относительная частота появления события А в длинной серии испытаний.
Замечание. Следует заметить, что данное определение не является математически строгим, оно скорее, экспериментальное.
Абсолютная частота
Опубликовано 29.05.2021 · Обновлено 29.05.2021
Что такое абсолютная частота?
Абсолютная частота – это статистический термин, описывающий, сколько раз конкретная часть данных или конкретное значение появляется во время испытания или набора испытаний. По сути, абсолютная частота – это простой подсчет количества наблюдений за значением. Абсолютная частота обычно выражается целым числом и считается базовым уровнем статистического анализа.
Понимание абсолютной частоты
Абсолютная частота часто является компонентом сбора основных данных. Например, если вы спросите 10 друзей, является ли синий их любимый цвет, и трое скажут «да», а семь – нет, у вас будет достаточно информации, чтобы определить абсолютную частоту: абсолютная частота «да» равна трем, а частота «нет» равна равно семи. Количество отслеживаемых значений часто увеличивается с увеличением размера выборки или объема исследования. Например, если вы спросите 100 человек, является ли их любимый цвет синим, абсолютная частота, скорее всего, увеличится. Однако нет никакой дополнительной сложности в отслеживании того, сколько раз встречается данное значение.
В некоторых визуализациях данных используется абсолютная частота. Например, абсолютная частота ответов на опрос часто отображается на графике, чтобы обеспечить удобное представление большинства ответов на конкретный вопрос.
Абсолютная частота может использоваться для отображения наиболее часто встречающихся данных в испытании или исследовании, но обычно не используется в качестве первичного статистического измерения.
Ключевые выводы
Абсолютная частота против относительной частоты
Абсолютная частота может быть отправной точкой для более детального статистического анализа. Относительная частота, например, получается из абсолютной частоты. Когда абсолютная частота значений отслеживается на протяжении всего испытания, абсолютная частота для конкретного значения затем может быть разделена на общее количество значений для этой переменной на протяжении всего испытания, чтобы получить относительную частоту. Мы чаще всего ссылаемся на относительную частоту, будь то процент побед нашей любимой спортивной команды или процент управляющих фондами, опередивших рынок. В отличие от абсолютной частоты, относительная частота обычно выражается в процентах или дробях, а не целым числом.
Иногда, когда относительные частоты очень малы, они даются в единицах «на тысячу», «на миллион» и т. Д., Как общее количество преступлений в городе на тысячу человек. Такие корректировки называются «на душу населения».
Пример абсолютной частоты
Представьте себе конференцию по бухгалтерскому учету, которая хочет собрать данные о привычках к употреблению алкоголя в профессии. Организатор конференции спрашивает у комнаты из 50 бухгалтеров, сколько бокалов вина они выпили за последнюю неделю. После того, как каждый из 50 бухгалтеров дает свой ответ, он помещается в таблицу с абсолютными частотами.
Есть несколько наблюдений, которые вы можете сделать из таблицы, отображающей абсолютную частоту: большее количество бухгалтеров пьют некоторое количество алкоголя, чем не употребляют алкоголь. Однако наиболее ценные наблюдения, которые можно сделать из этого набора данных, требуют дополнительного анализа. Например, 50% бухгалтеров на конференции выпивают пять и более напитков в неделю.
Однако как статистическое исследование этот обзор оставляет желать лучшего. Во-первых, нет демографической информации, кроме профессии респондентов. Пол респондентов не разглашается. Это важно, поскольку существуют разные рекомендации по употреблению алкоголя в зависимости от пола. Мы также не знаем крепость или объем алкоголя (ABV) конкретного напитка, о котором сообщают. Как и абсолютная частота, наш пример опроса – это только начало реального анализа потребления алкоголя в бухгалтерской профессии.
Математическая статистика — основы
Слово «статистика» происходит от латинского слова «status» (статус), что означает «состояние и положение дел/вещей».
Статистика занимается изучением количественной стороны массовых общественных явлений и процессов в числовой форме, выявляя особые закономерности.
На сегодняшний день статистика применяется практически во всех сферах общественной жизни, начиная от моды, кулинарии, садоводства и заканчивая астрономией, экономикой, медициной.
Перво-наперво, при знакомстве со статистикой необходимо изучить основные статистические характеристики, применяемые для анализа данных.
Ну вот, с этого и начнем!
Математическая статистика — коротко о главном
Определения математической статистики:
Статистическая выборка – выбранное из всего числа объектов конкретное число объектов для исследования.
Объем выборки – количество элементов \( <
_<1>>,< _<2>>,\ …,\ < _ >\), попавших в выборку.
Размах выборки – разность между максимальным и минимальным значениями элементов выборки.
Среднее арифметическое ряда чисел – это частное от деления суммы этих чисел на их количество (объем выборки).
Среднее арифметическое ряда чисел \( \left( <
_ > \right)\) – это частное от деления суммы этих чисел \( \left( < _<1>>+< _<2>>+…+< _ > \right)\) на их количество \( \left( n \right)\)
Модой ряда чисел называется число, наиболее часто встречающееся в данном ряду.
Медиана упорядоченного ряда чисел с нечетным числом членов – число, которое окажется посередине.
Медиана упорядоченного ряда чисел с четным числом членов –среднее арифметическое двух чисел, записанных посередине.
Частота представляет собой число повторений, сколько раз за какой-то период происходило некоторое событие, проявлялось определенное свойство объекта либо наблюдаемый параметр достигал данной величины.
Частота – число повторений определенного значения параметра в выборке.
Относительная частота – это отношение частоты к общему числу данных в ряду.
Для наглядности удобно представлять данные в виде соответствующих диаграмм/графиков.
Статистические характеристики
К основным статистическим характеристикам выборки данных…
Какая еще такая «выборка»!?
Под словом «выборка» подразумевается просто данные, которые ты собираешься исследовать.
Дальше на примерах будет все понятно.
Так вот к основным статистическим характеристикам выборки данных относятся:
Стоп-стоп-стоп! Сколько новых слов! Давай обо всем по порядку.
Объем и размах выборки
Выборка состоит из элементов \( <
_<1>>,< _<2>>,\ …,\ < _ >\), попавших в нее. Количество этих элементов \( \left( n \right)\) называется объемом выборки.
Например, в таблице ниже приведен рост игроков сборной по футболу:
Данная выборка представлена \( \displaystyle 11\) элементами \( \displaystyle \left( <
Таким образом, объем выборки \( \displaystyle \left( n \right)\) равен \( \displaystyle 11\).
Разность между максимальным и минимальным значениями элементов выборки называется размахом выборки.
Размах представленной выборки составляет \( <
Среднее арифметическое выборки
Среднее арифметическое ряда чисел \( \left( <
_ > \right)\) – это частное от деления суммы этих чисел \( \left( < _<1>>+< _<2>>+…+< _ > \right)\) на их количество \( \left( n \right)\).
Не очень понятно? Давай смотреть на наш пример.
Определите средний рост игроков.
Ну что, приступим? Мы уже разбирались, что \( \displaystyle <
Можем сразу смело все подставлять в нашу формулу:
Таким образом, средний рост игрока сборной составляет \( \displaystyle 183,8\) см.
Ну или вот такой пример:
Ученикам 9 класса на неделю было задано решить как можно больше примеров из задачника. Количество примеров, решенных учениками за неделю, приведены ниже:
Найдите среднее количество решенных задач.
Итак, в таблице нам представлены данные по \( \displaystyle 20\) ученикам. Таким образом, \( \displaystyle n=20\). \( \displaystyle <
Ну что ж, найдем для начала сумму (общее количество) всех решенных задач двадцатью учениками:
Теперь можем смело приступать к расчету среднего арифметического решенных задач, зная, что \( \displaystyle <
Таким образом, в среднем ученики 9 класса решили по \( \displaystyle 78\) задач.
Еще один пример:
На рынке помидоры реализуются \( \displaystyle 7\) продавцами, причем цены за \( \displaystyle 1\) кг распределены следующим образом (в руб.): \( \displaystyle 60,\text< >55,\text< >54,\text< >70,\text< >65,\text< >67,\text< >63\).
Какова средняя цена килограмма помидоров на рынке?
Решение.
Итак, чему в данном примере равно \( \displaystyle n\)? Все верно: семь продавцов предлагают семь цен, значит, \( \displaystyle n=7\)! \( \displaystyle <
Ну вот, со всеми составляющими разобрались, теперь можем приступить к расчету средней цены:
Тогда посчитай самостоятельно среднее арифметическое в следующих выборках:
Ответы: \( \displaystyle 48,17;\text< >9;\ 168\).
Решил? Можем двигаться дальше.
Мода и медиана
Модой ряда чисел называется число, наиболее часто встречающееся в данном ряду.
Обратимся снова к нашему примеру со сборной по футболу:
Чему в данном примере равна мода? Какое число наиболее часто встречается в этой выборке?
Все верно, это число \( \displaystyle 181\), так как два игрока имеют рост \( \displaystyle 181\) см; рост же остальных игроков не повторяется.
Тут все должно быть ясно и понятно, да и слово знакомое, правда?
Перейдем к медиане, ты ее должен знать из курса геометрии. Но мне не сложно напомнить, что в геометрии медиана (в переводе с латинского- «средняя») — отрезок внутри треугольника, соединяющий вершину треугольника с серединой противоположной стороны.
Ключевое слово – СЕРЕДИНА. Если ты знал это определение, то тебе легко будет запомнить, что такое медиана в статистике.
Медианой ряда чисел с нечетным числом членов называется число, которое окажется посередине, если этот ряд упорядочить (проранжировать, т.е. расположить значения в порядке убывания или возрастания).
Медианой ряда чисел с четным числом членов называется среднее арифметическое двух чисел, записанных посередине, если этот ряд упорядочить.
Ну что, вернемся к нашей выборке футболистов?
Ты заметил в определении медианы важный момент, который нам еще здесь не встречался? Конечно, «если этот ряд упорядочить»!
Для того, чтобы в ряду чисел был порядок, можно расположить значения роста футболистов как в порядке убывания, так и в порядке возрастания. Мне удобней выстроить этот ряд в порядке возрастания (от самого маленького к самому большому).
Вот, что у меня получилось:
Так, ряд упорядочили, какой еще есть важный момент в определении медианы? Правильно, четное и нечетное количество членов в выборке.
Заметил, что для четного и нечетного количества даже определения отличаются? Да, ты прав, не заметить – сложно. А раз так, то нам надо определиться, четное у нас количество игроков в нашей выборке или нечетное?
Все верно – игроков \( \displaystyle 11\), значит, количество нечетное! Теперь можем применять к нашей выборке менее заковыристое определение медианы для нечетного количества членов в выборке.
Ищем число, которое оказалось посередине в нашем упорядоченном ряду:
Ну вот, чисел у нас \( \displaystyle 11\), значит, по краям остается по пять чисел, а рост \( \displaystyle 183\) см будет медианой в нашей выборке.
Не так уж и сложно, правда?
А теперь разберем пример с нашими отчаянными ребятами из 9 класса, которые решали примеры в течение недели:
Готов искать в этом ряду моду и медиану?
Для начала, упорядочим этот ряд чисел (расположим от самого маленького числа к самому большому). Получился вот такой вот ряд:
Теперь можно смело определить моду в данной выборке. Какое число встречается чаще других? Все верно, \( \displaystyle 77\)!
Таким образом, мода в данной выборке равна \( \displaystyle 77\).
Моду нашли, теперь можем приступать к нахождению медианы. Но прежде, ответь мне: каков объем рассматриваемой выборки? Посчитал? Все верно, объем выборки равен \( \displaystyle 20\).
А \( \displaystyle 20\) – это четное число. Таким образом, применяем определение медианы для ряда чисел с четным количеством элементов.
То есть нам надо в нашем упорядоченном ряду найти среднее арифметическое двух чисел, записанных посередине. Какие два числа располагаются посередине?
Все верно, \( \displaystyle 80\) и \( \displaystyle 81\)!
Таким образом, медианой этого ряда будет среднее арифметическое чисел \( \displaystyle 80\) и \( \displaystyle 81\):
\( 80,5\)— медиана рассматриваемой выборки.
Частота и относительная частота
Частота представляет собой число повторений, сколько раз за какой-то период происходило некоторое событие, проявлялось определенное свойство объекта либо наблюдаемый параметр достигал данной величины.
То есть частота определяет то, как часто повторяется та или иная величина в выборке.
Разберемся на нашем примере с футболистами. Перед нами вот такой вот упорядоченный ряд:
Частота – это число повторений какой-либо величины параметра. В нашем случае, это можно считать вот так. Сколько игроков имеет рост \( 176\)?
Все верно, один игрок. Таким образом, частота встречи игрока с ростом \( 176\) в нашей выборке равна \( 1\).
Сколько игроков имеет рост \( 178\)? Да, опять же один игрок. Частота встречи игрока с ростом \( 178\) в нашей выборке равна \( 1\).
Задавая такие вопросы и отвечая на них, можно составить вот такую табличку:
Ну вот, все довольно просто. Помни, что сумма частот должна равняться количеству элементов в выборке (объему выборки).
То есть в нашем примере: \( 1+1+1+2+1+1+1+1+1+1=11\)
Перейдем к следующей характеристике – относительная частота.
Относительная частота – это отношение частоты к общему числу данных в ряду. Как правило, относительная частота выражается в процентах. |
Рассчитываем относительную частоту для каждого значения роста и получаем вот такую табличку:
А теперь сам составь таблицы частот и относительных частот для примера с 9-классниками, решающими задачи.
Графическое изображение данных
Очень часто для наглядности данные представляются в виде диаграмм/графиков. Остановимся на рассмотрении основных из них:
Столбчатая диаграмма
Столбчатые диаграммы используют тогда, когда хотят продемонстрировать динамику изменения данных во времени или распределения данных, полученных в результате статистического исследования.
Например, у нас есть вот такие данные об оценках написанной контрольной работы в одном классе:
Количество получивших такую оценку – это у нас и есть частота. Зная это, мы можем составить вот такую вот табличку:
Теперь мы можем построить наглядные столбчатые графики на основе такого показателя как частота (на горизонтальной оси отражены оценки \( \displaystyle \left( 2,3,4,5 \right)\) на вертикальной оси откладываем количество учеников, получивших соответствующие оценки):
Или же можем построить соответствующий столбчатый график на основе относительной частоты:
Рассмотрим пример по типу задания из ЕГЭ.
Пример.
На диаграмме показано распределение добычи нефти в \( \displaystyle 7\) странах мира (в тоннах) за 2011 год.
Среди стран первое место по добыче нефти занимала Саудовская Аравия, седьмое место – Объединенные Арабские Эмираты. Какое место занимали США?
Ответ: третье.
Круговая диаграмма
Для наглядного изображения соотношения между частями исследуемой выборки удобно использовать круговые диаграммы.
По нашей табличке с относительными частотами распределения оценок в классе мы можем построить круговую диаграмму, разбив круг на секторы, пропорциональные относительным частотам.
Круговая диаграмма сохраняет свою наглядность и выразительность только при небольшом числе частей совокупности. В нашем случае, таких частей четыре (в соответствии с возможными оценками \( \displaystyle 2,3,4,5\)), поэтому применение такого типа диаграммы достаточно эффективно.
Рассмотрим пример по типу задания 18 из ГИА.
Пример.
На диаграмме показано распределение расходов семьи во время отдыха на море. Определите, на что семья потратила больше всего?
Ответ: проживание.
Полигон
Динамику изменения статистических данных во времени часто изображают с помощью полигона.
Для построения полигона отмечают в координатной плоскости точки, абсциссами которых служат моменты времени, а ординатами – соответствующие им статистические данные.
Соединив последовательно эти точки отрезками, получают ломанную, которую называют полигоном.
Вот, к примеру, нам даны среднемесячные температуры воздуха в Москве.
Сделаем приведенные данные более наглядными – построим полигон.
На горизонтальной оси отражены месяцы, на вертикальной – температура. Строим соответствующие точки и соединяем их.
Вот, что получилось:
Согласись, сразу стало наглядней!
Полигон, используют также для наглядного изображения распределения данных, полученных в результате статистического исследования.
Вот построенный полигон на основе нашего примера с распределением оценок:
Рассмотрим типовое задание из ЕГЭ.
Пример.
На рисунке жирными точками показана цена алюминия на момент закрытия биржевых торгов во все рабочие дни с \( \displaystyle 7\) по \( \displaystyle 20\) августа \( \displaystyle 2014\) года.
По горизонтали указываются числа месяца, по вертикали — цена тонны алюминия в долларах США. Для наглядности жирные точки на рисунке соединены линией.
Определите по рисунку, какого числа цена алюминия на момент закрытия торгов была наименьшей за данный период.
Ответ: \( \displaystyle 14\).
Гистограмма
Интервальные ряды данных изображают с помощью гистограммы.
Гистограмма представляет собой ступенчатую фигуру, составленную из сомкнутых прямоугольников. Основание каждого прямоугольника равно длине интервала, а высота – частоте или относительной частоте.
Таким образом, в гистограмме, в отличие от обычной столбчатой диаграммы, основания прямоугольника выбираются не произвольно, а строго определены длиной интервала.
Вот, к примеру, у нас есть следующие данные о росте игроков, вызванных в сборную:
Итак, нам дана частота (количество игроков с соответствующим ростом). Мы можем дополнить табличку, рассчитав относительную частоту:
Ну вот, теперь можем строить гистограммы. Сначала построим на основании частоты.
Вот, что получилось:
А теперь на основании данных об относительной частоте:
Пример.
На выставку по инновационным технологиям приехали представители \( \displaystyle 50\) компаний. На диаграмме показано распределение этих компаний по количеству персонала.
По горизонтали представлено количество сотрудников в компании, по вертикали — количество компаний, имеющих данное число сотрудников.
Какой процент составляют компании с общим числом сотрудников больше \( \displaystyle 50\) человек?
Ответ: \( \displaystyle 68\%\).
Бонус: Вебинары с нашего курса по подготовке к ЕГЭ
Этот вебинар по родственной математической статистике теме — теории вероятности.
ЕГЭ №4 Теория вероятности
Что вы узнаете на этом уроке?
80% урока — решение задач