Statistics and how to interpret them CIJ/OSI Investigative Journalism – Public Finance School April 2011 ЦЖР / ИОО Журналистские расследования - Общественная Школа Финансов, Баку, апреля 2011 Статистические модули Инструктор : Эд Суирс - Хеннесси
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Средняя величина или Среднее значение Среднее значение вычисляется путём суммирования значений и деления суммы на количество переменных. В задаче по математике на «множества», количество правильных ответов из 10 были: Значения : 3,4,5,5,4,10,4,10,4,6,4,7,10,3,10,5,4,6,10,5
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Средняя величина или Среднее значение Сумма 20 значений составляет 119 Среднее количество 119/20 = 5.95
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Мода ( Статистика ) Рассортируйте числа в группах, учитывая сколько людей собрали 3 балла, сколько 4 балла и т.д. Это называется распределение чисел. См. Excel пример
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Медиана (Статистика) Сортируйте значения от меньшего к большему. Подсчитайте количество значений. Если у вас нечетное число значений, медианой является среднее значение. Если число значений четное, медиана является средним числом от двух средних значений. See Excel examples
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Сумма Данные переменных потока и запаса Добавьте данные о запасах Будьте осторожны с данными потока – их можно добавить, но будьте осторожны с описанием.
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Население, 2010 Азербайджан 8,997,400 Грузия 4,436,400 Таджикистан 7,595,000 Украина 45,870,700 Всего 66,899,500
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Население, 2010 Процент населения который любит футбол Азербайджан 8,997, Грузия 4,436, Таджикистан 7,595, Украина 45,870, Всего 66,899,500Average 33.4
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Население, 2010 Процент населения который любит футбол Азербайджан 8,997, Грузия 4,436, Таджикистан 7,595, Украина 45,870, Всего 66,899,500 Среднее ( взвешенное ) 43.4
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Вероятность Количество между 0 и 1 0 = невозможное событие 1 = определенное событие 0,5 = событие которое может произойти и непроизойти
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Вероятность 0 = невозможное событие - все мы позавтракали сегодня в Лондоне 1 = определенное событие - все встали с постели сегодня 0,5 = событие может произойти, или не произойти - монета упала на одну из сторон
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Вероятность Несмещённые кости Все шесть сторон имеют равную вероятность выподания Вероятность = 1 / 6 = 0,1666
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Вероятность Отметим сумму вероятностей всех вариантов = 1
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Вероятность - возрастно- половая пирамида
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Вероятность - эксперименты типа да / нет ; биномиальное распределение
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Вероятность - Невероятные события; распределение Пуассона
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Вероятность - Нормальное распределение, например, для зарплаты на определенном уровне
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Интерпретация данных, полученных с помощью вопросника Не все люди отвечают Цена опроса высока – поэтому рассматриваются образцы опросов с малым количеством респондентов Различные образцы могут давать отличающиеся результаты Результатам присваивают меру надежности - доверительный интервал.
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Интерпретация данных, полученных с помощью вопросника Реальная стоимость X Выборочная оценка X X X X X X X X X X X X X X X X X X X X X
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Интерпретация данных, полученных с помощью вопросника Реальная стоимость X Выборочная оценка X X XX X X X X X
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Интерпретация данных, полученных с помощью вопросника Статистика это среднее арифметическое от всех наблюдений плюс-минус погрешность измерения Для 67% доверия к результату???, средний плюс или минус одно (1х) стандартное отклонение. Для 95% доверия к результату????, средний плюс или минус двукратное (2x) стандартное отклонение. Для 99% доверия к результату, средний плюс или минус трехкратное ( 3x) стандартное отклонение.
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Интерпретация данных, полученных с помощью вопросника Пример возраста
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Ошибки в данных Примените проверку смысла (sense check) Если вы не уверены, ищите альтернативные источники Существует ли показатель предыдущего года? Является ли изменения по годам допустимым? Правильно ли отображаются единицы измерения?
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Ошибки в данных Два примера, где данные не были проверены 1. Население Таджикистана не составляет 7595 млн. (это больше, чем населения земного шара!)
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Ошибки в данных Два примера, где данные не были проверены 1. Население Таджикистана не составляет 7,595,000,000 (это бол ьше, чем населения земного шара!) 2. Ошибка произошла из-за неправильного применения точки и запятой в дробях
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Ошибки в данных Два примера, где данные не были проверены 1. Население Таджикистана не составляет 7,595,000, Не так много людей нетрудоспособны.
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Доверительные интервалы - сравнение результатов ГодДоля курящего населения Доверительн ый интервал ± ± Совпаде ние Поэтому статистически не значительно отличается
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Индекс Используется для описания тенденций в экономике, в частности, в ценах и торговле Полезен для сравнения разрозненных рядов данных. Позволяет сравнивать перемены во времени относительно постоянной точки.
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Население четырех стран- числа
Статистические данные и как их интерпретировать ЦЖР / ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Население четырех стран- 2006=100