Методы анализа данных. Статистическая проверка гипотез.

Slides:



Advertisements
Similar presentations
ЗАРЯДКА НА АНГЛИЙСКОМ ЯЗЫКЕ.  Зарядка на уроке английского языка может стать самым любимым и веселым занятием для детей, при том, что она проходит исключительно.
Advertisements

Астрометрические каталоги К.В.Куимов, ГАИШ МГУ. Определение астрометрического каталога Астрометрический каталог – понятие неопределённое. Например, это.
Работа выполнена учителем физики Паниной О. В. Руководитель:
Схема распределения грантов городам-участникам программы Тасис (TCAS) Экологические гранты для муниципалитетов.
Модель «Точно вовремя». Понятие «функционального цикла» (ФЦ), или «цикла исполнения заказа», является основным объектом интегрированной логистики. Функциональным.
1. ИССЛЕДОВАНИЯ РЕЗОНАНСНОГО РАССЕЯНИЯ НЕЙТРОНОВ ЯДРАМИ В ОБРАТНОЙ ГЕОМЕТРИИ. 2. ИЗМЕРЕНИЕ ДЛИНЫ n-n-РАССЕЯНИЯ. 3. ИЗМЕРЕНИЕ ГРАВИТАЦИОННОЙ МАССЫ НЕЙТРОНА.
по следам популяции серых китов
Системы с наследованием. Если систему можно представить в виде : Где - непрерывные функции, то такая система называется системой с наследованием. Математическое.
Системы отбора. Условные обозначения (1) (2) (3) (4) (5) (6) (7) Математическое моделирование процессов отбора2.
Елена Станиславовна Петрова Учитель-логопед высшей категории ГДОУ детский сад №47 комбинированного вида Фрунзенского района г. Санкт-Петербурга 2011 год.
R1R2R3R4R5R6R7R1R2R3R4R5R6R7. Аксиома R 1. В пространстве существуют плоскости. В каждой плоскости пространства выполняются все аксиомы планиметрии.
Тел. (495) Москва, а/я 212 Рабочая группа по реформе МВД Москва, 2010 Новикова Асмик, Фонд «Общественный вердикт»
Можно выделить два подхода, на основе которых производится выбор посредника: 1.Аналитический, предполагающий осуществление выбора с использованием формул,
Проблема оптимальности в биологии волновала исследователей со времен Ламарка. Гипотеза Ч. Дарвина предполагала, что среди видов можно определить “наиболее.
Рекламные технологии будущего уже здесь Как доказать соответствие Dentsu Way российскому рынку. Dentsu Group Russia Москва, Декабрь
Некомпенсаторное агрегирование и рейтингование студентов Авторы: Гончаров Алексей Александрович, Чистяков Вячеслав Васильевич. НФ ГУ ВШЭ 2010 год.
Вид продук ции А i, ед. Затраты на выполнение заказа, руб. Затраты на хранение C xi, руб./ед.год S i, ед. NiNi T i,дн. руб. СoСo СiСi , ,5445.
Неотрицательное решение задачи Коши. Нередко постановка задачи требует чтобы фазовые переменные принимали лишь неотрицательные значения. Так, в физических.
Математические модели Динамические системы. “Модели” Математическое моделирование процессов отбора2.
Bank ownership and lending behavior Alejandro Micco, Ugo Panizza Politicians and banks: Political influences on government-owned banks in emerging markets.
Определение необходимого уровня запасов на складе.
АВДАШЕВА СВЕТЛАНА КАФЕДРА ЭКОНОМИЧЕСКОГО АНАЛИЗА ОРГАНИЗАЦИЙ И РЫНКОВ 2011/2012 УЧЕБНЫЙ ГОД Теория отраслевых рынков (по выбору для 3 курса факультета.
Учитель математики Кулакова Т.М. МОУ ООШ №15 г.о Новокуйбышевск Самарской области Сентябрь 2011г.
Преподаватель: Арутюнова Е. В. (ст.преп.) Выполнила: студентка 1 курс ФЖ Манаенкова Елена Москва, 2010.
Сохранение суммы фазовых координат. Важный частный случай представляют системы, в которых в течение всего процесса сохраняется постоянной сумма значений.
Приложение 3.1. (3.30) (П3.1.-1) (П3.1.-2) (П3.1.-3) (П3.1.-4) (3.31)
Обзор последних достижений биометрических методов аутентификации РусКрипто 2005.
Частное равновесие на конкурентном рынке Частное равновесие: последствия государственного регулирования конкурентного рынка Распределение налогового бремени.
To the Solution of a Bilinear Optimal Control Problem with State Constrains by the Doubled-Variations Method E.A. Rovenskaya Lomonosov Moscow State University,
Оценка эффективности инвестиционных проектов. Показатели эффективности инвестиций. Критерии принятия инвестиционных решений.
Монополия - 2  Налоговое регулирование монополии  Ценовая дискриминация I типа  Ценовая дискриминация III типа.
Введение в параллельные вычисления. Технология программирования MPI (день третий) Антонов Александр Сергеевич, к.ф.-м.н., н.с. лаборатории Параллельных.
Основы цифровой обработки речевых сигналов. Общая схема процесса речеобразования x[n] – дискретные отсчеты сигнала возбуждения y[n] – дискретные отсчеты.
Понятие риска применительно к инвестиционным проектам
Применение методов прогнозирования в логистике Моисеевой О. Макушиной Д.
Сравнение различных методов хранения XML в реляционных базах данных и в разных системах. Нгуен Тхань Хуен- 545 группа Руководитель : Б.А. Новиков Рецензент:
1 Ребенок в Сети. Ребенок играет?
PHP как язык программирования. Типы данных логические величины int, integer – целые числа real, double, float – вещественные числа string – строки array.
Почему, на Ваш взгляд, в роли рационирующего субъекта как правило выступает коллективный орган?
Формантный синтезатор речи. Часть 1. Полюсы и нули – иное понимание Полюс – это пара чисел (B, F), B – ширина форманты, F – частота форманты Нуль – это.
Анализ сценариев. Имитационное моделирование. 2 Метод сценариев метод, основанный на построении набора сценариев - возможных непротиворечивых комбинаций.
Оптимизация Just – in - time компилятора методом профилирования значений Соколов Андрей Владимирович, ФФ НГУ, 3 курс, Руководитель:
Statistics and how to interpret them CIJ/OSI Investigative Journalism – Public Finance School April 2011 ЦЖР / ИОО Журналистские расследования - Общественная.
Применение генетического программирования для генерации автомата в задаче об «Умном муравье» Царев Ф.Н., Шалыто А.А. IV Международная научно-практическая.
Методы интерактивной визуализации динамики жидких и газообразных сред Елена Костикова, 521 гр.
Методы анализа данных.
Санкт-Петербургский Государственный Университет Математико-Механический факультет Кафедра системного программирования Применение диаграмм двоичных решений.
Кураева Екатерина Анатольевна, заместитель директора по УВР, учитель математики сш № 29.
Моделирование будущего с помощью Динамического Финансового Анализа
Дискретная математика Алгебра логики
Нейросетевая аппроксимация плотности вероятности и вычисления в Байесовых сетях Сергей А. Терехов NeurOK, LLC © 2002, NeurOK, LLC.
Математическая модель движения автономного робота Руководитель: Рубцов И. В. Докладчик: Мартышин С. В. Цель работы: прогнозирование эксплуатационных характеристик.
БЫКОВ A.A. Проф., д-р физ.-мат. Наук, главный редактор журнала «Проблемы анализа риска» Приложения асимптотической теории вероятностей экстремальных значений.
ВВЕДЕНИЕ В ВЫЧИСЛИТЕЛЬНУЮ МАТЕМАТИКУ Лекция 5 6 октября 2009 ВЫЧИСЛИТЕЛЬНАЯ ЛИНЕЙНАЯ АЛГЕБРА.
ОСНОВЫ ТЕХНИЧЕСКОЙ ЭКСПЛУАТАЦИИ ПОДВИЖНОГО СОСТАВА
1 Кинетика ферментативного катализа. 2 «Кинетика – дисциплина таинственная и могущественная …» –Д.Кошланд мл. «Хорошо разбираясь в основах ферментативной.
 Функция общественного благосостояния: (1.7) Здесь все γ i >0  Бюджетное ограничение общества выглядит как: (1.8)  Общественная целевая функция: (1.9)
Олигополия - 1  Модель Курно:  классическая формулировка: сравнение с монополизированной и конкурентной отраслью  модель Курно с большим числом фирм.
Анализ и оптимизация плана работ и стоимости проекта.
Модели одностороннего риска в анализе доходности собственного капитала Подготовила: Шутова Е. С. Научный руководитель: Профессор, д.э.н. Теплова Т.В.
Классификация, кластеризация и поиск изображений на основе низкоуровневых характеристик Наталья Васильева Руководитель: Новиков Б. А.
Обработка исключений в C# Единая техника обнаружения ошибок времени выполнения и передачи информации о них.
1 R E F R I G E R A T I O N A N D A I R C O N D I T I O N I N G Как обновить программное обеспечение в AK-SC 255.
Board Games. KnowWant to knowLearnt jigsawpuzzle adominoesyrw cfeukoloased hdscrabbleja eetashiefyjr sfmarblesaet sokbilliards ybackgammonu.
Saint Petersburg, 2011 Java Lecture Generics. Quiz ArrayList lst = new ArrayList(); Collection c = lst; lst.add("one"); lst.add(“two"); lst.add(“three");
Рассмотрим более подробно работу управляющей компоненты. В ЭС используются нетрадиционные методы управления. Это вызвано неформализованностью решаемых.
Past Continuous Tense. Прошедшее длительное время.
Jokes Jokes Jokes Teacher: Where's your text book? Student: At home. Teacher: What's it doing there? Student: Having a.
Сортировка, поиск и фильтрация данных в базе данных и выборках
Presentation transcript:

Методы анализа данных

Статистическая проверка гипотез

 Общая схема проверки гипотез.  Проверка гипотез:  о математическом ожидании;  о дисперсиях;  о равенстве математических ожиданий;  о выявлении аномальных измерений;  об однородности ряда дисперсий;  о согласованности выбранного закона распределения и гистограммы.

Общая схема проверки гипотез Х – случайная величина. Н 1, Н 2 – гипотезы. f( x |Н 1 ), f( x |Н 2 ) – условные плотности Решающее правило: если x c, то верна гипотеза Н 2, где с – порог. Условные вероятности ошибочных решений: α – вероятность принять Н 2, в то время как верна Н 1 ; β – вероятность принять Н 1, в то время как верна Н 2. c G 1 G 2 fxH(|) 1 fxH(|) 2 x  

Общая схема проверки гипотез Произведем сжатие этой информации: z=z(x 1,…,x n ). Здесь z (·) – известная функция. 2  fzH(|) 1 c 2 c 1 p z 2  Исследователя интересуют не две гипотезы, а одна: H 1 =H. При этом известна только плотность распределения f( z |H). Два варианта для конкурирующей гипотезы: 1)H 2 =H, в конкурирующую гипотезу вводятся все остальные возможности. 2)H 2 =часть H, в гипотезу вводится дополнительное ограничение.

Считаем, что случайная величина X распределена по нормальному закону N(m, σ 2 ) с неизвестным математическим ожиданием m и известной дисперсией σ 2. По независимой выборке x 1,…,x n проверить гипотезы: H 1 :m=m 0 H 2 :m≠m 0 Вводим статистику: Порог с находим из условия P{z>c}=α/2 Значение порога с можно взять из специальных таблиц. Гипотеза H 1 верна, если |z|<c Проверка гипотезы о математическом ожидании fzH(|)  c c 0 z 2  2 

1.2. Проверка гипотезы о математическом ожидании Условия те же, но дисперсия σ 2 неизвестна. Вводим статистику: Если верна гипотеза H 1, то величина z имеет распределение Стьюдента T n-1 (0;1) с n-1 степенями свободы. Значение порога с можно взять из специальных таблиц. Гипотеза H 1 верна, если |z|<c.

Случайная величина X распределена по нормальному закону N(m, σ 2 ) с неизвестным математическим ожиданием m и неизвестной дисперсией σ 2. По независимой выборке x 1,…,x n проверить гипотезы: H 1 : σ 2 =σ 0 2 H 2 : σ 2 ≠σ 0 2 Вводим статистику (хи-квадрат): Если,то принимается H 1. Значения порогов χ 2 берутся из специальных таблиц Проверка гипотезы о дисперсиях 2  )|( 2 1 Hf n   2 1  2 2  p 2  2  0

2.2. Проверка гипотезы о дисперсиях Рассмотрим случай, когда имеем две случайные величины X и Y, распределенные по нормальным законам: N(m 1, σ 1 2 ) и N(m 2, σ 2 2 ). m 1, m 2 и σ 1 2, σ 2 2 – неизвестны. По независимым выборкам: x 1,…,x n1 и y 1,…,y n2 проверить гипотезы: H 1 : σ 1 2 =σ 2 2 H 2 : σ 1 2 >σ 2 2 Вводим статистику: (статистика Фишера). В числитель ставится наибольшая из оценок. Если z <c, то принимаем H 1. Значение порога с берется из специальных таблиц.

Случайные величины X и Y, распределенные по нормальным законам: N(m 1, σ 1 2 ) и N(m 2, σ 2 2 ). m 1, m 2 – неизвестны, а σ 1 2, σ 2 2 – известны. По независимым выборкам: x 1,…,x n1 и y 1,…,y n2 проверить гипотезы: H 1 : m 1 =m 2 H 2 : m 1 ≠m 2 Вводим статистику: Если |z|<c, то принимаем H Проверка гипотезы о равенстве математических ожиданий

3.2. Проверка гипотезы о равенстве математических ожиданий Условия те же, а дисперсии одинаковы σ 1 2 =σ 2 2 =σ 2 и неизвестны. Вводим статистику: Если гипотеза H 1 верна, то z имеет распределение Стьюдента. Пороги находим как в задаче 1.2.

4. Выявление аномальных измерений Случайная величина X распределена по нормальному закону N(m, σ 2 ) с неизвестным математическим ожиданием m и известной дисперсией σ 2. Имеется выборка: x 1,…,x n и x – новое измерение. Проверить гипотезы: H 1 : x принадлежит X. H 2 : x не принадлежит X ( x – аномальное измерение). Вводим статистику: Пороги и решающее правило как для задачи 1.1.

Выявление аномальных измерений Условия те же, но дисперсия σ 2 неизвестна. Статистика имеет вид: При истинности гипотезы H 1, z имеет распределение Стьюдента. Пороги и решающее правило как для задачи 1.2.

5. Гипотеза об однородности ряда дисперсий Имеем несколько случайных величин X 1,…,X k, распределенных по нормальному закону N(m 1, σ 1 2 ),…, N(m k, σ k 2 ). Все параметры законов неизвестны. Для каждой случайной величины имеется выборка одинакового объема n. Проверить гипотезы: H 1 : σ 1 2 =…=σ k 2 H 2 : σ i 2 ≠σ j 2 ; i,j=1…k; i≠j Вводим статистику: ( статистика Кочрена ) Порог с выбирается по таблице. H 1 верна, если z<c.

6. Проверка гипотезы о распределениях X – непрерывная случайная величина, закон распределения не известен. По независимой выборке x 1,…,x n строится гистограмма, экспертно выбирается закон распределения X: f( x | Θ ) и проверяются гипотезы: H 1 : f( x | Θ ) согласуется с гистограммой. H 2 : f( x | Θ ) не согласуется с гистограммой. Вводим статистику: Порог находим по таблице. Если z< χ 2, то принимается H 1. В дальнейшем можно использовать f( x | Θ ) в качестве оценки истинной неизвестной плотности.