Профили экспрессии (паттерны) различаются у нормальных и раковых клеток или при различных типах рака. Излечимые и неизлечимые виды лейкозов дают разные.

Slides:



Advertisements
Similar presentations
Microarray Normalization
Advertisements

Zhongxue Chen, Monnie McGee, Qingzhong Liu and Richard Scheuermann
Астрометрические каталоги К.В.Куимов, ГАИШ МГУ. Определение астрометрического каталога Астрометрический каталог – понятие неопределённое. Например, это.
1. ИССЛЕДОВАНИЯ РЕЗОНАНСНОГО РАССЕЯНИЯ НЕЙТРОНОВ ЯДРАМИ В ОБРАТНОЙ ГЕОМЕТРИИ. 2. ИЗМЕРЕНИЕ ДЛИНЫ n-n-РАССЕЯНИЯ. 3. ИЗМЕРЕНИЕ ГРАВИТАЦИОННОЙ МАССЫ НЕЙТРОНА.
Системы с наследованием. Если систему можно представить в виде : Где - непрерывные функции, то такая система называется системой с наследованием. Математическое.
Расторгуев А.C., 545 группа Научный руководитель: Пименов А.А. Рецензент: ст. преп. Смирнова Е.А.
Системы отбора. Условные обозначения (1) (2) (3) (4) (5) (6) (7) Математическое моделирование процессов отбора2.
Алгоритм приближённого join’а на потоках данных Выполнил : Юра Землянский, 445 группа Научный руководитель : Б.А. Новиков СПб, 2011 Санкт-Петербургский.
Елена Станиславовна Петрова Учитель-логопед высшей категории ГДОУ детский сад №47 комбинированного вида Фрунзенского района г. Санкт-Петербурга 2011 год.
Я б строителем пошел. Пусть меня научат. МГУ Дворец Культуры г. Вичуга Фабрика им. Ногина г. Вичуга.
R1R2R3R4R5R6R7R1R2R3R4R5R6R7. Аксиома R 1. В пространстве существуют плоскости. В каждой плоскости пространства выполняются все аксиомы планиметрии.
с использованием многокритериальных оценок
Можно выделить два подхода, на основе которых производится выбор посредника: 1.Аналитический, предполагающий осуществление выбора с использованием формул,
Некомпенсаторное агрегирование и рейтингование студентов Авторы: Гончаров Алексей Александрович, Чистяков Вячеслав Васильевич. НФ ГУ ВШЭ 2010 год.
ПРИНЦИПЫ РАЗРАБОТКИ СИСТЕМЫ КЛАССА LEARNING MANAGEMENT SYSTEM И ОПЫТ ЕЕ ИСПОЛЬЗОВАНИЯ НА ФАКУЛЬТЕТЕ МЕНЕДЖМЕНТА Афанасьева С.В. Кафедра бизнес-информатики.
Неотрицательное решение задачи Коши. Нередко постановка задачи требует чтобы фазовые переменные принимали лишь неотрицательные значения. Так, в физических.
Всевоволод Головизнин, MVC – паттерн проектирование, в котором бизнес - логика, управляющая логика и интерфейс разделены на три отдельных компонента.
Работу выполнила Иванова Анастасия 9 «В».  Гро́мкость зву́ка — субъективное восприятие силы звука (абс олютная величина слухового ощущения). Громкость.
Bank ownership and lending behavior Alejandro Micco, Ugo Panizza Politicians and banks: Political influences on government-owned banks in emerging markets.
Определение необходимого уровня запасов на складе.
Учитель математики Кулакова Т.М. МОУ ООШ №15 г.о Новокуйбышевск Самарской области Сентябрь 2011г.
Сохранение суммы фазовых координат. Важный частный случай представляют системы, в которых в течение всего процесса сохраняется постоянной сумма значений.
Что за хулиган толкает пассажиров автобуса то вперед, то назад? Этот хулиган, вернее, хулиганка -
Микрочип (биочип) = DNA-microarray array I [a'reI] n
Частное равновесие на конкурентном рынке Частное равновесие: последствия государственного регулирования конкурентного рынка Распределение налогового бремени.
ООП Классы – 2. Ссылки Ссылка – еще одно имя объекта. Используйте ссылки вместо указателя. Это более безопасно. Complex c(10,10); Complex c2& = c; c2+=10;
Getting the numbers comparable
Блок 3. Семейства белков I. Множественное выравнивание Первый курс, весна 2008, А.Б.Рахманинова.
Генетика пола, сцепленное с полом наследование.. Мужские и женские особи отличаются наличием половых хромосом. У человека: Женский пол – гомогаметен,
1 Генерация контекстных ограничений для баз данных Выполнил: Жолудев В. Научный руководитель: Терехов А.Н. Рецензент: Иванов А.Н.
Основы цифровой обработки речевых сигналов. Общая схема процесса речеобразования x[n] – дискретные отсчеты сигнала возбуждения y[n] – дискретные отсчеты.
Понятие риска применительно к инвестиционным проектам
Growing Neural Gas Method Нейросетевой метод построения неструктурированных адаптивных сеток.
Сравнение различных методов хранения XML в реляционных базах данных и в разных системах. Нгуен Тхань Хуен- 545 группа Руководитель : Б.А. Новиков Рецензент:
 Нужно много различных протоколов связи  Каждый из них может реализовываться на разных платформах Современные сети Много устройств, компьютеров и сетей.
"The European Molecular Biology Open Software Suite"
Формантный синтезатор речи. Часть 1. Полюсы и нули – иное понимание Полюс – это пара чисел (B, F), B – ширина форманты, F – частота форманты Нуль – это.
Анализ сценариев. Имитационное моделирование. 2 Метод сценариев метод, основанный на построении набора сценариев - возможных непротиворечивых комбинаций.
Statistics and how to interpret them CIJ/OSI Investigative Journalism – Public Finance School April 2011 ЦЖР / ИОО Журналистские расследования - Общественная.
Автор: Новитская О.В.. Об авторе: Н Новитская Ольга Владимировна Студентка Кемеровского Государственного Университета физического факультета 4 курса группы.
Что можно делать с одиночной последовательностью ДНК? Как исключить векторные фланки? Рестрикционная карта Вашей последовательности Дизайн праймеров Анализ.
Нахождение ориджинов в последовательности нуклеотидов Выполнил: Ромашкин Амир, 445 гр. Руководитель: Профессор АФТУ, Порозов Юрий.
GCB/CIS 535 Microarray Topics John Tobias November 3 rd, 2004.
Кураева Екатерина Анатольевна, заместитель директора по УВР, учитель математики сш № 29.
Методы анализа данных. Статистическая проверка гипотез.
Формализованы ли цели? Устраивает ли вас команда? Каковы этапы процесса? Изменение ИТ структуры? Нужны подрядчики? 1.
ВВЕДЕНИЕ В ВЫЧИСЛИТЕЛЬНУЮ МАТЕМАТИКУ Лекция 5 6 октября 2009 ВЫЧИСЛИТЕЛЬНАЯ ЛИНЕЙНАЯ АЛГЕБРА.
 Функция общественного благосостояния: (1.7) Здесь все γ i >0  Бюджетное ограничение общества выглядит как: (1.8)  Общественная целевая функция: (1.9)
9 октября 2004 Поиск статических изображений по содержанию: использование текстового запроса Наталья Васильева
Хобби-мастерская рисунки на асфальте Подготовили: Коваленко Денис и Кульбарисова Саша.
Множественное выравнивание С.А.Спирин, весна
Учитель Антонова О.Я. Учитель Антонова О.Я. Зерноградская поликлиника.
Классификация, кластеризация и поиск изображений на основе низкоуровневых характеристик Наталья Васильева Руководитель: Новиков Б. А.
Обработка исключений в C# Единая техника обнаружения ошибок времени выполнения и передачи информации о них.
GeneChips and Microarray Expression Data
Probe-Level Data Normalisation: RMA and GC-RMA Sam Robson Images courtesy of Neil Ward, European Application Engineer, Agilent Technologies.
Summarization of Oligonucleotide Expression Arrays BIOS Winter 2010.
Применение графического метода для решения различных математических задач Учитель гимназии №3 Шахова Т. А.
Oigonucleotide (Affyx) Array Basics Joseph Nevins Holly Dressman Mike West Duke University.
‘For and Against’ Essays Useful tips. Plan Introduction - Paragraph 1 (state topic – summary of the topic without giving your opinion) Main Body – Paragraph.
Jokes Jokes Jokes Teacher: Where's your text book? Student: At home. Teacher: What's it doing there? Student: Having a.
Подготовила студентка 1 курса, группы БЭСО-02-17, Власова Софья.
KEY CONCEPT Entire genomes are sequenced, studied, and compared.
KEY CONCEPT Entire genomes are sequenced, studied, and compared.
Решение типовых расчетных задач по формулам. Определение массовой доли элементов Массовая доля элемента ω(Э) % - это отношение массы данного элемента.
KEY CONCEPT Entire genomes are sequenced, studied, and compared.
KEY CONCEPT Entire genomes are sequenced, studied, and compared.
* Любой табак кроме WTO Депозит берется в течение 20 мин, как подошли все гости* В депозит входят все позиции в меню* Депозит не возвращается*
10 интересных фактов о Японии и Японцах. В состав Японии входит островов. При этом четыре наиболее крупных из них - Кюсю, Хонсю, Хоккайдо и Сикоку,
Presentation transcript:

Профили экспрессии (паттерны) различаются у нормальных и раковых клеток или при различных типах рака. Излечимые и неизлечимые виды лейкозов дают разные паттерны. По виду паттернов можно с большой вероятностью предсказать течение болезни на самой ранней стадии.

Конструкция чипа Affymetrix PM = perfect match MM = mismatch

Этапы обработки для чипов Affymetrix (фирма Affymetrix) 1.Привязка к сетке (gridding) 2.Вычисление значений интенсивности зондов 3. Поправка на глобальный фон 4. Поправка на неспецифическую гибридизацию 5. Вычисление устойчивого среднего логарифмов поправленных значений в зондах. 6. Масштабирование сигналов чтобы подрезанное среднее имело фиксированное значение

Проблемы первоначального подхода: 1. MM>PM (60-85% генов, где это выполняется хотя бы для одного зонда) Решения А) Заплатка Affymetrix: идеальный mismatch Б) А MM вообще не нужен. Вероятностная поправка на фон в методе RMA. В) Нет, все-таки будем использовать MM, но с учетом теоретически вычисленного сродства данной олигонуклеотидной последовательности. GC-RMA

Проблемы первоначального подхода: 2. Эффект зонда – вариация интенсивности одного гена, померянная разными зондами не случайна. Модель Ли-Вонга. E g – истинная экспрессия гена g, f i – чувствительность i-ой пары PM-MM. PM gi –MM gi =f i E g + Шум Произвольное требование, необходимое для идентификации (f 1 2 +…+f k 2 )/k =1

Визуальная проверка на присутствие нелинейной зависимости от интенсивности. М-А график. M g =log(I g (1)/I g (2)) A g =(1/2)log(I g (1)*I g (2)) A M0M0

Проблемы первоначального подхода: 3. Нелинейная зависимость от интенсивности. M g =log(I g (1)/I g (2)) A g =(1/2)log(I g (1)*I g (2))

Линейная регрессия 1 MIN a,b ((y 1 -(a+bx 1 )) 2 +(y 2 -(a+bx 2 )) 2 +…+(y k -(a+bx k )) 2 ) y = a+bx

Часто бывает полезно выбрать в качестве начальной точки отсчета средние значения измеряемых величин. Малиновой и желтой точкой показаны величины стандартного отклонения х и у. Линейная регрессия 2

Здесь в качестве единиц измерения выбраны среднеквадратичные отклонения для х и у. Тогда уравнение прямой, лучше всего приближающей наше облако точек имеет очень простой вид: y= R*x R – коэффициент корреляции х и у. При нашем выборе единиц измерения и начал отсчета R=(x 1 y 1 +x 2 y 2 +…+x n y n )/n Линейная регрессия 3 R=0.0995, y= 0.995x

Локально-линейная регрессия (loess)

МА график после нормализации M n =M – M loess (A)

Квантильная нормализация

МА графики для различных иголок принтера кДНК микрочип

Поиск генов с одинаковым уровнем экспрессии в разных образцах 1.Housekeeping гены К сожалению, не все housekeeping гены имеют посстоянный уровень экспрессии. Примеры:  актин, GAPDH, 2. Гены инвариантного ранга 3. Контрольные гены Контроли гибридизации bioB, bioC, bioD и creГены E. coli и б/ф P1, биотинилированные сRNA транскрипты которых вводят в смесь для гибридизации в разных концентрациях (1,5, 5, 25, 100 pM для bioB, bioC, bioD и cre, соотв.). BioB – на пороге чувствительности (1:100000).

Возможная последовательность этапов обработки для чипов Affymetrix 1 Вычисление “сырых” значений интенсивности зондов (Affymetrix MicroArray Suit) 2. Поправка на глобальный фон (Affymetrix MAS5) 3. Loess нормализация на уровне зондов (и PM и MM зонды) 4. Вычисление модельного индекса экспрессии (Ли и Вонг, dChip) 6. Квантильная нормализация индексов экспрессии

Чего с чем нормализуем? 1.И квантильная и лоесс нормализация применяется к паре чипов. Для нормализации совокупности чипов чаще всего выбирают (строят) базовый чип и нормализуют все к нему. а) Базовый чип – это реально существующий чип, нравящийся автору. б) Базовый чип конструируется. Как правило, это чип, где значение каждого гена равно медиане множества значений этого гена по всем чипам, которые хочется нормализовать. 2. Для квантильной нормализации можно сводить распределение каждого чипа к множеству средних квантилей или к множеству квантилей распределения, построенного по всем чипам сразу. 3. Для лоесс нормализации существует алгоритм “циклический лоесс”.

Что может измерить ДНК чип Choe et al. Genome Biology 2005, 6:R генов на чипе генов на чипе

Что может измерить ДНК-чип? А) Choe et al. Genome Biology 2005, 6:R16 Насколько хорошо ДНК чип выясняет, какие вообще гены экспрессированы? очень плохо на уровне пары зондов – из зондов, прошедших через порог, 10% принадлежат отсутствующим генам, а остальные включают только 60% присутствующих генов Лучше на уровне генов – из генов, прошедших через порог, 10% принадлежат отсутствующим генам, а остальные включают 85% присутствующих генов.

Что может измерить ДНК-чип? А) Choe et al. Genome Biology 2005, 6:R16 Насколько хорошо ДНК чип выясняет, какие гены дифференциально экспрессированы? Плохо, если считать, что дифференциально экспрессированные означает увеличившиеся более чем на 20% (из 1309 генов 380 не находятся (29%), а ошибочно находятся 105(10% от всех найденных). На самом деле ни один из генов, увеличивших экспрессию на 20% не был найден, и лишь половина изменившихся на 50% была найдена. Хорошо, если рассматривать лишь гены, изменившие экспрессию более чем на 100% (не находится лишь 7% от так изменившихся при 10% ошибочно найденных )

Возможно ли сравнение результатов различных экспериментов? В работе Multiple Lab Comparison of Microarray Platforms, Rafael A. Irizarry et al., 2004 рассматриваются результаты измерения одних и тех же образцов разными лабораториями на разных платформах. Эффект лаборатории очень велик и превосходит эффект платформы. Заметим, что эффект нормализации, особенно такой, где все образцы нормализуются к одному экспериментальному образцу, уменьшая вариабельность результатов отдельного эксперимента, затрудняет сравнивание различных экспериментов.

Литература Exploration and analysis of DNA microarray and protein array data. D. Amaratunga, J. Cabrera, Wiley Statistical analysis of gene expression microarray data. Edited by T. Speed. Chapman and Hall, Statistics for microarrays. E. Wit, J. McClure, Wiley, 2004 Analyzing microarray gene expressing data. G. McLachlan, Kim-Anh Do, C. Ambroise, Wiley, 2004 Bioinformatics and computational biology solutions using R and Bioconductor. R. Gentleman, V. Carey, W. Huber, R. Irizzary, S. Dudoit, Springer, 2005.