МЕТОД СКОЛЬЗЯЩЕГО КОНТРОЛЯ ДЛЯ ОЦЕНКИ КАЧЕСТВА РЕКОМЕНДАТЕЛЬНЫХ ИНТЕРНЕТ- СЕРВИСОВ А.Ю. Каминская, Р.А. Магизов Научный руководитель – Д.И. Игнатов Государственный.

Slides:



Advertisements
Similar presentations
О.О.Замков, Дж.Л.Локшин Тестирование как форма текущего и итогового контроля в учебном процессе МИЭФ ГУ-ВШЭ.
Advertisements

Астрометрические каталоги К.В.Куимов, ГАИШ МГУ. Определение астрометрического каталога Астрометрический каталог – понятие неопределённое. Например, это.
Работа выполнена учителем физики Паниной О. В. Руководитель:
Поиск оптимального набора параметров оптимизаций компилятора Брусенцов Леонид Евгеньевич студент 4 курса ФИТ НГУ Руководители:Илья.
Чибиняева Ольга 4 курс.  Сущность профессии финансового аналитика  Составляющие квалифицированного аналитика  Преимущества и недостатки профессии 
Разработка и внедрение объектно-ориентированной библиотеки для автоматизации тестирования Кафедра системного программирования Студент: Олейник А.Л. 544.
Дипломная работа Ивановой О.О., группа 545 Научный руководитель: д. ф.-м. н., профессор Терехов А.Н. Генерация кода по диаграмме активностей.
Система Антиплагиат.РГБ: результаты работы и новые возможности Десятая, юбилейная, международная научно-практическая конференция "ЭЛЕКТРОННЫЙ ВЕК КУЛЬТУРЫ"
Расторгуев А.C., 545 группа Научный руководитель: Пименов А.А. Рецензент: ст. преп. Смирнова Е.А.
Алгоритм приближённого join’а на потоках данных Выполнил : Юра Землянский, 445 группа Научный руководитель : Б.А. Новиков СПб, 2011 Санкт-Петербургский.
Санкт-Петербургский Государственный Университет Математико-механический факультет Кафедра системного программирования Научный руководитель: Б.А. Новиков.
Результаты итоговой аттестации учащихся 9-х классов в учебном году Учебные предметы Кол-во учащихся, сдавших предмет на итоговой аттестации.
Министерство Образования и Науки Республики Татарстан сентября 2010 г. г. Казань Всемирный банк Развитие школ Республики Татарстан в условиях.
Параметры эффективности рекламных кампаний Лицом к аудитории.
Тел. (495) Москва, а/я 212 Рабочая группа по реформе МВД Москва, 2010 Новикова Асмик, Фонд «Общественный вердикт»
Можно выделить два подхода, на основе которых производится выбор посредника: 1.Аналитический, предполагающий осуществление выбора с использованием формул,
Вэйвлетное разложение гладкого потока ненулевой высоты Выполнил : Суханов Василий Научный руководитель : Демьянович Ю. К. Рецензент : Лебединская Н. А.
Инструмент реинжиниринга спецификаций трансляций Константин Андреевич Улитин Научный руководитель: Я.А. Кириленко Рецензент: Н.М. Тимофеев Санкт-Петербургский.
Разработка информационной системы накопительной программы лояльности для мобильных устройств Автор: Дьяченко Василий Владимирович мат-мех, 545 группа Научный.
Некомпенсаторное агрегирование и рейтингование студентов Авторы: Гончаров Алексей Александрович, Чистяков Вячеслав Васильевич. НФ ГУ ВШЭ 2010 год.
Санкт - Петербургский Государственный Университет Математико - механический факультет Кафедра системного программирования Система проверки данных на полноту.
Курсовая работа студента 345 группы Чуновкина Фёдора Дмитриевича Научный руководитель: Бондарев А.В. Санкт-Петербургский Государственный Университет Математико-механический.
«АЛЬФА Системс» г. Пенза, ул. Гагарина, 16, офис 112 Как удобство сайта влияет на продажи? Удобство для покупателя - залог.
Bank ownership and lending behavior Alejandro Micco, Ugo Panizza Politicians and banks: Political influences on government-owned banks in emerging markets.
О ПЫТ ОРГАНИЗАЦИИ КОНТРОЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ СТУДЕНТОВ И КАЧЕСТВА ОБУЧЕНИЯ НА БАЗЕ ЦЕНТРА ДИСТАНЦИОННОГО ОБРАЗОВАНИЯ Ю ЖНОГО ФЕДЕРАЛЬНОГО УНИВЕРСИТЕТА.
Российский государственный педагогический университет им. А.И. Герцена ИНСТИТУТ ДОВУЗОВСКОЙ ПОДГОТОВКИ Дистанционное обучение «Русский язык. Подготовка.
Адаптивный метод распределения SPMD-заданий в грид Паньшенсков Михаил, 545 группа Научный руководитель: Лукичев А.С. Рецензент: Демьянович Ю.К июня.
Erstmedia, , Москва, ул. Профсоюзная, 93А, офис (495) , Стратегия и тактика крупного бренда.
1 Генерация контекстных ограничений для баз данных Выполнил: Жолудев В. Научный руководитель: Терехов А.Н. Рецензент: Иванов А.Н.
Аппаратное ускорение алгоритмов компьютерного зрения Стефан Бояровски, 361 группа Научный руководитель: Сергей П. Шувалкин.
Growing Neural Gas Method Нейросетевой метод построения неструктурированных адаптивных сеток.
Сравнение различных методов хранения XML в реляционных базах данных и в разных системах. Нгуен Тхань Хуен- 545 группа Руководитель : Б.А. Новиков Рецензент:
Determinants of bank interest margins in Russia: Does bank ownership matter? Zuzana Fungáčová and Tigran Poghosyan Горбачев Е., Мальцева Е., 317 группа.
Создание экспериментального стенда для оценки методов поиска изображений по содержанию Выполнила: Теплых М. А. Научный руководитель: Васильева Н. С. Рецензент:
Генерация вероятностных автоматов методами Reinforcement Learning Выполнил: Иринёв А. В. Руководитель: Шалыто А. А.
Оптимизация Just – in - time компилятора методом профилирования значений Соколов Андрей Владимирович, ФФ НГУ, 3 курс, Руководитель:
Конвертор байт-кода java в CIL Д. С. Возжаев, 544 группа Научный руководитель: д. т. н. проф. В. О. Сафонов Рецензент: асп. А. Н. Близнюк Санкт-Петербургский.
Распределение наборов неоднородных по размеру заданий в кластерных системах на основе ClassAd механизма Голубев Александр Юрьевич, 542 группа Научный руководитель:
Методы интерактивной визуализации динамики жидких и газообразных сред Елена Костикова, 521 гр.
Поиск путей в сложных полигонах для динамических систем реального времени. Работа Порошина И.А., 544 гр. Научный руководитель Уфнаровский В.В. Рецензент,
Воспроизведение лучших результатов ad hoc поиска семинара РОМИП Romip-base project Красильников Павел, Механико-математический факультет МГУ им. Ломоносова.
Тема: Сравнительный анализ сложности факторизации алгоритмов целых чисел Выполнила: Дубовицкая Н.В., гр 957 Научный руководитель: Ишмухаметов Ш.Т.
Применение метода представления функции переходов с помощью абстрактных конечных автоматов в генетическом программировании Царев Ф. Н. Научный руководитель.
Санкт-Петербургский Государственный Университет Математико-Механический факультет Кафедра системного программирования Применение диаграмм двоичных решений.
Рейтинги рекламных мест в различных сегментах Ольга Петрова Интернет-агентство TRAFFIC Конференция «Интернет-маркетинг 2009» 14 ноября.
Сервис описания дискретных динамических систем на основе рекуррентных алгоритмов стохастической аппроксимации и подобных им Александр Вахитов научный руководитель.
Применение генетических алгоритмов к генерации тестов для автоматных программ Законов Андрей Юрьевич Научный руководитель: Степанов Олег Георгиевич, к.т.н.,
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Математико-механический факультет Кафедра системного программирования Автоматизация выбора оптимальной.
ПРИМЕНЕНИЕ ИНФОРМАЦИОННЫХ СИСТЕМ НАВИГАЦИОННОГО ТИПА ДЛЯ ОБЕСПЕЧЕНИЯ ФУНКЦИОНИРОВАНИЯ ЦЕНТРОВ ТЕХНИЧЕСКОЙ ПОДДЕРЖКИ А. В. Беляков, Е. Б. Крейсманн Информационно-вычислительный.
Разработка алгоритмов распознавания текста
Стр 1 Март 2010 Разработка и проведение социальных программ На примере IV Всероссийского конкурса научно- инновационных проектов для старшеклассников «Технологии.
Бизнес-модель рынка электронных платежей Шаяхмедов Тимур Научный руководитель – д.т.н. С.В.Мальцева Государственный университет – Высшая школа экономики.
Методы интерактивной визуализации динамики жидких и газообразных сред Костикова Елена Юрьевна, 521 гр. Научный руководитель: Игнатенко Алексей Викторович.
Бернар Люке генеральный директор Высшая школа экономики Москва – 11 декабря 2007.
9 октября 2004 Поиск статических изображений по содержанию: использование текстового запроса Наталья Васильева
Проверка эквивалентности срединной и линейной осей многоугольника Дипломная работа студента 545 группы Подколзина Максима Валериевича Санкт-Петербургский.
X n + y n = z n c n log n - 2 k ≤ p(n, k) ≤ c n log n - 1 k Arageli: Blazing Mathematics Mini–project Report ITLab, 24 Feb, 2006.
Алгоритм исправления ошибок при анализе в парсерах типа перенос-свертка, основанный на предположении об избыточности языка Дипломная работа студента 545.
Московский инженерно-физический институт (государственный университет) НЕЙТРОННО-ФИЗИЧЕСКИЕ ХАРАКТЕРИСТИКИ ТЯЖЕЛОВОДНОГО РЕАКТОРА С РЕГУЛИРУЕМЫМ СПЕКТРОМ.
Сравнение подходов к индексированию XML документов c поддержкой некоторых операций модификации Выполнил: Василий Шикин, 545 группа Руководитель: Дмитрий.
Инициативный проект Российского семинара по оценке методов информационного поиска (РОМИП)
«Система дистанционного обучения Competentum.Magister Plus»
Классификация, кластеризация и поиск изображений на основе низкоуровневых характеристик Наталья Васильева Руководитель: Новиков Б. А.
Исследование возможностей сервисной шины SonicMQ Дипломная работа студентки 545 группы Комольцевой Дарьи Владимировны Научный руководитель: Графеева Н.Г.
Поддержка избыточного кодирования. Оптимизация, настройка и аппробация выбранного алгоритма под поставленную задачу. Оценка полученных результатов Мальчевский.
ОЦЕНКА РАДИАЦИОННОГО РЕСУРСА КОРПУСОВ РЕАКТОРОВ ВВЭР-440 В УСЛОВИЯХ ВНЕДРЕНИЯ МОДЕРНИЗИРОВАННОГО ЯДЕРНОГО ТОПЛИВА. Адеев В.А., Бурлов С.В., Панов А.Е.
Автор в фокусе «Научное издание международного уровня : повышение качества и расширение присутствия в мировых информационных ресурсах» Москва, 21.
X AXIS LOWER LIMIT UPPER LIMIT CHART TOP Y AXIS LIMIT Обзор рекламного рынка безрецептурных лекарственных препаратов в СМИ Лилия Владимирова Руководитель.
СОСТАВЛЕНИЕ ОПТИМАЛЬНОГО ПЛАНА ПРОДАЖ НА ПРИМЕРЕ МНОГОКВАРТИРНОГО ДОМА ЖДАНОВА МАРИЯ 4 КУРС, НИУ ВШЭ СПБ, СПБШЭМ, ДЕПАРТАМЕНТ ЭКОНОМИКИ ГРУППА « АНАЛИТИЧЕСКАЯ.
Опыт подготовки программистов в нижегородском институте информационных технологий (НИИТ) Кащеев Николай Иванович директор НИИТ.
Presentation transcript:

МЕТОД СКОЛЬЗЯЩЕГО КОНТРОЛЯ ДЛЯ ОЦЕНКИ КАЧЕСТВА РЕКОМЕНДАТЕЛЬНЫХ ИНТЕРНЕТ- СЕРВИСОВ А.Ю. Каминская, Р.А. Магизов Научный руководитель – Д.И. Игнатов Государственный университет – Высшая школа экономики, Москва, Россия 2010

Содержание Постановка задачи Мотивация Примеры моделей рекомендательных систем – User-based RS – Item-based RS Выбор меры (метрики) сходства Методика сравнения Данные MovieLens и Yahoo Результаты Выводы и дальнейшая работа

Постановка задачи Зная предпочтения конкретного пользователя и остальных, выдать ему релевантную рекомендацию Оценка (проверка) качества рекомендаций

Мотивация Существует огромное количество РС Требуются эффективные алгоритмы – Время выполнения – Качество рекомендаций Количество ошибок и полнота рекомендаций

User-based RS целевой пользователь - предметы, которые он оценивал - сходство с пользователем - top-n ближайших к нему соседей, n определяет - пользователи из, которые оценили предмет i - оценка предмета i пользователем u предсказанная системой оценка для целевого пользователя:

Item-based RS целевой пользователь - предметы, которые он оценивал - сходство товара i с товаром j - top-n ближайших к нему товаров, top-n определяет - для - оценка предмета i пользователем u предсказанная системой оценка для целевого пользователя:

Пример User-based RS Пользователь Сходство «Мастер и Маргарита» ВО «Мастер и Маргарита» «Преступление и наказание» ВО Преступление и наказание» Рей Бредбери. Рассказы. ВО Рей Бредбери. Рассказы. Е. Гришковец. «Планета» ВО «Планета» V.M SKY ×0.5= OLA ×0.5= GRY ×0.94= IDI ×0.87=2.61.5

Выбор меры (метрики) сходства Сходство, основанное на расстоянии: – Евклида – Хемминга Корреляция как сходство: – коэффициент Пирсона Косинусная мера Коэффициент Жаккара

Корреляция Пирсона Недостатки – не определена на векторах с постоянными значениями: (4,4,4,...,4) – теряются рекомендации a=(0,5,5,4) b=(0,4,5,0)

Методика сравнения Метрики качества: точность и полнота рекомендаций Скользящий контроль (кросс-валидация)

Точность и полнота Полнота – число релевантных рекомендаций к числу всех выбранных пользователем товаров Точность – число релевантных к числу всех рекомендаций

Скользящий контроль Разбиение на тестовую и обучающую выборки: Сокрытие признаков для тестирования рекомендаций: Вычисление точности и полноты для на признаках :

Точность и полнота: раскрытие неопределенностей else

Алгоритм Параметры: – test% - размер тестового множества – hidden% - размер скрытого множества признаков – p – число повторений разбиения на тестовое и обучающее множество – q – число повторений разбиения на оцененное и неоцененное множества признаков Выход:средние значения точности и полноты по множеству U test и I hidden

Данные MovieLens и Yahoo MovieLens 100K dataset: – 943 пользователя – 1,682 фильма – Каждый оценил как минимум 20 фильмов, всего 100,000 оценок Yahoo binary dataset: – 2,000 фирм – 3,000 рекламных словосочетаний – 92,345 ненулевых ячеек

Результаты

Выводы и дальнейшая работа Предложенная методика позволяет оценить качество работы рекомендательной системы вне зависимости от выбора метода По-видимому, впервые в экспериментах исследуется точность и полнота в зависимости от количества скрытых признаков Для сравнения методов необходимо проведение аналогичных экспериментов для более совершенных моделей РС, например, основанных на бикластеризации

Спасибо за внимание!