Постредактирование машинного перевода. 2 Содержание 1. Место МП в переводческом процессе 2. Экспресс-оценка применимости МП 3. Улучшение качества МП 4.

Slides:



Advertisements
Similar presentations
Выпускная квалификационная работа на тему: «Применение интернет-технологий как фактор повышения эффективности функционирования организации (на примере.
Advertisements

О.О.Замков, Дж.Л.Локшин Тестирование как форма текущего и итогового контроля в учебном процессе МИЭФ ГУ-ВШЭ.
Схема распределения грантов городам-участникам программы Тасис (TCAS) Экологические гранты для муниципалитетов.
Поиск оптимального набора параметров оптимизаций компилятора Брусенцов Леонид Евгеньевич студент 4 курса ФИТ НГУ Руководители:Илья.
Глава 1 Принципы экономики 4. Кривая производственных возможностей.
ИНСПЕКЦИЯ ПО ОХРАНЕ ОКРУЖАЮЩЕЙ СРЕДЫ Министерство по охране окружающей среды и природных ресурсов Грузии Обеспечение выполнения природоохранных требований.
Чибиняева Ольга 4 курс.  Сущность профессии финансового аналитика  Составляющие квалифицированного аналитика  Преимущества и недостатки профессии 
Разработка и внедрение объектно-ориентированной библиотеки для автоматизации тестирования Кафедра системного программирования Студент: Олейник А.Л. 544.
Долбешкин Андрей Николаевич, 345 группа Руководитель: кандидат ф.-м.н. Вячеслав Алексеевич Кириллин.
Дипломная работа Ивановой О.О., группа 545 Научный руководитель: д. ф.-м. н., профессор Терехов А.Н. Генерация кода по диаграмме активностей.
Система Антиплагиат.РГБ: результаты работы и новые возможности Десятая, юбилейная, международная научно-практическая конференция "ЭЛЕКТРОННЫЙ ВЕК КУЛЬТУРЫ"
Системы отбора. Условные обозначения (1) (2) (3) (4) (5) (6) (7) Математическое моделирование процессов отбора2.
Автоматизированная поддержка пользовательской документации Web-приложений, разрабатываемых в среде WebRatio Студент: Дорохов Вадим, 544 гр. Научный руководитель:
Алгоритм приближённого join’а на потоках данных Выполнил : Юра Землянский, 445 группа Научный руководитель : Б.А. Новиков СПб, 2011 Санкт-Петербургский.
ООО «Баркод Маркет».  Инвентаризация имущества – программная система, позволяющая организовать учет любого имущества компании.  Уменьшение неконтролируемых.
Министерство Образования и Науки Республики Татарстан сентября 2010 г. г. Казань Всемирный банк Развитие школ Республики Татарстан в условиях.
Тел. (495) Москва, а/я 212 Рабочая группа по реформе МВД Москва, 2010 Новикова Асмик, Фонд «Общественный вердикт»
Некомпенсаторное агрегирование и рейтингование студентов Авторы: Гончаров Алексей Александрович, Чистяков Вячеслав Васильевич. НФ ГУ ВШЭ 2010 год.
Услуги КА «Personnel Group» Наши преимущества Сферы бизнеса Взаимодействие с Заказчиком Технологии поиска кандидатов Гарантии и сроки выполнения заказа.
ПРОФИЛЬ КОМПАНИИ SAP. ©2010 SAP AG. Все права защищены. / Стр. ‹#› ШТАТ КОМПАНИИ SAP НАСЧИТЫВАЕТ СЕГОДНЯ СОТРУДНИКОВ ПО ВСЕМУ МИРУ.
«АЛЬФА Системс» г. Пенза, ул. Гагарина, 16, офис 112 Как удобство сайта влияет на продажи? Удобство для покупателя - залог.
Bank ownership and lending behavior Alejandro Micco, Ugo Panizza Politicians and banks: Political influences on government-owned banks in emerging markets.
1 Современный набор сервисов для клиентов-алготрейдеров: продукты, услуги Конференция «Роботы в биржевой торговле» Секция «Алготрейдинг глазами брокера»
Определение необходимого уровня запасов на складе.
О ПЫТ ОРГАНИЗАЦИИ КОНТРОЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ СТУДЕНТОВ И КАЧЕСТВА ОБУЧЕНИЯ НА БАЗЕ ЦЕНТРА ДИСТАНЦИОННОГО ОБРАЗОВАНИЯ Ю ЖНОГО ФЕДЕРАЛЬНОГО УНИВЕРСИТЕТА.
Русский Марш История «Русского марша» Организован в связи с объявлением в 2005 году «Дня народного единства», 4 ноября, национальным праздником.
Российский государственный педагогический университет им. А.И. Герцена ИНСТИТУТ ДОВУЗОВСКОЙ ПОДГОТОВКИ Дистанционное обучение «Русский язык. Подготовка.
© 2011 PM Expert Имя Фамилия. 2 © 2011 PM Expert Текст 1  Текст 2 Текст 3 Основные сведения о проекте Дайте краткую информацию о компании, для которой.
Translator Widget for Android Сергей Василинец, 345 группа Научный руководитель COO SPB Software Василий Филиппов.
Erstmedia, , Москва, ул. Профсоюзная, 93А, офис (495) , Стратегия и тактика крупного бренда.
Оценка эффективности инвестиционных проектов. Показатели эффективности инвестиций. Критерии принятия инвестиционных решений.
Работа выполнена в рамках проекта "Информационные технологии в управлении образованием" 1С: ХроноГраф 2.5 Последовательность создания в программе «1С:
Гибридная технология перевода Юлия Епифанцева PROMT.
Инструменты AdWords Анна Минчук cертифицированный консультант по Google AdWords.
Понятие риска применительно к инвестиционным проектам
Разработка интеллектуальной многоагентной системы адаптивных роботов для игры в футбол Выполнили: А. А. Коробкин, 545 гр Г. М. Комаров, 544 гр Научный.
Сравнение различных методов хранения XML в реляционных базах данных и в разных системах. Нгуен Тхань Хуен- 545 группа Руководитель : Б.А. Новиков Рецензент:
EDCWiki Electronic Document Circulation using wiki Система электронного документооборота на основе wiki Участники: Кузьмин Константин, Цыцулин Виталий.
Approximation of EU and RF technical regulation, standardisation and certification systems A project funded by the European Union 1 Экономическое влияние.
Разработка программного обеспечения (Software Engineering) Ian Sommervillle Часть 6. Оценка стоимости программного продукта.
Текстовый процессор Word. Возможности программы Word 1. Работа с текстами: ввод текста; редактирование текста; форматирование текста (изменение параметров.
Нахождение ориджинов в последовательности нуклеотидов Выполнил: Ромашкин Амир, 445 гр. Руководитель: Профессор АФТУ, Порозов Юрий.
ICAO Training Workshop Moscow, Применение EATMP Common Core Content в процессе разработки учебных курсов: опыт Латвии Учебный центр АНС, Латвия.
Распределение патентов по тематике «Контроль за воздушным пространством» и МПК = G01S1 или G01S5 и набором ключевых слов (+air+ or +navigat+ or +space+)
Решения Autodesk в нефтегазовой отрасли Наталья Тамеева Директор по работе с корпоративными заказчиками на территории СНГ.
Анализ и Проектирование качественных приложений Презентация по книге Крэга Лармана.
Зарубежные издания В вашей библиотеке ™ SERVICE BY.
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Математико-механический факультет Кафедра системного программирования Автоматизация выбора оптимальной.
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «Курский государственный университет» кафедра психологии Влияние международного.
ИЗУЧЕНИЕ ПОЧВЕННОГО ОРГАНИЧЕСКОГО ВЕЩЕСТВА МЕТОДАМИ ЭЛЕКТРОФОРЕЗА И ХРОМАТОГРАФИИ ВЫСОКОГО ДАВЛЕНИЯ Матыченков В.В. *, Бочарникова Е.А. ** *Институт фундаментальных.
Разработка алгоритмов распознавания текста
Предметно-ориентированное моделирование приложений для платформы Android Никонова Ольга СПбГУ Научный руководитель Брыксин Т.А.
Заместитель начальника Управления Д.В. Милютин Критерии согласования ФСТ России перехода на метод доходности инвестированного капитала Нахабино
МЕТОД СКОЛЬЗЯЩЕГО КОНТРОЛЯ ДЛЯ ОЦЕНКИ КАЧЕСТВА РЕКОМЕНДАТЕЛЬНЫХ ИНТЕРНЕТ- СЕРВИСОВ А.Ю. Каминская, Р.А. Магизов Научный руководитель – Д.И. Игнатов Государственный.
«Опыт МИСиС по привлечению внебюджетных источников финансирования. Оценка возможности эндаумент-фондов в их увеличении» Н.В. Третьяк, первый проректор.
Проверка эквивалентности срединной и линейной осей многоугольника Дипломная работа студента 545 группы Подколзина Максима Валериевича Санкт-Петербургский.
SCAD OFFICE. Об устойчивости равновесия железобетонных конструкций.
TMG Tel: 8 (495) Fax: 8 (477) Technology Management Group ООО «TMG» PayKeeper.
___________________________ Грязнов В.Б. Директор по Информационным технологиям ОАО «Мосэнерго»
Времена года в немецком языке Die Jahreszeit in der Deutschesprache Времена года в немецком языке Die Jahreszeit in der Deutschesprache Выполнили: Драгунов.
Инициативный проект Российского семинара по оценке методов информационного поиска (РОМИП)
Захватывающее предложение по организации игры «Мафия» для event-агентств наши клиенты: тел.: сайт: (495)
ТЕНДЕНЦИИ КАТЕГОРИИ «СНЕКИ» Товарная категория «снеки» для нашей страны довольно новое явление, особенно по сравнению с западными странами. Тем не менее,
Султанмуратова Альбия Салбаевна учитель английского языка МБОУ «СОШ№29»
Простые рецепты продвижения электронных баз данных в университете Простые рецепты продвижения электронных баз данных в университете Мария Сергеевна Лаврова.
SDL TRADOS 2006 Сокращение затрат и удвоение производительности: лингвистические технологии на основе баз данных от ведущей компании.
Компания ПРОМТ представляет: Интегрированные решения компаний TRADOS и ПРОМТ - залог успешного бизнеса Елена Косматова Менеджер по работе с корпоративными.
SonarQube Система непрерывного анализа и измерения качества кода.
Экотуризм, связанный с посещением лесных ландшафтов Выполнил: студент гр.35ЭиП156В Казак Т.В. ТюмГУ, 2017.
Presentation transcript:

Постредактирование машинного перевода

2 Содержание 1. Место МП в переводческом процессе 2. Экспресс-оценка применимости МП 3. Улучшение качества МП 4. Стратегии постредактирования МП 5. Оценка эффективности интеграции МП

3 Место МП в переводческом процессе Классическая схема: Источник –> переводчик –> реципиент Схема с МП: Источник –> МП –> переводчик –> реципиент Эффекты от изменения схемы: 1.Фокус работы переводчика смещается с перевода на редактирование. 2.В отличие от типичного процесса с живым переводчиком и редактором, здесь имеем дело с механизированной письменной речью (робот).

4 Место МП в переводческом процессе Особенности работы с роботом-переводчиком Преимущества 1.Возможность настройки 2.Предсказуемость поведения 3.Отсутствие ошибок из-за человеческого фактора Недостатки 1.Требует навыков и умения в обращении 2.Требует понимания алгоритмов работы 3.Вероятность трудноисправимых ошибок разработчиков

5 Место МП в переводческом процессе Первые впечатления от машинного перевода аналогичны реакции редактора на неидеальный перевод: 1.Все плохо, выкинуть и переписать 2.Вот здесь грубейшая ошибка и тут просто смешно 3.А вот тут сообразил, молодец… Готовый перевод = сумма работы МП и переводчика, при этом работа переводчика не равна нулю. Ключевой фактор для качественного и эффективного редактирования – степень доверия автору редактируемого текста.

6 Содержание 1. Место МП в переводческом процессе 2. Экспресс-оценка применимости МП 3. Улучшение качества МП 4. Стратегии постредактирования МП 5. Оценка эффективности интеграции МП

7 Экспресс-оценка применимости МП Подход к оценке: Акцент на удобство редактирования МП Базовые сведения о технологии Доступная функциональность с точки зрения организации процесса перевода Применимость МП к текстам определенного типа Возможности для повышения степени доверия к МП

8 Экспресс-оценка применимости МП Критерии для оценки МП: Эквивалентность по числу компонентов предложения и эквивалентность перевода по каждому компоненту Исходный текст: Being a leading group in the field, we are seeking for best methods Машинный перевод: Будучи одной из ведущих в этой области, мы ищем наиболее эффективные методы Пропущенные составляющие: group Неэквивалентный перевод: best

9 Экспресс-оценка применимости МП Критерии для оценки МП: Знание предметной области Исходный текст: Drilling mud is pumped down the pipe to cool the bit Машинный перевод: Буровой раствор закачивается вниз по трубе для охлаждения бита Неэквивалентный перевод для предметной области: bit

10 Экспресс-оценка применимости МП Критерии для оценки МП Устойчивость соблюдения терминологии Исходный текст: The document contains a heading with the heading data inserted by the system. Машинный перевод: Документ содержит заголовок с возглавляющими данными, вставленными системой. Несоблюдение терминологии: heading

11 Экспресс-оценка применимости МП Критерии для оценки МП Связность: слова-связки, служебные части речи, окончания Исходный текст: The level set by the user is incorrect. Машинный перевод: Уровня, установленного пользователем является неверным. Ошибки в связности: падеж слова «уровень» и зависимых от него, пропущенная запятая после «пользователем»

12 Экспресс-оценка применимости МП Выводы по оценке МП

13 Содержание 1. Место МП в переводческом процессе 2. Экспресс-оценка применимости МП 3. Улучшение качества МП 4. Стратегии постредактирования МП 5. Оценка эффективности интеграции МП

14 Улучшение качества МП Настройка МП – отдельный этап перед началом процесса перевода, который имеет смысл при: 1)большом объеме однородных текстов, 2)жестких требованиях к терминологии и стилю, 3)работе в команде переводчиков, 4)крайне сжатых сроках.

15 Улучшение качества МП Основные шаги 1.Определение тематики подлежащего переводу текста и подбор подходящих (специализированных) словарей. 2.Получение списка наиболее частых терминов-оборотов в переводимых текстах, определение их переводных эквивалентов и занесение в словарь. 3.Получение списка наиболее часто встречающихся слов и проверка их текущего перевода системой МП. 4.Установка требуемых правил перевода.

16 Улучшение качества МП Результаты: Повышение оценки применимости МП по вышеперечисленным критериям, в частности: выдерживание терминологии и предметной области. = > Снижение объема редактирования МП переводчиком: за счет настройки предметной области – с 80 % до 50 %, за счет настройки терминологии – с 50 % до 30 %. = > Повышение общего качества готового перевода.

17 Содержание 1. Место МП в переводческом процессе 2. Экспресс-оценка применимости МП 3. Улучшение качества МП 4. Стратегии постредактирования МП 5. Оценка эффективности интеграции МП

18 Стратегии постредактирования МП Полное редактирование с проверкой каждого компонента текста по исходному фрагменту Исходный текст: To this end, final analysis results are not quite obvious. Машинный перевод: С этой целью окончательные результаты анализа не совсем очевидны. Перевод переводчика: Заключение, полученное в результате анализа, не дало окончательного ответа на этот вопрос. (При этом в глоссарии: analysis results = результаты анализа) Объем постредактирования предложения: 100 %

19 Стратегии постредактирования МП Использование МП исключительно в качестве подсказки по терминологии Исходный текст: To this end, final analysis results are not quite obvious. Машинный перевод: С этой целью окончательные результаты анализа не совсем очевидны. Перевод переводчика: Окончательные результаты анализа, тем не менее, не дали ответа на этот вопрос. (При этом в глоссарии: analysis results = результаты анализа) Объем постредактирования предложения: 82 %

20 Стратегии постредактирования МП Использование МП в качестве грамматического подстрочника с подбором синонимичных выражений Исходный текст: SWIFT also brings the financial community together to work collaboratively to shape market practice and define standards Машинный перевод: SWIFT также примиряет финансовое сообщество для работы совместно, чтобы сформировать практику рынка и определить стандарты Перевод переводчика: SWIFT также объединяет финансовое сообщество для совместной работы в целях формирования рыночной практики и определения стандартов Объем постредактирования предложения: 65 %

21 Стратегии постредактирования МП Чтение МП и исправление вызывающих сомнения мест с обращением к исходному тексту Исходный текст: Distributor may not take legal action against any infringer without SDA's prior written consent. Машинный перевод: Дистрибьютор может не подать в суд против никакого нарушителя без предварительного письменного согласия SDA. Перевод переводчика: Дистрибьютор не имеет права подавать в суд на какого-либо нарушителя без предварительного письменного согласия SDA Объем постредактирования предложения: 34 %

22 Стратегии постредактирования МП Чтение МП и исправление очевидных погрешностей без обращения к исходному тексту Исходный текст: Our study focuses on emergent visual rhetorical practices that can inspire advertisers. Машинный перевод: Наше исследование сосредотачивается на визуальных риторических методах на стадии становления, которые могут вдохновить рекламодателей. Перевод переводчика: Наше исследование сосредотачивается на визуальных риторических приемах, находящихся на стадии становления, которые могут вдохновить рекламодателей. Объем постредактирования предложения: 14 %

23 Стратегии постредактирования МП Сводная таблица по стратегиям редактирования

24 Стратегии постредактирования МП Основные критерии для выбора стратегии редактирования: знание предметной области степень владения исходным и целевым языком сроки и предполагаемый объем постредактирования опыт работы с данной системой МП степень доверия машинному переводу наличие технических средств для анализа внутренней структуры МП

25 Содержание 1. Место МП в переводческом процессе 2. Экспресс-оценка применимости МП 3. Улучшение качества МП 4. Стратегии постредактирования МП 5. Оценка эффективности интеграции МП

26 Оценка эффективности интеграции МП Основные эффекты от интеграции: 1)Увеличение скорости работы переводчика 2)Снижение объема работы при редактировании переводов, полученных от команды переводчиков 3)Повышение качества готового перевода Дополнительные затраты на интеграцию: 1)Техническое и организационное внедрение, обучение 2)Настройка МП по проекту Влияющие факторы: 1)Квалификация переводчиков 2)Удобство технической инфраструктуры

27 Оценка эффективности интеграции МП Пример статистики по проекту: Перевод: – 66 страниц – с английского на русский – каталог продукции Статистика ТМ: 19 % совпадений Участники: 2 переводчика, редактор Система МП: PROMT 9.5

28 Оценка эффективности интеграции МП Пример статистики по проекту: Этап предварительной настройки МП: – Количество строк в частотном списке – 305 – Количество терминов, занесенных в словарь, – 110 – Время настройки – 1:14 На 3 страницы текста приходится 5 терминов, заносимых в словарь. Скорость настройки: около 200 строк частотного списка в час, ИЛИ около 78 терминов в час, ИЛИ около 47 страниц в час

29 Оценка эффективности интеграции МП Пример статистики по проекту: Этап постредактирования МП переводчиками: в режиме фриланс – 26 страниц/сутки при почасовом контроле времени – 6 страниц/час Этап редактирования текстов, полученных от переводчиков: средний объем исправлений – 5 % скорость редактирования – 16,5 страниц/час

30 Оценка эффективности интеграции МП Пример статистики по проекту: Итого на 66 страниц: Настройка МП = 1,4 ч. Перевод = 11 ч. Редактирование = 4 ч. = 16,4 ч.

31 Спасибо за внимание! Ирина Малышева Руководитель проекта, PROMT