Гибридная технология перевода Юлия Епифанцева PROMT.

Slides:



Advertisements
Similar presentations
Выпускная квалификационная работа на тему: «Применение интернет-технологий как фактор повышения эффективности функционирования организации (на примере.
Advertisements

Школьный Округ Филадельфии Привлечение Семей и Общины Отдел Устного и Письменного перевода Представляет Вебсайт на Русском Языке.
Астрометрические каталоги К.В.Куимов, ГАИШ МГУ. Определение астрометрического каталога Астрометрический каталог – понятие неопределённое. Например, это.
Linguistic tools Лекция 5. ПОИСКОВЫЕ СИСТЕМЫ: предыстория Библейские индексы и конкордансы 1247 – Hugo de St. Caro – было задействовано 500 монахов для.
Почта: телефон: 8 (044) Система автоматизации гостиничного бизнеса Мой отель.
Поиск оптимального набора параметров оптимизаций компилятора Брусенцов Леонид Евгеньевич студент 4 курса ФИТ НГУ Руководители:Илья.
Автоматическая генерация кода программ с явным выделением состояний Канжелев С.Ю. магистрант СПбГУ ИТМО Шалыто А.А. доктор технических наук профессор СПбГУ.
Системы отбора. Условные обозначения (1) (2) (3) (4) (5) (6) (7) Математическое моделирование процессов отбора2.
ООО «Баркод Маркет».  Инвентаризация имущества – программная система, позволяющая организовать учет любого имущества компании.  Уменьшение неконтролируемых.
Можно выделить два подхода, на основе которых производится выбор посредника: 1.Аналитический, предполагающий осуществление выбора с использованием формул,
Влажность воздуха Урок физики 8 класс.
Некомпенсаторное агрегирование и рейтингование студентов Авторы: Гончаров Алексей Александрович, Чистяков Вячеслав Васильевич. НФ ГУ ВШЭ 2010 год.
ПРИНЦИПЫ РАЗРАБОТКИ СИСТЕМЫ КЛАССА LEARNING MANAGEMENT SYSTEM И ОПЫТ ЕЕ ИСПОЛЬЗОВАНИЯ НА ФАКУЛЬТЕТЕ МЕНЕДЖМЕНТА Афанасьева С.В. Кафедра бизнес-информатики.
Bank ownership and lending behavior Alejandro Micco, Ugo Panizza Politicians and banks: Political influences on government-owned banks in emerging markets.
Совместное использование пакета Microsoft Office Excel 2007 и служб интеллектуального анализа данных SQL Server Analysis Services Афанасьева С.В.
Учитель математики Кулакова Т.М. МОУ ООШ №15 г.о Новокуйбышевск Самарской области Сентябрь 2011г.
Российский государственный педагогический университет им. А.И. Герцена ИНСТИТУТ ДОВУЗОВСКОЙ ПОДГОТОВКИ Дистанционное обучение «Русский язык. Подготовка.
Создание сервиса синхронизации разнородных баз данных Допущена к защите зав. кафедрой: д.ф.м.н., профессор Терехов А.Н. Научный руководитель: доцент Графеева.
Обзор последних достижений биометрических методов аутентификации РусКрипто 2005.
1 СПбГУ ИТМО, кафедра Компьютерных Технологий ПРИМЕНЕНИЕ АВТОМАТНОГО ПРОГРАММИРОВАНИЯ ДЛЯ ПОСТРОЕНИЯ СИСТЕМ УПРАВЛЕНИЯ БИЗНЕС- ПРОЦЕССАМИ Евгений Андреевич.
Translator Widget for Android Сергей Василинец, 345 группа Научный руководитель COO SPB Software Василий Филиппов.
Блок 3. Семейства белков I. Множественное выравнивание Первый курс, весна 2008, А.Б.Рахманинова.
Разработка программного обеспечения (Software Engineering) Часть 2. Создание ПО.
1 Генерация контекстных ограничений для баз данных Выполнил: Жолудев В. Научный руководитель: Терехов А.Н. Рецензент: Иванов А.Н.
Основы цифровой обработки речевых сигналов. Общая схема процесса речеобразования x[n] – дискретные отсчеты сигнала возбуждения y[n] – дискретные отсчеты.
Понятие риска применительно к инвестиционным проектам
Growing Neural Gas Method Нейросетевой метод построения неструктурированных адаптивных сеток.
Магистерская программа двойных дипломов. Эта программа даёт вам возможность получить два диплома учебных заведений Великобритании и России: Диплом магистра.
Сравнение различных методов хранения XML в реляционных базах данных и в разных системах. Нгуен Тхань Хуен- 545 группа Руководитель : Б.А. Новиков Рецензент:
1 Ребенок в Сети. Ребенок играет?
PHP как язык программирования. Типы данных логические величины int, integer – целые числа real, double, float – вещественные числа string – строки array.
EDCWiki Electronic Document Circulation using wiki Система электронного документооборота на основе wiki Участники: Кузьмин Константин, Цыцулин Виталий.
Создание экспериментального стенда для оценки методов поиска изображений по содержанию Выполнила: Теплых М. А. Научный руководитель: Васильева Н. С. Рецензент:
Почему, на Ваш взгляд, в роли рационирующего субъекта как правило выступает коллективный орган?
Формантный синтезатор речи. Часть 1. Полюсы и нули – иное понимание Полюс – это пара чисел (B, F), B – ширина форманты, F – частота форманты Нуль – это.
Верификация автоматных программ Ремизов А.О., д.т.н., проф. Шалыто А.А.
ЭКОНОМИЯ В ШКОЛЕ ЭКОНОМИКИ: ПРАГМАТИЧНЫЙ ВЗГЛЯД НА ЭЛЕКТРОННЫЕ РЕСУРСЫ В БИБЛИОТЕКЕ ГУ-ВШЭ Владимир Писляков нач. отдела информационных систем и электронных.
Воспроизведение лучших результатов ad hoc поиска семинара РОМИП Romip-base project Красильников Павел, Механико-математический факультет МГУ им. Ломоносова.
Увеличение модульности программного обеспечения на языке Java Курсовая работа студента 345 группы Абишева Тимура Маратовича Научный руководитель: Профессор.
Swiss-Prot – одна из первых баз данных белковых последовательностей, “gold standard” белковой аннотации. Аннотация выполнена вручную группой профессиональных.
Анализ и Проектирование качественных приложений Презентация по книге Крэга Лармана.
Зарубежные издания В вашей библиотеке ™ SERVICE BY.
Постредактирование машинного перевода. 2 Содержание 1. Место МП в переводческом процессе 2. Экспресс-оценка применимости МП 3. Улучшение качества МП 4.
Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа us/um/people/cmbishop/prml/
BioUML интегрированная расширяемая среда для моделирования биологических систем Biosoft.Ru Лабоработория Биоинформатики КТИ ВТ СО РАН
Разработка алгоритмов распознавания текста
Объектно-ориентированное проектирование DSP-систем в телекоммуникациях Подготовил: Сергеев Виктор Николаевич СПбГУ, математико-механический Факультет,
Демидов А.В г. Операционные системы Лекция 4 Работа с файлами.
Геоинформационные системы Чернышов Алексей Акимович.
9 октября 2004 Поиск статических изображений по содержанию: использование текстового запроса Наталья Васильева
LINGUISTIC TOOLS ЛИНГВИСТИЧЕСКИЕ ИНСТРУМЕНТЫ Лекция 1.
TMG Tel: 8 (495) Fax: 8 (477) Technology Management Group ООО «TMG» PayKeeper.
Времена года в немецком языке Die Jahreszeit in der Deutschesprache Времена года в немецком языке Die Jahreszeit in der Deutschesprache Выполнили: Драгунов.
«Система дистанционного обучения Competentum.Magister Plus»
Классификация, кластеризация и поиск изображений на основе низкоуровневых характеристик Наталья Васильева Руководитель: Новиков Б. А.
XML Схемы XML документов. XML Schema созданая Microsoft позволяет избавиться от DTD блоков. Основа – использование пространств имен и очень точная типизация.
«Отгадай символы Рождества»
Microsoft TechDayshttp:// Александр Шаповал Эксперт по стратегическим технологиям
R E F R I G E R A T I O N A N D A I R C O N D I T I O N I N G Блок мониторинга и централизованного управления АK-SM 350.
1 R E F R I G E R A T I O N A N D A I R C O N D I T I O N I N G Как обновить программное обеспечение в AK-SC 255.
КРУПНЕЙШАЯ ТЕХНИЧЕСКАЯ КОНФЕРЕНЦИЯ MICROSOFT В УКРАИНЕ Metro приложения: работа с данными Краковецкий Александр, MVP/RD/PhD. DevRain Solutions.
28 сентября 2010 года Реализация Стратегии сотрудничества государств-участников СНГ в сфере информатизации Министерство информационных технологий и связи.
Кобзева Е. А. УРПЦГ «УРАЛГЕОИНФОРМ», Екатеринбург Опыт использования космических снимков SPOT для создания и обновления топографических карт средних масштабов.
Захватывающее предложение по организации игры «Мафия» для event-агентств наши клиенты: тел.: сайт: (495)
Дисциплина «Компьютерная (автоматическая) обработка текстов»
Простые рецепты продвижения электронных баз данных в университете Простые рецепты продвижения электронных баз данных в университете Мария Сергеевна Лаврова.
SDL TRADOS 2006 Сокращение затрат и удвоение производительности: лингвистические технологии на основе баз данных от ведущей компании.
Общая характеристика семейства Семейство Крестоцветные включает около 4 тысяч видов. По-другому семейство Крестоцветные называют семейством Капустные.
Обучение говорению как виду речевой деятельности на иностранном языке Галак София III курс (Английский и восточные языки)
* Любой табак кроме WTO Депозит берется в течение 20 мин, как подошли все гости* В депозит входят все позиции в меню* Депозит не возвращается*
Presentation transcript:

Гибридная технология перевода Юлия Епифанцева PROMT

Машинный перевод Машинный (автоматический) перевод – процесс перевода текстов с одного е стественного языка на другой с помощью к омпьютерной программы

Основные типы систем МП Rule-based машинный перевод (RBMT) – перевод, основанный на правилах. Статистический машинный перевод (SMT).  Гибридные системы перевода (HMT)

Типы RBMT Системы по типу Transfer предложение на языке входа => морфологический, грамматический, семантический анализ => преобразование в структуру выходного языка (TRANSFER) => синтез выходного предложения по полученной структуре=> предложение на языке выхода Системы по типу Interlingua предложение на языке входа => анализ входного предложения в терминах метаязыка => синтез из метаструктуры предложения выходного языка => предложение на языке выхода Разработка метаязыка = языконезависимое представление, наличие знаний о мире (онтологии, логики предикатов)

Компоненты RBMT на примере PROMT Лингвистические базы данных - двуязычные словари - файлы имен, транслитерации - морфологические таблицы Модуль перевода - грамматические правила - алгоритмы перевода

Двуязычные словари имеют трехуровневую структуру для настройки системы на различные предметные области: Генеральный словарь (от 50 до 250 тысяч статей) Специализированные словари (от 5 до 100 тысяч статей; охватывают различные тематики: бизнес, спорт, IT, добыча нефти и газа, металлургия...) Пользовательские словари (вспомогательные, открыты для редактирования пользователю)

Словарная статья (1) Слово или выражение на входном языке Коллекция переводов (активных и неактивных) Структурированное описание различной лингвистической информации (морфологической, синтаксической, семантической) в виде набора признаков и модификаторов

Словарная статья (2)

Словарная статья (3) Словарная настройка на примере ‘chest’ КонтекстПеревод This is a chestЭто грудь (комод) There is a tattoo on his chest На его груди есть татуировка At the time of the chest examination the blood pressure may be taken Во время обследования грудной клетки может быть измерено давление The University Chest is a term used at Oxford in connection with the financial aspects of the university and its administration Университетский фонд – термин, использованный в Оксфорде в связи с финансовыми аспектами университета и его администрации The oak chest with iron lockКомод из дуба с железным замком

Уровни анализа предложения (1) Препроцессор Нормализация текста ( удаление повторяющихся пробелов... ) Токенизация входной цепочки ( поиск входных словоформ в словаре с сопутствующим морфологическим анализом ) Лексический анализ ( контекстный анализ, различные склейки: имена, номера телефонов, даты...) Снятие омонимии ( определение частей речи в случаях грамматической неоднозначности ) Уровень сбора групп ( соединение лексических единиц в группы ) Анализ сложных предложений ( выделение простых в составе сложного, синтаксическая омонимия ) Семантико-синтаксический разбор ( заполнение глагольного фрейма ) Синтез ( синтез по полученной структуре, расстановка элементов внутри группы и групп в предложении... )

Уровни анализа предложения (2) French restaurants and bars, Mr. Felise notes, are getting more popular in the USA.

Уровни анализа предложения (3)

Преимущества и недостатки RBMT Преимущества - синтаксическая и морфологическая точность, - стабильность и предсказуемость результата, - возможность настройки на предметную область. Недостатки - трудоемкость и длительность разработки, - необходимость поддерживать и актуализировать лингвистические БД, - «машинный акцент» при переводе.

Статистический машинный перевод (1) История Принципы SMT разработаны еще в 1949 г. Уорреном Уивером «Вторая волна» – начало 1990-х, IBM «Третья волна» – Google, Microsoft, Language Weaver, Яндекс и десятки других Статистический МП – это поиск наиболее вероятного перевода предложения с использованием данных, полученных из параллельных корпусов.

Статистический машинный перевод (2) Сегодня SMT – наиболее активно разрабатываемая архитектура MT. Почему? – Легко построить, если есть двуязычный корпус, ноль / минимум лингвистики – Переносимость технологии на любые пары языков – Лексическая гладкость Ограничения / недостатки: – Ограниченность параллельных корпусов в природе и их real-life качество – Плохо справляется с морфологией / синтаксисом (по сравнению с RBMT) – Искажение информации (дублирование, пропуск или подмена информации) USA is to blame = США не виноват Russia is to blame = Россия виновата

Выводы Обе технологии имеют свои достоинства и недостатки, но главное – они не решили задачу по получению качественного машинного перевода. МТ-сообщество ожидает прорыва в качестве перевода в гибридных моделях RBMT + SMT.

Гибридная технология PROMT Объединение RBTM и статистических технологий лингвистический анализ входного предложения порождение вариантов перевода использование статистических технологий оценка и выбор лучшего варианта перевода с использованием Модели языка

Этапы Гибридной технологии Обучение RBMT на основе параллельного корпуса с использованием статистических технологий Эксплуатация на основе натренированной системы

Параллельный корпус Модель языка Данные для постредактирования Данные для постредактирования Правила синтеза Словарь терминологии Словарь терминологии Обучение Эксплуатация Гибридный перевод Текст на входном языке Текст на выходном языке Обучение Архитектура Гибридной технологии

Обучение Параллельный корпус (необработанные данные) Выходной корпус Новый параллельный корпус (МП – перевод человеком) Гибридная тематика перевода Параллельный корпус (прочищенные данные) Правила синтеза Данные для постредактирования Словарь терминологии Машинный перевод входного корпуса Модель языка Входной корпус

Эксплуатация Предложение на входном языке Предложение на входном языке Порождение вариантов перевода Порождение вариантов перевода Варианты перевода x. Варианты перевода x. Применение статистического постредак- тирования Применение статистического постредак- тирования Варианты перевода x. Варианты перевода x. Выбор по Модели языка Выбор по Модели языка Лучший вариант перевода Лучший вариант перевода

Модель языка (1) Параллельный корпус (англо-русский) Корпус на входном языке (английский) Корпус на выходном языке (русский) Модель языка

Модель языка (2) Модель языка (Language Model/LM) – это набор n-грамм моноязычного корпуса с их вероятностными характеристиками. N-грамма – это последовательность слов из предложений длины n.

Модель языка (3)

Модель языка (4) Perplexity (PPL) – вычисляемая для предложения «степень его искаженности» по отношению к данной LM. Чем меньше PPL, тем «естественнее» предложение. Модель языка - оценка релевантности (через PPL) каждого перевода по отношению к данному корпусу, - выбор лучшего варианта среди всех порожденных.

Как работает Гибридная технология Создание терминологического словаря из параллельных текстов для RBMT автоматическим путем Порождение всех возможных вариантов перевода на основе - лексических вариантов - вариантов синтеза разных конструкций - применения постредактирования  выбор лучшего варианта через Модель языка

Терминологический словарь (1) Технология получения: а) на основе параллельного корпуса составляются таблицы n-грамм входного корпуса вместе с вероятностями соответствий этих n-грамм n-граммам выходного корпуса, б) на основании парсеров для входного и выходного языков, а также частотных характеристик из общего числа n-грамм извлекаются релевантные для словаря единицы с некоторой грамматической информацией (например, о валентности)  создается двуязычный глоссарий в) в автоматическом режиме создается словарь для RBMT

Терминологический словарь (2)

Лексические варианты The restaurant features a unique space with a cozy lounge and an eclectic blend of music, art and sculpture. Rule-based Ресторан представляет собой уникальное пространство (место) с удобным залом и эклектичной смесью музыки, искусства и скульптуры. Hybrid Ресторан представляет собой уникальное пространство с удобным залом и эклектичной смесью музыки, искусства и скульптуры. (PPL==778) Ресторан представляет собой уникальное место с удобным залом и эклектичной смесью музыки, искусства и скульптуры. (PPL=522)

Варианты синтеза конструкций (1) Rule-based: выбор определенной модели синтеза Hybrid: синтезирование нескольких вариантов перевода Правило синтеза: перевод конструкции to + инфинитив -чтобы + инфинитив -для + существительное You can use the same steps to edit the collection. Можно использовать те же самые шаги, чтобы отредактировать коллекцию. (PPL=372) Можно использовать те же самые шаги для редактирования коллекции. (PPL=358)

Варианты синтеза конструкций (2) Rule-based: выбор определенной модели синтеза Hybrid: синтезирование нескольких вариантов перевода Правило синтеза: порядок следования подлежащего и сказуемого. Click Browse to browse the path for the folder in which you want newly created documents to be located. Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы недавно созданные документы были расположены. (PPL= 290) Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы были расположены недавно созданные документы. (PPL= 274)

Данные для постредактирования (1)

Данные для постредактирования (2) Технология : на основе параллельного корпуса выделяется таблица n-грамм входного корпуса вместе с вероятностями соответствий этих n-грамм n-граммам выходного корпуса. с платежом PayPal банковским переводом  в случае платежа PayPal посредством банковского перевода вводите банковский перевод  инициируете перевод когда Вы закончены  после окончания Вашей работы каждое усилие было приложено  были предприняты все усилия

Данные для постредактирования (3) Пример применения нескольких замен сегментов машинного переводами сегментами человеческого перевода. With PayPal payment by bank transfer, you initiate a bank transfer from your bank account to your PayPal account. С платежом PayPal банковским переводом вы вводите банковский перевод с Вашего банковского счета на ваш счет PayPal. (PPL=95) В случае платежа PayPal посредством банковского перевода вы инициируете перевод с Вашего банковского счета на ваш счет PayPal. (PPL == 7)

Исходный текст Порождение лексических вариантов Порождение вариантов синтеза Порождение вариантов постредактирования Click Browse to browse the path for the folder in which you want newly created documents to be located. Click Browse to browse the path for the folder in which you want newly created documents to be located. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы недавно созданные документы были расположены. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы недавно созданные документы были размещены. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы недавно созданные документы были расположены. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы недавно созданные документы были размещены. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы недавно созданные документы были расположены. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы недавно созданные документы были размещены. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы были расположены недавно созданные документы. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы были размещены недавно созданные документы. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы недавно созданные документы были расположены. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы недавно созданные документы были размещены. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы были расположены недавно созданные документы. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы были размещены недавно созданные документы. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы недавно созданные документы были расположены. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы недавно созданные документы были размещены. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы были расположены недавно созданные документы. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы были размещены недавно созданные документы. Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы недавно созданные документы были расположены. Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы недавно созданные документы были размещены. Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы были расположены недавно созданные документы. Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы были размещены недавно созданные документы. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы недавно созданные документы были расположены. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы недавно созданные документы были размещены. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы были расположены недавно созданные документы. Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы были размещены недавно созданные документы. Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы недавно созданные документы были расположены. Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы недавно созданные документы были размещены. Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы были расположены недавно созданные документы. Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы были размещены недавно созданные документы.

Оценка LM Выбор лучшего варианта Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы недавно созданные документы были расположены. (PPL= 556) Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы недавно созданные документы были размещены. (PPl = 601) Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы были расположены недавно созданные документы. (PPl = 526) Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы были размещены недавно созданные документы. (PPl = 569) Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы недавно созданные документы были расположены. (PPl = 277) Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы недавно созданные документы были размещены. (PPl = 301) Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы были расположены недавно созданные документы. (PPl = 261) Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы были размещены недавно созданные документы. (PPl = 283) Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы недавно созданные документы были расположены. (PPL= 556) Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы недавно созданные документы были размещены. (PPl = 601) Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы были расположены недавно созданные документы. (PPl = 526) Нажмите Browse, чтобы рассмотреть путь к папке, в которой Вы хотите, чтобы были размещены недавно созданные документы. (PPl = 569) Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы недавно созданные документы были расположены. (PPl = 277) Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы недавно созданные документы были размещены. (PPl = 301) Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы были расположены недавно созданные документы. (PPl = 261) Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы были размещены недавно созданные документы. (PPl = 283) Нажмите Browse для просмотра пути к папке, в которой Вы хотите, чтобы были расположены недавно созданные документы. (PPl = 261)

LM Statistics

Поиск по параллельным корпусам

Выводы Преимущества RBMT сохраняются: - синтаксическая и морфологическая точность, - стабильность и предсказуемость результата, - возможность настройки на предметную область. Недостатки RBMT нивелируются за счет использования параллельных корпусов и статистических методов - автоматическая настройка лингвистических баз данных (быстрое и качественное извлечение терминологии), - исчезает «машинный» акцент при перевода (вариант ы синтеза и постредактировани е ).

Спасибо!