На второй конференции «AINL: Искусственный интеллект и естественный язык» руководитель группы статистических исследований PROMT Александр Молчанов выступит с докладом «Статистические методы в машинном переводе: проблемы роста».
Компания PROMT, которая занимается этой темой с 2009 года, сейчас разрабатывает статистические системы для финского, казахского, китайского, японского и других языков, а также гибридные системы для еще нескольких языков. Первые статистические и гибридные системы уже сданы заказчикам и успешно работают, однако в ходе дальнейших исследований разработчики сталкиваются с рядом типичных проблем.
Во-первых, это объем и качество исходных данных. Для «обучения» систем необходимы большие объемы сопоставимых текстов на двух языках, которые не всегда легко найти, кроме того, нужно обработать тексты перед использованием.
Вторая группа задач связана с обработкой результатов машинного перевода, которую также необходимо автоматизировать.
Наконец, третья группа задач, характерная для машинного перевода в целом, – это создание оптимальной системы оценки качества.
О том, что делают для решения этих проблем исследователи PROMT, можно будет узнать в ходе конференции AINL. Она пройдет 17-18 мая 2013 в Санкт-Петербурге и будет посвящена распознаванию и синтезу речи, искусственному интеллекту, извлечению данных, data mining и другим вопросам.
Подписаться на новости
Веб-форма не найдена.