Технология Translation Memory. Технология translation memory Предварительная подготовка текста и постредактирование

Программы машинного перевода — это программы, которые специально разрабатываются для облегчения процесса перевода с помощью компьютера (букв. computer assisted translation ), как AutoCAD для инженеров или ArchiCAD для архитекторов. Такое программное обеспечение специально разработано, чтобы создавать, хранить, читать и записывать информацию в виде файлов под названием «память перевода» (букв. translation memories), при этом программа создает строку с языковой парой, автоматически находя для отдельного слова или словосочетания его соответствие на другом языке. Программа создает файл с названием, например, RU_EN или RU_IT и т.п., в котором слово или словосочетание на одном языке соответствует своему значению на другом языке.

Что такое «память перевода» и как она работает.

Память перевода (translation memory, TM) — это объемный файл с техническими терминами, сокращениями, устоявшимися выражениями.

Если вам предстоит перевести, например, сокращение «CCCP » с русского на английский с помощью программы машинного перевода (CAT), программа сразу предложит вам вариант перевода: Soviet Union.

На первый взгляд, все просто, но не все так просто, как кажется. Если мы переводим документ, не имеющий отношения к истории, тогда данная аббревиатура может означать нечто совершенно другое: c arbonyl c yanide m-c hlorophenyl h ydrazone , токсичный ионофор, разобщитель дыхательной цепи. Или, например, это может означать «c ombined c ommunity c odec p ack «, программный пакет Microsoft Windows для воспроизведения мультимедийных файлов.

Вот почему компания «Экспримере» не использует в работе программы автоматического перевода. Мы пользуемся исключительно терминологическими базами данных для технических переводов.

В.Н. Грабовский; Журнал практикующего переводчика "МОСТЫ" 2/2004

Статья рассказывает о новом инструменте переводчика – технологии Translation Memory (TM), благодаря которой осуществляется механизация переводческой деятельности.

Нейронные сети в работе переводчика

Теории машинного перевода, разрабатывавшиеся в вялотекущем режиме с незапамятных времен, с 1970-х годов получили серьезный импульс. Это было связано с существенными достижениями в области моделирования интеллектуальной деятельности. Помимо чисто научного интереса, это объяснялось возрастающей ролью межъязыковых коммуникаций в современном мире.

Кроме электронных словарей и словарей-разговорников, к середине 1990-х годов довольно большое распространение получили "электронные переводчики" (их стали называть технологией MT ). В принципе, "электронные переводчики" - это программы, которые могли обработать целый текст. Правда, на выходе получалось не совсем то, что надо, а если откровенно, то совсем не то. Для того, чтобы результат работы технологии MT стал действительно связным текстом, человеку приходилось немало поработать над ним.

Понятие “машинный перевод” стало общеизвестным. Довольно большое распространение у нас получили отечественные программы Stylus (сейчас она называется Promt и Сократ ). Впрочем, интерес к таких программам после периода первоначального любопытства постепенно снижался, и сейчас он невелик, даже несмотря на то, что их в значительной степени доработали. В настоящее время их используют в основном для знакомства с содержанием иноязычных сайтов в Интернете, а также для чтения и написания электронных писем на иностранном языке.

По большому счету, работа переводчика за столетия принципиально не изменилась. Да, появились компьютеры, этакие быстродействующие и удобные пишущие машинки. Да, появились "электронные переводчики". Однако при всем том, что технологии MT совершенствовались, они так и не стали инструментом, имеющим широкую сферу применения и позволяющим по-настоящему экономить время и силы.

Что такое технология Translation Memory

Новым инструментом переводчика стала технология Translation_Memory (TM). На Западе технология TM и созданный на ее базе инструментарий переводчика - Translation Memory Tools (TMT) - хорошо известны и широко применяются. Особенностью такой технологии является механизация переводческой деятельности, а не ее автоматизация в том виде, каком ее видели создатели технологии MT. Причем это более скромное, на первый взгляд, решение принесло практической пользы неизмеримо больше, чем глобальный замысел "электронных переводчиков".

Отличие от электронных словарей и других инструментов переводчика заключается в том, что типичная программа класса ТМ основана на нейронных сетях, которые способны в определенной степени моделировать работу человеческого мозга при обработке данных. Эти сети способны обучаться и анализировать сложные наборы данных, которые сложно обрабатывать с помощью линейных алгоритмов.

В этих программах используются размытый алгоритм, позволяющий отыскивать слова не только в их словарных формах, но и в других формах, например, в другом падеже. Кроме того, они могут находить словосочетания в другом порядке слов. Самоорганизующаяся искусственная нейронная сеть способна находить закономерности и определять взаимосвязи между ними. Программа сравнивает тот фрагмент, над которым вы сейчас работаете, с содержимым базы данных, и предоставляет эту информацию на дисплей. Она может установить, что данный фрагмент похож на аналогичный фрагмент, имеющийся в памяти системы, например, на 99%, на 74%, или даже на 20%.

Каждому переводчику знакомо ощущение, что фраза, над которой он сейчас бьется, уже где-то, когда-то встречалась, хотя бы в приблизительном виде. Причем попадалась либо в этом же материале, либо в каком-то другом, переводимом ранее. Прямо дежавю какое-то… Посмотреть бы ее, эту фразу, хотя бы для справки, чтобы толково сформулировать ту, над которой работаешь сейчас…

Начинаешь листать оригинал обратно, рыться на книжной полке. И часто бывало так, что искомая фраза действительно обнаруживалась. Чаще всего, когда уже поздно, уже после того, как работа над переводом закончена. Думается, в такую минуту все бы отдал за средство, которое помогло бы найти необходимый текст. Даже сейчас, когда печатаешь текст перевода с помощью компьютера, а не на пишущей машинке, всегда жаль переделывать то, что сочинялось с таким трудом. Давняя мечта переводчика - придумать какое-либо средство, которое бы освобождало от необходимости переводить одну и ту же фразу несколько раз.

Подобного рода идея лежит в основе создания технологии Translation Memory, или просто ТМ, на основе которой с конца 80-х - начала 90-х годов начали появляться более или менее работоспособные программы. По сути дела, такая программа представляет собой управляющую оболочку, которая работает с той или иной подключаемой базой данных (ТМ) и которую я бы назвал копилкой переводов. ТМ - это компьютеризированная версия большого картотечного шкафа, в котором хранится каждая фраза, которую вы когда-либо переводили, причем в паре - как на языке оригинала, так и перевода. Каждая такая пара называется билингва. Программа мгновенно напомнит вам, как эту фразу переводили в прошлый раз. Доступ к информации легкий и быстрый.

Обзор основных программ класса Translation Memory

В настоящее время на мировом рынке представлено несколько программных продуктов, использующих технологию ТМ. Они отличаются друг от друга, и порой существенно. Вместе с тем им всем присущи некоторые общие функциональные возможности.

Например, у них, как правило, предусмотрен текстовый редактор, имеющий два параллельных окна. Одно окно предназначено для текста оригинала, второе - для перевода. Когда в окно оригинала выводится исходный фрагмент текста (это может быть предложение, абзац, отдельное слово), начинается поиск аналогичного фрагмента в базе данных. Если в памяти оказался точно такой же фрагмент, он выводится в окно перевода автоматически. Если в точности такого же фрагмент не нашлось, но обнаружился какой-то похожий, то в окно программы выводится найденный фрагмент с указанием процента совпадения.

Переводчик редактирует предложенный программой текст перевода, приводя его в соответствие с оригиналом, посылает его в память базы данных и приступает к следующему. Если ничего не нашлось вообще, то переводчик переводит его с нуля, впечатывая текст в окошко перевода. Закончив работу над этим фрагментом, переводчик посылает его в память базы данных и приступает к следующему. Таким образом, пополнение ТМ происходит автоматически, по мере работы. Сразу после того, как билингва попала в ТМ, она становится доступной пользователю. Если ТМ-программа расположена на сетевом диске и с ней работают другие пользователи, то новая билингва сразу же становится доступной и для остальных переводчиков. После того, как фрагмент оригинала и фрагмент перевода отправлены в базу данных, в окно оригинала выводится следующий фрагмент.

Первую программу такого типа, получившую название Translation Manager, разработала фирма IBM. Вначале IBM использовала Translation Manager для собственных потребностей - для локализации (адаптации на иностранные языки) собственного программного обеспечения. Затем Translation Manager был предложен рынку в качестве коммерческого продукта, и некоторое время он был монополистом в этой области. Эта программа довольно проста в использовании, отличается быстродействием и обеспечивает хорошие возможности для индивидуальных настроек пользователя. Для каждой из трех основных функций предусмотрены отдельные окна - Translation, Translation Memory и Dictionary. В окне Translation Memory отображаются найденные в памяти соответствия, если они там есть, а в окно Dictionary выводится терминология из словарей, разработанных IBM. Есть в этой программе и некоторые неудобства, например, усложненная процедура поиска в копилке памяти (Translation Memory) отдельных слов.

Еще одна программа - SDLX - разработана для своих собственных потребностей английской компанией SDL , занимающейся локализацией программного обеспечения. Каждая программа, входящая в комплект, устанавливается отдельно. SDL Edit - это, собственно, сама программа, с помощью которой осуществляется перевод. В ней есть три окна, показывающие исходный текст, перевод и Translation Memory. Следует отметить, что документ для перевода нельзя импортировать непосредственно в SDL Edit. Сначала его необходимо преобразовывать при помощи SDL Convert, что является определенным неудобством.

Программа Déjà Vu пользуется у переводчиков в Европе популярностью благодаря своей гибкости и адаптивности. Помимо удобства, Déjà Vu отличается от других продуктов самым высоким соотношением цена/качество. По сравнению с двумя предыдущими программами рассматриваемый продукт имеет ряд удобных возможностей. Специалисты отмечают, что с самого начала эта программа разрабатывалась в контакте с ее будущими пользователями. Известно, что последняя версия Déjà Vu тестировалась, в частности, российскими переводчиками. Один из них, Андрей Герасимов, написал положительную рецензию на эту программу в журнале MultiLingual Computing & Technology

Известна в нашей стране и популярная в Европе программа STAR Transit . По своей идеологии она совершенно не похожа на другие продукты рассматриваемого класса. Вы уже получили определенное представление о них, и знаете, что все они имеют центральную базу данных большой емкости, копилку переводов, в которой нужные данные обнаруживаются мгновенно (если они там есть, конечно). Как сказал бы Билл Гейтс: "Information at your fingertips". Так вот, все программы Translation Memory имеют электронный каталожный шкаф, а Transit - не имеет. У него все по-другому. Исходные данные и перевод сохраняются в текстовом формате в виде файлов, которые переводчик размещает в директориях по своему усмотрению. Затем переводчик может просто указать программе, какие директории и даже какие файлы ему необходимы. Затем Transit формирует ассоциативную сеть ссылок, с которой и ведется работа. Несмотря на отдельные плюсы, в России Transit не получил широкого распространения. В конечном счете Promt, официальный дистрибьютор Transit, переключился на дистрибуцию Translator’s Workbench фирмы Trados.

А вот Translator’s Workbench, или просто Традос, быстро получил широкое распространение в России, сначала среди переводческих фирм, а затем и среди индивидуальных переводчиков. Наверное, это можно объяснить тем, что он дает возможность работать, не выходя из Word’a, что психологически комфортней. Кому приятно смотреть на текст, испещренный всевозможными кодами в квадратных скобках? Translator’s Workbench (Традос) по сравнению с другими программами более удобен для обычного переводчика, который не является специалистом по программированию, он более понятен по сравнению с остальными программами подобного типа. В частности, кнопки управления снабжены всплывающими подсказками. Находясь в знакомом и понятном Word’е, можно использовать все его инструменты (например, автотексты).

Данный продукт обладает полным набором полезных инструментов, которые в остальных программах присутствуют лишь в той или иной степени. Одним из таких инструментов является Analise, позволяющий заранее проанализировать текст оригинала и выяснить, есть ли там (и в каком количестве) полные и неполные совпадения. Стоит упомянуть и такую удобный инструмент, как Placeables, позволяющую, например, автоматически менять цифры в тексте, если все остальное в переводимом фрагменте совпадает с обнаруженным в копилке переводов (ТМ). Очень удобна автоматическая функция замены в цифрах десятичных точек и/или запятых, формата времени, аббревиатур и т.д. на соответствующие параметры, задаваемые переводчиком.

Подавляющее большинство российских переводчиков, использующих технологию TM, предпочитают Translator’s Workbench (Традос).

Что общего у программ Translation Memory

Резюмируя описание основных программных продуктов класса Translation Memory, следует отметить наличие у них, как правило, ряда общих функциональных возможностей.

Сведение - Alignment

Эта функция позволяет создавать копилки переводов (ТМ) из существующих файлов. Из двух файлов - один с текстом оригинала, а другой с текстом перевода - создается набор билингв. Напротив предложения исходного текста выстраивается его перевод. И так по всем файлам, которые переводчик свел в единую копилку. Степень удобства функции совмещения у разных программ различная.

Обслуживание – Maintenance

По мере накопления в базе данных билингв их количество может увеличиться настолько, что содержимое базы может выйти за все пределы. Могут обнаружиться какие-то неточности и даже ошибки, особенно если программа используется в сети многими пользователями. Возникнет необходимость что-то отредактировать или уточнить, а то и просто удалить. Справедливости ради надо сказать, что упомянутое средство обслуживания программ до конца эту проблему не решает - бороться на практике с засорением копилок переводов все равно затруднительно.

Терминологический словарь - Terminology Program

Все рассматриваемые программы имеют свои терминологические словари, являющиеся по сути известными всем электронными словарями. Терминологические словари могут импортировать файлы в формате словарей или глоссариев, их можно пополнять и вручную.

Текстовый редактор - Document Editor

Здесь, собственно, и осуществляется процесс перевода. Для этого у всех программ предусмотрены упоминавшиеся выше два окна - для исходного текста и для его перевода. У всех текстовых редакторов есть возможность устанавливать в процентах степень сходства между переводимым в данный момент исходным текстом и текстом в копилке переводов. Чем выше вы установите процент сходства, например, 90% или 95%, тем меньше вероятность обнаружения там подходящего текста. Однако можно установит процент поменьше, тогда может набраться немало материала, который был бы полезен хотя бы для справки.

Конкорданс (Связка словоупотребления с контекстом) - Concordance

Это очень полезная функция всех рассматриваемых программ. Нередко бывает, что какой-то термин (или сочетание терминов) может иметь несколько значений или оттенков значений. Выделив термин, можно просмотреть в окне все билингвы, имеющиеся в копилке, причем в самых разных контекстах. Это всегда облегчает выбор наиболее точного варианта перевода данного термина или сочетания.

Наталья Шахова, директор агентства EnRus, считает что большинство TM-продуктов избавляют пользователя от необходимости знакомиться с различными текстовыми процессорами. Достаточно изучить особенности текстового редактора самого продукта, и вам станет подвластно все разнообразие текстов, будь они представлены в QuarkXPress, FrameMaker или Adobe Illustrator. Здесь есть, конечно, некоторый подвох: для того чтобы освоить очередной текстовый процессор или издательскую систему, вам понадобится соответствующая программа-фильтр, которая - что? Правильно - продается за отдельные деньги! Вообще денежный вопрос самый серьезный, когда речь идет о TMT. Стоят они недешево (как правило, несколько сотен долларов), совместимости, понятное дело, нет. Поэтому если вы приобрели (и освоили!) какой-либо продукт для одного проекта, то для следующего может потребоваться приобрести другой продукт и снова тратить время на его изучение.

Далее Наталья Шахова отмечает, что на Западе уже вовсю обсуждают последствия повсеместного распространения таких программ. Одно из них заключается в том, что переводчик-новичок теряет возможность выйти на рынок. Точно так же, как в России уже очень трудно получить заказ переводчику, если у него нет компьютера и принтера, так и за границей возникают проблемы трудоустройства у переводчиков, не имеющих TM-программы. У этого явления есть и положительная сторона - нанимая на работу владельца TM-программы, заказчик получает некоторую гарантию его профессионализма. Но ведь и новички должны иметь возможность стартовать!

Отношение к технологии Translation Memory в нашей стране разное.

Когда в 1999 году бюро переводов "Фонетикс" начало работать с Trados Translator’s Workbench, то естественно, в ходе контактов с заказчиками мы рассказывали о переходе на новую технологию. Вопреки ожиданиям, реакция была настороженной, а порой и просто отрицательной. Оказалось, что идея машинного перевода была уже скомпрометирована бездумным применением в 90-х годах программ типа Stylus и Socrat. Причем их нередко использовали переводчики, скажем, не очень высокой квалификации, которые не утруждали себя редактированием того, что выдавали "электронные переводчики". Впрочем, пользователей этих программ тоже можно понять - редактирование этих текстов требовало много времени и сил.

Даже сейчас порой можно встретить со стороны заказчиков из числа российских организаций настороженное отношение к любым новациям в сфере программного обеспечения для переводов. Вместе с тем иностранные фирмы, наоборот, требуют применения программ класса Translation Memory. Зачастую у них есть сложившиеся предпочтения, в основном это Trados Translator’s Workbench, а также Star Transit. У них нередко имеются готовые ТМ (копилки переводов), которые они предлагают использовать.

Что касается переводчиков, то они испытывают к технологии Translation Memory вполне понятный интерес. Еще более понятный интерес испытывают к ним бюро переводов. Они имеют дело не столько с художественной литературой, публицистикой, поэзией и т.д., сколько с инструкциями по эксплуатации, руководствами по поиску и устранению неисправностей, а также с локализацией программного обеспечения, т.е. с теми материалами, где имеются повторяющиеся или схожие фрагменты текста.

В своем нынешнем виде программы Translation Memory, по-видимому, достигли потолка. Дальнейшая работа по их доработке идет по пути совершенствования их существующих функциональных возможностей. Это ведет к тому, что программы становятся все более громоздкими и сложными, и это при том, что каких-то принципиально новых идей там нет. Тот же Translator’s Workbench (Традос) в своей последней версии оброс таким набором инструментов, что простому пользователю разобраться в них очень сложно.

Эксплуатация этой программы предполагает наличие в штате бюро переводов отдельного сотрудника. Помимо руководства пользователя, в документации предусмотрено руководство для выделенного специалиста (TRADOS Specialist Guide). Кроме этого в пакет документации входит Project Management Guide, MultiTerm User Guide и WinAlign User Guide. Даже у подготовленного переводчика на ознакомление с сотнями страниц этих документов потребуется много сил и времени.

Поиском новых решений занимается группа исследователей в университете Мэрилэнд, округ Балтимор (США), под руководством профессора С.Ниренбурга, известного специалиста в области искусственного интеллекта и машинного перевода. Пока разработки находятся на стадии теоретических исследований, и скорее всего, доведение этих исследований до стадии коммерческого продукта потребует значительного времени.

Обращает на себя внимание то обстоятельство, что на рынке инструментов переводчика работают в основном зарубежные фирмы. Хотелось бы надеяться, что это не будет продолжаться вечно. Потенциал теоретических разработок российских специалистов в области семантического анализа очень большой. Наши исследования в этой области достигли весьма высокого уровня. Есть все основания рассчитывать, что эти разработки будут материализованы в виде принципиально новых лингвистических технологий, которые позволят в полной мере раскрыть творческий потенциал переводчика.

Журнал практикующего переводчика «Мосты», одно из немногих профессиональных периодических изданий для переводчиков. В журнале публикуются статьи переводчиков различных специальностей, как устных, так и письменных. На страницах журнала переводчики, специализирующиеся в различных областях знаний, имеют возможность обсуждать актуальные проблемы, полемизировать друг с другом, делиться секретами профессионального мастерства.

Память переводов проекта (TM) - это хранилище исходных строк и их переводов на разные языки, которые можно использовать для ускорения перевода одинаковых или похожих строк в вашем проекте или других проектах.

Каждый перевод, сделанный в проекте, автоматически добавляется в память переводов проекта. Владелец или руководители проекта также могут при необходимости загрузить в проект Translation Memory.

Скачивание или загрузка памяти переводов

  1. Перейдите на вкладку TM & MT пункта настройки проекта .
  2. Нажмите кнопку скачать или загрузить .

You can upload and download TM in the following file formats .tmx, .csv, .xlsx.

Если вы загружаете TM в форматах файлов.csv или.xlsx, сопоставьте столбцы с соответствующими языками в диалоге конфигурации.

Привязка ТМ

Чтобы привязать какие-либо конкретные TM для вашего проекта, выполните следующие действия:

  1. Перейдите на вкладку TM & MT пункта настройки проекта .
  2. Нажмите **Привязать TM **.
  3. Выберите необходимые ТМ в открывшемся диалоговом окне.
  4. Кликните по кнопке Сохранить .

Вы можете установить приоритет выбранных ТМ в том же диалоге.

Совместное использование ТМ

Со всеми вашими TM используемыми совместно вы сможете предварительно перевести любой из ваших проектов, используя все общие TM. Кроме того, в редакторе будут показаны предложения по переводу ТМ из всех ТМ, назначенных для проектов, которыми вы владеете.


Применение памяти переводов через предварительный перевод

Предварительный перевод через ТМ позволяет использовать как минимум 100% и совершенные совпадения.

Говоря об автоматизированном переводе, обычно подразумевают программы, осуществляющие перевод на основе технологии машинного перевода (Machine Translation). Однако существует и другая технология - Translation Memory, которая хотя и не столь широко известна российским пользователям, но, тем не менее, имеет ряд преимуществ.

Бурное развитие технического прогресса привело к увеличению числа технических устройств, машин и другой сложной техники, без которых жизнь современного человека практически немыслима. Например, объем документации для европейского самолета Airbus исчисляется десятками тысяч страниц. Как показывают данные исследования, проведенного в конце 2004 года ассоциацией LISA (LISA 2004 Translation Memory Survey), 42% опрошенных переводят около 1 млн. слов в год, у 24% компаний - участников опроса ежегодный объем переводов составляет 1-5 млн., 12% переводят от 5 до 10 млн., объем переводов остальных компаний - от 10 до 500 и более миллионов слов в год. В частности, большинство производителей сегодня не ограничиваются своим локальным рынком и активно осваивают региональные рынки. При этом локализация продукции, в том числе перевод описания продукта на местный язык, является одним из обязательных условий для выхода на новый рынок.

В то же время, хотя производители регулярно выпускают новые версии своих продуктов - автомобилей, экскаваторов, компьютеров и мобильных телефонов, программного обеспечения, - далеко не все из них принципиально отличаются от предыдущих моделей. Подчас новая модель телефона представляет собой слегка измененную (или рестайлинговую) предыдущую модель. Новые версии продаются лучше, поэтому производителям приходится регулярно обновлять свои продукты. В результате документация по каждому из таких продуктов зачастую на 70-90% совпадает с той, что была у предыдущей версии.

Два фактора - большой объем требующих перевода документов и их высокая повторяемость - послужили стимулом к созданию технологии Translation Memory (сокращенно именуется TM, общепринятый русский перевод этого термина отсутствует). Суть технологии TM можно образно передать одной фразой: «Не переводить один и тот же текст дважды». Иначе говоря, Translation Memory используется для повторного использования ранее сделанных переводов. Это позволяет серьезно сократить время на подготовку перевода, особенно при работе с текстами, имеющими высокую степень повторяемости.

Технологию Translation Memory часто путают с машинным переводом (Machine Translation), которая, безусловно, тоже полезна и интересна, но ее описание не является целью настоящей статьи. Использование технологии ТМ повышает скорость перевода за счет уменьшения объема механической работы. Однако важно отметить, что TM не выполняет перевод за переводчика, а является мощным инструментом для сокращения затрат при переводе повторяющихся текстов.

Технология ТМ работает по принципу накопления результатов перевода: в процессе перевода в базе ТМ сохраняются исходный текст и его перевод. Для облегчения обработки информации и сравнения различных документов система Translation Memory разбивает весь текст на отдельные кусочки, которые называются сегментами. Такими сегментами чаще всего являются предложения, но могут быть приняты и другие правила сегментации. При загрузке нового текста система TM осуществляет сегментирование и сравнивает сегменты исходного текста с уже имеющимися в подключенной базе переводов. Если системе удается найти полностью или частично совпадающий сегмент, то его перевод отображается с указанием совпадения в процентах. Сегменты, которые отличаются от сохраненного текста, выделяются подсветкой. Таким образом, переводчику остается только перевести новые сегменты и отредактировать частично совпадающие.

Как правило, задается порог совпадений на уровне не ниже 75%, так как если установить меньший процент совпадений, то увеличатся затраты на редактирование текста. Каждое изменение или новый перевод сохраняются в ТМ, так что нет необходимости переводить одно и то же дважды!

Важно также постоянно пополнять базу Translation Memory, сохраняя в базе (или в базах, если перевод выполняется по различным тематикам) пары сегментов «исходный текст - правильный перевод». Это позволит значительно сократить время, необходимое для перевода сходных текстов. Помимо снижения трудоемкости перевода система TМ позволяет выдержать единство терминологии и стиля во всей документации.

Использование технологии ТМ обеспечивает переводчику следующие преимущества:

  • повышение производительности труда. Подстановка даже на 80% совпадающих сегментов из базы переводов может сократить время работы над переводом на 50-60%. Как показывает практика, гораздо эффективнее править уже готовый перевод, чем переводить заново - «с нуля»;
  • единство терминологии и стиля при наличии базы переводов по тематике переводимого документа. Это особенно важно при переводе узкоспециальной документации;
  • организация работы коллектива переводчиков с гарантированным качеством перевода благодаря доступу к общей базе Translation Memory.

Отдельно отметим, что в западных странах, где технология Translation Memory давно уже стала де-факто обязательным инструментом переводчика, средства, потраченные на создание базы переводов, рассматриваются не как затраты, а, скорее, как инвестиции в стабильную и качественную работу, что увеличивает не только прибыль, но и стоимость самой компании.

Рынок систем Тranslation Мemory

Бесспорным лидером на рынке систем Translation Memory являются программы SDL-TRADOS. Летом 2005 года произошло объединение двух крупнейших разработчиков систем ТМ - компаний SDL и TRADOS (программные продукты под торговой маркой TRADOS хорошо известны многим пользователям), и теперь они выпускают совместный продукт, который является законодателем стандартов в области Translation Memory.

Новая система SDL-TRADOS имеет расширенные (настраиваемые пользователем) функциональные возможности нечеткого соответствия (поиск по совпадениям в базе переводов), а также инструментарий для проверки качества переводимых документов. Программа осуществляет проверку орфографии и защищает содержимое блоков памяти с помощью технологии шифрования.

Система поддерживает такие форматы, как Word DOC и RTF, online help RTF, PowerPoint, FrameMaker, FrameMaker +SGML, FrameBuilder, Interleaf, QuickSilver, Ventura, QuarkXPress, PageMaker, SGML/HTML/XML, включая HTML Help, RC (Windows Resource), Bookmaster (DCF) и Troff. Помимо системы SDL-TRADOS, на IT-рынке имеются и другие системы ТМ. Особенно широко представлены французские производители.

Система французской компании Atril (www.atril.com) называется. Ее разработчики сначала организовали собственное бюро перевода технической документации, после чего возникла идея создания специализированного ПО на основе технологии Translation Memory.

Это самостоятельное приложение с систематизированным меню. Система может создавать базы ТМ, а также базы данных терминологии и подключать словари. Процесс перевода осуществляется в специальной оболочке Project, куда при ее создании прикрепляется файл, который необходимо перевести, и подключаются дополнительные настройки: база ТМ, словари и др. Текст переводится в специальной таблице, где напротив каждой графы его оригинала нужно заполнить вариант перевода. К преимуществам также относится дополнительная функция для перевода файлов различных форматов, которая позволяет сохранить исходное форматирование файла.

Из-за ценового давления переводческий бизнес сегодня уже не может долго оставаться прибыльным и конкурентоспособным без автоматизации. Почти все профессиональные переводчики и бюро работают в программах памяти перевода (CAT-tools, они же «кошки»). Используя эти программы и компании экономят в среднем 36% бюджета и времени, а иногда до 90%. Бюро, чья стратегия ориентирована на продажи с профессиональным и сведущим заказчикам, например, зарубежным бюро переводов, не могут обойтись без целого набора из нескольких технологий.

Существует более различных 50 программ памяти переводов: от бесплатных/open source Omega-T и MateCAT до дорогостоящих коммерческих решений с коллективной работой и системной интеграцией..

Топ-10 средств translation memory

Продукт Компаний-пользователей на 03.2017 Изменения позиции с 03.2015
1 Программы SDL 122 -
2 59 -
3 48 4
4 memoQ - Kilgray * 33 ↓1
5 STAR Transit 20 3
6 Across 17 ↓2
7 Lionbridge Translation Workspace 17 new
8 WordFast 17 ↓2
9 Atril DejaVu 16 ↓3
10 XTM 14 ↓1

* из 33-х пользователей memoQ шесть компаний указали, что используют сервер

Не используются переводческими компаниями региона: MateCat, Transifex, PhraseApp, Fluency, CafeTran Espresso, WordBee, MetaTexis, Heartsome, Swordfish, LogiTerm Pro, Crowdin, translate5, TextUnited и другие.

Шесть и более CAT-средств необходимо для субподрядов

Данные в таблице почерпнуты из в котором зарегистрированы 280 компаний. Из них 170 указали инструменты памяти переводов. 60% компаний пользуются одной или двумя программами, четверть владеет несколькими (от 3 до 5).

15% компаний указали десять или более средств памяти переводов в своем распоряжении. Почти все из них выполняют существенный объем переводов на субподрядах иностранных переводческих фирм. Чтобы адаптироваться под различные технологические требования заказчиков, они тестируют все популярные «кошки» и могут закупить доступ к ним на короткое время. Часто лицензии вместе с проектом предоставляет клиент.

Компании, указавшие больше всех CAT-инструментов К-во
Janus Worldwide 19
Promova 18
KONSIS 18
Logrus Global 18
ITI 17
Palex Group 15
Databridge 14
Yepanoff 13
Technolex Translation Studio 11
Neotech 10
ЭГО Транслейтинг 10
InText 9

На практике в сколько-нибудь серьезном масштабе они пользуются только одним или двумя инструментами. Например, в компании Janus Worldwide, перечислившей 19 инструментов, основными являются SDL Trados и Across. В Неотэке и ЭГО Транслейтинг с 10 «кошками» на складе в ежедневном режиме переводчики работают в Trados и в Memsource.

Чем пользуются крупнейшие БП

Количество инструментов и выручка или прибыль компании не связаны. Расходы тоже: доступ к паре отдельных переводческих лицензий десятка средств памяти переводов стоит дешевле, чем одно серьезное решение для групповой работы. Чтобы определить, какими инструментами пользуются наиболее успешные компании, мы выбрали 28 организаций с выручкой около 100 млн рублей или более. Таблица ниже указывает их предпочтения в софте.

smartCAT и Transit поднялись в таблице

По сравнению с 2015 годом в каталоге выросло количество пользователей всех систем. Но только smartCAT и Transit поднялись в таблице.

smartCAT удалось убедить российского профессиональное сообщество после того как система отделилась от материнской организации ABBYY Language Services и стала независимой. В середине 2016 г. руководитель проекта Иван Смольников оставил пост генерального директора ABBYY LS и начал активную маркетинговую кампанию на бюро переводов, используя привлеченные инвестиции в размере $2,8 млн от фонда RedSeed. Когда крупные переводческие компании России перестали видеть в smartCAT инструмент конкурента, они стали использовать систему на реальных, а не тестовых проектах. Небольшие бюро привлекла финансовая модель системы с бесплатными лицензиями, а также возможность простой и легальной оплаты услуг переводчиков-фрилансеров, не зарегистрированных в качестве ИП (через иностранное юрлицо).

Позиции Transit Nxt выросли за счет эффекта низкой базы и небольшого повышения маркетинговой активности. Star Spb спонсировала две отраслевые конференции в России, начала сотрудничать с вузами. Бюро переводов покупают Transit Nxt не как самостоятельный инструмент, а как технологию под заказчика, когда сотрудничают с бюро переводов STAR Group на субподряде, либо когда выполняют заказы предприятий-пользователей Transit .

40+ переводческих компаний, сменивших системы в 2016 году

Информация по данным анкетирования в марте 2017 г. Авторский язык сохранен на 99%.

Сайт компании Поменяли ли вы программу памяти переводов (CAT) или управления проектами (TMS) в 2016-2017 гг?
1 abbyy-ls.ru По итогам 2016 года: 93 % всех проектов выполняется в SmartCAT (7 % - прочие CAT-среды по запросу клиентов). Внедрены новые CRM-система и таск-менеджер. Начата разработка новой TMS-системы.
2 abc-globe.ru Активно пользуемся smartCAT.
3 allcorrect.ru TMS находится в разработке. Искали аналоги используемой CAT - memoQ, тестировали Trados, smartCAT, Memsource. Тем не менее, недостатки в тестируемых продуктах основного блока перевешивают нехватку некоторых блоков в memoQ, например, портал клиента.
4 apriori-ltd.ru Основная программа Memsource, добавили smartCAT для снижения затрат.
5 avanta-translating.com Новые инструменты: Across, Lionbridge Translation Workspace, smartCAT, Star Transit, ChangeTracker, TQAuditor.
6 benevox.ru Trados, Memsource.
7 bssolutions.ru Переходим на smartCat в качестве основной. Считаем эту программу наиболее прогрессивной в текущем моменте времени.
8 cornplus.ru Приобрели релизы SDL 2017 г.
9 delovoyazyk.ru SDL-Trados.
10 engprofi.ru Программу памяти переводов не поменяли программа управления проектами QTRM.
11 engtrans.biz Перешли на Trados 2017, спасибо его средствам повышения производительности. Поковырялись со smartCAT и отбросили как непригодную для работы систему. Попробовали Memsource - чуть лучше smartCAT, но тоже никуда не годится.
12 exprimo.ru Внедрили Across, так как активно выходим на международные рынки.
13 i-text.kz с начала 2016 года все переводы осуществляются в системе SmartCAT.
14 intext.ua Добавили в InTMS Virtual Knowledge Assistant: функцию, напоминающую менеджерам проектов вовремя об особенностях и требованиях проекта и клиента. В части работы с CAT ориентируемся на запросы клиентов, в частности, в 2016-2017 году стали выполнять больше проектов в Memsource.
15 iti.ru Мы взяли в обойму несколько новых САТ-средств, т.к. того требовали клиенты. Например, стали работать (помимо прочего) в XTM, Smartling.
16 iwords.ru В 2016 году использовался инструментарий Memsource и SmartCAT. Они отвечают текущим нуждам компании.
17 janus.ru memoQ.
18 kiev-bridge.com.ua Поменяли TMS (в процессе разработке собственной). Работаем с Trados уже более 4 лет.
19 levshagames.ru Активнее разрабатываем внутренний портал.
20 li-terra.com Компания перешла почти полностью на Memsource, начала пробовать MemoQ. Изменения связаны с приходом в 2015 г. в компанию нового управляющего директора.
21 linguamaster.ru да, работаем с Смарткат.
22 littera.ru САТ для нескольких заказчиков.
23 logrusit.com Да, начали внедрять smartCAT.
24 lsgroup.pro Сменили Memsourse на smartCAT Приобрели QTRM.
25 medconsult.ru Не поменяли САТ-систему. Взяли на вооружение новые возможности САТ, добавив ряд языковых пар и расширив возможности автоматизированного контроля качества.
26 medsolution.ru Стали больше использовать Memsource, т.к. новым переводчикам проще его осваивать.
27 medts.ru Trados Studio WordFast.
28 minskperevod.by Перешли от Trados в smartCat. Преимущества - бесплатная программа, не требуется установка и длительное обучение переводчика.
29 monoton.su Стали использовать smartCAT в дополнение к ранее имевшимся CAT системам - у многих переводчиков возникают трудности в установке и использовании стационарного ПО. SmartCAT избавляет от этих проблем.
30 mtwain.ru Использовали Trados 10 в ряде проектов. Без него невозможно обеспечить высокую скорость и единство терминологии. Изменилось: привлекаем новых фрилансеров, свободно владеющих системами CAT.
31 palexgroup.com Стали больше использовать облачные решения.
32 perevod-ekb.ru Планируем поменять в 2017 году.
33 perevodmsk.ru Да, начали работать в SmartCAT.
34 philin.com.ua Перешли работать на новую ТМС - Alisa, улучшился сбор всех статистик, контроль сотрудников и их KPI, учет клиентов и срм, сократилось время работы обработки проектов.
35 profpereklad.ua Увеличили количество лицензий SDL Groupshare.
36 компания из топ-20 Да, думаем в сторону smartCAT активно, Trados надоел и не отвечает требованиям, несмотря на то, что стоил нам как чугунный мост.
37 t-link.ru SDL Trados studio 2015 sr2, Memsource.
38 technolex-translations.com Мы используем практически все популярные инструменты.
39 text.ua По старой, доброй традиции работаем с Trados.
40 tradosim.com По-прежнему работаем с Trados Studio. Частично обновились до 2017 версий.
41 traktat.com 1. SmartCAT -- бесплатное подключение переводчиков, наличие собственной базы фрилансеров, гибкий подход к обслуживанию 2. Внедрение собственной ЕРП системы и интеграция с ней АМОCRM.
42 translation.kh.ua Выбрали SmartCAT.
43 судебныепереводчики.рф Разработка собственных программных продуктов.

Бюро переходят на новые версии Trados с задержкой на 3 года

По данным каталога, большая часть переводческих компаний использует старые версии Trados — 2011-2014 года. Можно сделать вывод, что этих версий достаточно для их текущих нужд. Обновления Trados до версии 2017 года в магазине российского представителя SDL компании «Т-Сервис» стоят от 8500 до 40 000 рублей за одну лицензию в зависимости от редакции (профессиональная или индивидуальная). Цикл релизов Trados - 18 месяцев, то есть новые версии выходят раз в полтора года. Далеко не все компании покупают каждый релиз, многие перепрыгивают через один или два. Это не мешает «Т-Сервису» бить рекорды продаж год за годом.

Особенности национального рынка CAT-программ

Как и в других странах, в России самая популярная программа памяти переводов - это SDL Trados. В отличие от других стран, среди бюро переводов России очень высока популярность облачных инструментов: Memsource и, с этого года, smartCAT. С другой стороны, гораздо меньше используется memoQ, а такие зрелые и успешные инструменты как XTM, MateCAT и Wordbee вообще не входят в первую десятку.

Выше популярность систем, интересы которых на российском рынке представляет местный партнер.

  • «Т-Сервис» становится лучшим в мире реселлером SDL по объемам продаж год за годом.
  • Atril Deja Vu набрала популярность в 2011-2012 гг., когда их интересы представляла самарская компания All Correct.
  • STAR Transit опирается на питерскую компанию STAR Спб.

В РФ небольшая доля у Kilgray memoQ. Любимчики мирового переводческого сообщества Kilgray пробовали открыть российское представительство в 2012 году, но после неудачного первого опыта с наймом директора оставили попытки экспансии на наш рынок. Вместо этого впоследствии они открыли офис в Японии, где потенциал для их бизнеса в несколько раз больше. А XTM, Across, MateCAT и Wordbee практически не посещали местные мероприятия и не инвестировали в развитие в РФ. Они предпочитают продавать российским компаниям, когда те посещают международные конференции.

Их доля на российском рынке невысокая, хотя по совокупному объему бизнеса в мире и Across, и memoQ, и XTM опережают Memsource и smartCAT. Пожалуй, даже вместе взятых.

Чем отличаются популярные инструменты

Работающим с технологичными клиентами бюро часто приходится использовать требуемые заказчиком программы. Примеры такого софта в таблице: Oracle Hyperhub, Microsoft Locstudio, Lionbridge Translation Workspace.

Бюро, чьи заказчики не требуют конкретной программы, выбирают либо Trados - программу, ставшую де-факто отраслевым стандартом, либо более доступные облачные инструменты.

Устанавливаемые решения (сервер + desktop)

Редакторы переводов SDL Trados и Kilgray memoQ необходимо скачать и установить на компьютер. Эти популярные программы предоставляют сильный редактор переводчикам, но требуют времени на обучение. Чтобы объединить несколько переводчиков в группу и организовать между ними обмен памятью и терминологией, как правило, нужна дополнительная дорогостоящая программа - сервер.

Облачные решения

Облачные Memsource, XTM и smartCAT работают через браузер. На мой взгляд, они слегка проще в использовании чем desktop-инструменты, хотя могут уступать по функционалу редактора. Переводчик, которому отправили задание через Memsource или smartCAT, получает email со ссылкой, кликает по ней — и может начинать работу. Групповая работа включена в эти системы по умолчанию. Облачные системы не дешевле серверных, но берут оплату по арендной схеме, за месяц.

Лучше для: стабильной группы переводчиков, которая работает с регулярной нагрузкой в течение нескольких лет, может обрабатывать конфиденциальную информацию, редко отдает материалы на сторону. Лучше для: облачные инструменты с арендной схемой (SaaS) лучше подходят для быстрого расширения команды, перепадов в загрузке, работы с большой базой фрилансеров и субподрядчиков.