Информация о форматировании в исходном файле обычно должна быть воспроизведена в файле перевода. OmegaT отображает информацию о форматировании в поддерживаемых файлах (в настоящее время DocBook, HTML, XHTML, Open Document и OpenOffice.org) как тэги. Обычно тэги не принимаются во внимание при оценке схожести строк для подбора совпадений. Тэги, которые вы воспроизвели в переведённом сегменте, будут перенесены в переведённый документ.
Тэг состоит из одного, двух или трёх символов и номера. Уникальный номер позволяет группировать тэги и различать те из них, которые отображены одинаковыми символами, но на самом деле различны. Символы не обязательно отражают значение форматирования, которое представляет данный тэг (например, жирный шрифт, курсив и т.д.)
Тэги нумеруются в порядке возрастания по группам тэгов. То, что мы называем "группой тэгов", является либо самостоятельным одиночным тэгом (например, <br1>
), либо двумя тэгами, которые образуют пару (например, <f3>
и </f3>
). Внутри сегмента первая группа (пара или одиночный тэг) получает номер 0, вторая - номер 1 и так далее. В первом примере ниже есть три группы тэгов (пара, одиночный тэг, затем снова пара), во втором примере только одна группа (пара).
Тэги всегда являются либо одиночными, либо парными. Одиночные тэги означают информацию о форматировании, которое не затрагивает окружающий текст(например, дополнительный пробел или разрыв строки).
<сегмент 2132><b0><Ctr+N></b0>, <br1><b2><Enter></b2><конец сегмента>
<br1>
- это одиночный тэг, он не затрагивает текст вокруг себя. Парные тэги обычно означают информацию о стиле, который применяется к тексту между открывающим и закрывающим тэгами пары. Что бы ни случилось с парой, открывающий тэг всегда должен находиться перед закрывающим.
<сегмент 3167>Log file (log.txt) for tracking operations and errors.<конец сегмента>
<f1>
и </f1>
являются парными тэгами и влияют на строку log.txt
.
OmegaT создаёт свои тэги до того, как применяется сегментирование по предложениям. В зависимости от правил сегментирования, тэги иногда могут перестать соблюдать вышеперечисленные правила нумерации и группировки.
<сегмент 1554> <f0>Before: \. After: \s</f0><конец сегмента>
Здесь всё в порядке. Теперь, если мы применим стандартные правила сегментирования (поведение OmegaT по умолчанию), то получим следующее:
<сегмент 1990> <f0>Before: \. <конец сегмента> <сегмент 1991> After: \s</f0><конец сегмента>
Здесь применяется правило сегментировать после точки с пробелом справа. В данном примере мы видим, что сегменты по отдельности не соблюдают правила парности и нумерации:<f0>
и </f0>
должны быть парой в одном сегменте, но правила сегментирования разделили их. Иногда это может вызвать проблемы в переводе, когда нужно перемещать тэги в переводе, чтобы отразить порядок слов языка перевода (см. ниже Операции с тэгами).
С тэгами нужно обращаться осторожно. Если их случайно изменить, может быть нарушено форматирование конечного файла. Разумным будет подход "Не чини то, что не сломано". Тем не менее, полезно знать свои возможности и то, как их можно использовать.
Чтобы дублировать группу тэгов, просто скопируйте их в желаемое место. Помните, что открывающий тэг всегда должен находиться перед закрывающим. Форматирование, представленное группой, которую вы дублировали, будет применено к тому месту, куда было произведено копирование.
Пример:
<сегмент 0001><f0>Это форматирование</f0> будет применено здесь.<конец сегмента>
После копирования:
<сегмент 0001><f0>Это форматирование</f0> было <f0>скопировано сюда</f0>.<конец сегмента>
Чтобы удалить группу тэгов, просто уберите её из сегмента. Помните, что нужно удалить как открывающие, так и закрывающие тэги и убедиться, что все следы форматирования действительно стёрты. Иначе переведённый файл может испортиться и не открываться. Удаляя группу тэгов, вы удаляете соответствующее форматирование из переведённого файла.
Пример:
<сегмент 0001><f0>Это форматирование</f0> будет удалено.<конец сегмента>
После удаления:
<сегмент 0001>Это форматирование было удалено.<конец сегмента>
Чтобы переместить группу тэгов в соответствии с другой структурой языка перевода, просто передвиньте группу туда, где она должна находиться в переводе. Форматирование переместится туда же.
Пример:
<сегмент 0001><f0>Форматирование ноль</f0> и форматирование один поменяются местами.<конец сегмента>
После изменений:
<сегмент 0001>Форматирование один и <f0>форматирование ноль</f0> поменялись местами.<конец сегмента>
Изменение групп тэгов может привести к тому, что одна группа будет вложена в другую. Это возможно только если внешняя группа полностью окружает вложенную. Нужно быть особенно осторожным при операциях с вложенными группами. Если пары тэгов не полностью переместились внутрь внешней группы, переведённый файл может испортиться и перестать открываться. К вложенной части будут применены оба форматирования.
Пример:
<сегмент 0001><f0>Форматирование</f0> один будет вложено внутрь форматирования ноль.<конец сегмента>
После вложения:
<сегмент 0001><f0>Форматирование один</f0> теперь вложено в форматирование ноль.<конец сегмента>
Перекрывание является результатом некорректных манипуляций с парами тэгов и практически всегда приводит к порче форматирования, а иногда и к тому, что переведённый файл перестаёт открываться вообще. Пример:
<сегмент 0001><f0>Форматирование</f0> один сейчас испортится.<конец сегмента>
После некорректных манипуляций:
<сегмент 0001><f0>Форматирование один</f0> успешно испорчено.<конец сегмента>
Функция проверки тэгов определяет измененные (намеренно или случайно) тэги и показывает затронутые сегменты. Вызов этой функции откроет диалоговое окно со всеми некорректными тэгами в документе.
Она полезна для выявления ошибок в переведённом тексте с тэгами. Часто файлы OpenDocument или OpenOffice.org невозможно открыть из-за проблем с тэгами, появившихся в процессе перевода. Исправление тэгов и пересоздание файлов перевода может решить проблему.
Чтобы открыть это окно, нажмите на Ctrl+T
.
Окно состоит из трёх столбцов:
Тэги выделены жирным шрифтом и синим цветом, чтобы можно было легко сравнить содержимое оригинала и перевода.
Щелкните по ссылке, чтобы активировать сегмент в окне редактирования.
При необходимости исправьте ошибку и нажмите Ctrl+T
, чтобы вернуться к окну проверки тэгов и исправить следующие ошибки.
Ошибки тэгов - это манипуляции с тэгами, которые не воспроизводят в тексте перевода тот же порядок и количество тэгов, что в исходном сегменте. Некоторые изменения тэгов необходимы и с ними приходится мириться, другие вызовут проблемы после создания переведённого документа.
Обычно тэги несут какую-то информацию о форматировании исходного текста. Упрощение форматирования исходного текста уменьшает количество тэгов.
Обычно тэги несут какую-то информацию о форматировании исходного текста. Упрощение форматирования исходного текста уменьшает количество тэгов. Если это возможно, постарайтесь унифицировать используемые шрифты, размеры, цвета и т.п., чтобы упростить перевод и уменьшить вероятность ошибок, связанных с тэгами. Прочитайте раздел Операции с тэгами, чтобы получить представление о том, что можно с ними делать. Имейте в виду, что если тэги вас раздражают, а форматирование не очень важно для текущей работы, то удаление из исходных документов всего форматирования весьма облегчит перевод.
Если вы хотите видеть тэги в OmegaT, но вам не нужно сохранять большую часть форматирования в переведённом документе, вы можете просто не добавлять тэги в перевод. В этом случае обратите особое внимание на пары тэгов, поскольку если вы забудете удалить одну из частей пары, то форматирование документа испортится, что сделает невозможным открытие документа в OpenOffice.org. Поскольку тэги являются частью текста, вы можете использовать Правила сегментирования, чтобы создавать сегменты с меньшим количеством тэгов. Это дополнительная функция и для её правильного применения необходим опыт.
Важно: в настоящее время OmegaT не умеет полностью автоматически определять ошибки в форматировании, поэтому не отличает ошибок от изменений, сделанных в рамках адаптации оформления под язык перевода. Иногда переведённый файл может выглядеть испорченным, а в случае с файлами OpenDocument / OpenOffice.org - даже отказаться открываться.