翻訳対象ファイル

右から左へ表記する言語

ファイル形式


右から左へ表記する言語

原文と訳文の分節の行端寄せをどうするかは、プロジェクトの言語によって変わります。デフォルトでは、左から右へ表記する(LTR)言語は左寄せ、右から左へ表記する(RTL)言語は右寄せです。Ctrl+Shift+O(アルファベットの O です。数字の 0 ではありません)を押すと、この表示を切り替えることができます。Ctrl+Shift+O による切り替えは以下の 3 通りです: OmegaT で RTL モードを使用しても、作成した訳文ファイルの表示モードには何の影響も与えません。訳文ファイルの表示モードは、表示や変更に使用するアプリケーションの中で修正する必要があります。(詳細は、そのアプリケーションのマニュアルのうち、関連する箇所を参照してください。)Ctrl+Shift+O を押すと、OmegaT 内のテキスト入力と表示の両方を、上記の 3 通りのいずれかに順に切り替えます。編集、参考訳文、用語集の3つのペインをクリックすることで、それぞれの表示モードを切り替えることができます。また、OmegaT にある全ての入力フィールド(文字列検索ウィンドウや分節化設定ウィンドウなど)でも使用できます。ご注意:Mac OS X でも同じ Ctrl+Shift+O を使用します。(Cmd+Shift+O ではありません。)

分節中での LTR(左から右) と RTL(右から左) 文字列の混在

右から左へ表記する文章を入力している時は、デフォルトの(左から右への)表記が使用されます。しかし多くの場合、RTL 文章中に LTR 文章を混在させる必要が出てきます。例えば、 OmegaT が使用するタグ文字列、原文ファイルで LTR 表記された製品名、翻訳ファイル中のプレースホルダー、あるいは文章中の数値などです。このような場合、RTL(実際は両方向の)文章を適切に表示するため、RTL モードに切り替える必要があります。OmegaT が RTL モードであるときは、原文と訳文の両方が RTL モードで表示される点にご注意ください。つまり、仮に原文言語が LTR で訳文言語が RTL、またはその逆の場合を考えます。このとき、原文の確認、訳文の入力をそれぞれのモードでスムーズに行えるよう、RTL と LTR モードの切り替えを繰り返しながら作業する必要も出るかもしれません。

RTL 分節における OmegaT タグ

上で述べたように、OmegaT が使用するタグは LTR 文字列です。RTL ⇔ LTR 言語間で翻訳作業を行うときは、原文ファイルからタグを正しく読み込み、訳文ファイルに適切に入力するため、翻訳作業者が RTL ⇔ LTR モードの切り替えを何度もする必要があるかもしれません。

対象の文書によりますが、翻訳者に強くお勧めする点があります。原文の構成が許す限り、OmegaT 上に出てくるタグを減らすために、原文の見栄えを単純化する点です。「整形されたテキストを扱う」ページ末尾の「タグの取扱についてのヒント」を参照してください。起こりうる問題をなるべく見つけやすくするために、こまめにタグ検証(タグ検証 を参照してください)を実行し、定期的に訳文生成(下記および メニュー を参照してください)を実行してください。翻訳作業時はプレーンテキスト形式で行い、関連したアプリケーションで必要なスタイル情報を後で追加することもできます。

翻訳した RTL 文書の作成

訳文ファイルが生成されると、その表記方向は原文ファイルと同じになります。もし原文が LTR であった場合、訳文の表記方向は、表示するアプリケーション上で、手動で RTL に変更する必要があります。それぞれの出力形式によって、RTL 表記を取り扱う方法が定まっています。詳細は、その関連したアプリケーションのマニュアルを参照してください。

ファイルが開かれるたびに訳文の表示設定が変わってしまうのを避けるために、訳文ファイルの表示設定を引き継ぐように原文ファイルの表示設定を行っておくことが可能な場合もあります。たとえば OpenOffice.org のファイルはこのような変更が可能です。


ファイル形式

OmegaT を使用すると数多くのファイル形式に対応した文書の翻訳が行えます。その形式には基本的に2種類あります。プレーンテキスト 形式と 整形されたテキスト 形式です。

プレーンテキストファイル

プレーンテキストファイルにはテキストのみが含まれます。したがってその翻訳は通常の文章入力と同じように、単純に行えます。 OmegaT で開く際に文字化けを起こさないよう、ファイルのエンコードを指定する いくつかの方法 があります。このようなファイルは、いわゆる通常テキストにおける "空白" 以外には、テキストの整形、段落の指定、改ページなどの情報を含んでいません。テキストの色や字体種類の情報を含ませることはできません。現在の OmegaT は、プレーンテキストファイルのうち以下の形式に対応しています:

他の形式のプレーンテキストファイルの場合、その拡張子を OmegaT が対応できる形式に 関連づけ を行っておき(たとえば .pod ファイルを ASCII テキストフィルタに関連づけるなど)、分節化規則 によって前処理を行うと、OmegaT で扱うことができます。

整形されたテキストファイル

整形されたテキストファイルは、字体の種類やサイズ、色などの情報を含んでいます。ワードプロセッサやホームページエディタでよく作成される情報です。このようなファイル形式は文書整形に関する情報を保持しているものと考えられています。その中には、 文字を太字にする ような単純なものから、異なる字体のサイズ、色、位置などを含む表のような複雑なものまでがあります。ほとんどの翻訳作業において、翻訳後の文書の見た目を原文と同じ状態にしておくことは重要であると考えられます。OmegaT では、そのような特別な形式を持つ文字列や単語に タグ をつけることで、それらに対応することができます。原文テキストの形式を単純にしておくと、文書全体のタグ数の減少につながります。もし可能であれば、文書中で使用する字体の種類、サイズ、色などをなるべく統一しておくと、翻訳作業を単純化でき、起こりうるタグ関連のエラーを減らすことができます。 OmegaT は、ファイル形式ごとに異なる対処をします。ファイルフィルタ の設定でそれらを管理できます。現在の OmegaT は、整形されたテキストファイルのうち以下の形式に対応しています:

他の形式の整形されたテキストファイルの場合、その拡張子を OmegaT が対応できる形式に 関連づけ を行っておき、分節化規則 によって前処理を行うと、OmegaT で扱うことができます。

その他のファイル形式

上記以外のプレーンテキストファイル、または整形されたテキストファイルの場合も、OmegaT で処理できる可能性があります。

対応した形式に変換するような外部ツールの使用が考えられます。翻訳された後のファイルは、最終的には、原文ファイルの形式に戻して変換する必要があることを覚えておいてください。この方法で、数多くのプレーンテキスト形式(LaTeX などを含む)は、PO 形式に変換すると OmegaT で翻訳できます。同様に、数多くの整形されたテキスト形式(Microsoft Office ファイルを含みます)は、Open Document 形式に変換することで OmegaT で翻訳できます。

訳文ファイルの品質は、往復の変換作業内容の質によって決まります。変換作業の前に、可能な限りのすべての設定を試すことをおすすめします。自由に利用できる変換ツールは以下のとおりです。:


OpenOffice.org
OpenOffice.org 公式サイト

OmegaT は Microsoft Office 形式(Word、Excel、Power Point)には直接は対応していません。しかし、このような形式のファイルを、OpenOffice.org を使用してOpenDocument 形式に変換することで、OmegaT が対応できる形式にできます。

Okapi フレームワーク
Okapi for Mono
チュートリアル

Okapi フレームワークに含まれるテキスト抽出ユーティリティを使用すると OmegaT プロジェクトのフォルダ構造を作成することができます。OmegaT が対応した XLIFF ファイルを作成することもできます。Okapi フレームワークは Okapi.opentag.com からダウンロードできます。

Translate Toolkit
Translate Toolkit 公式サイト

Translate Toolkit は Python ツールのセットです。Mozilla .properties や dtd ファイル、CSV ファイル、Qt .ts ファイル、XLIFF ファイルなどの Portable Object 形式を扱える多くの変換ツールが提供されています。このようなファイルを OmegaT で処理する前、または、処理した後に使用できる多くのツールが含まれています。

Po4a
po4a 公式サイト

po4a は Debian perl ツールの1つです。LaTeX、TeX、POD などの形式と Portable Object 形式との間で変換が行えます。


法律上の表示 ホーム 索引