文字列検索と分節化規則で使用する正規表現は、Javaがサポートしているものです。より詳細な情報については http://java.sun.com/j2se/1.5.0/ja/docs/ja/api/java/util/regex/Pattern.html を参照してください。以下の構文一覧と使用例も参照してください。
フラグ |
文字 |
引用 |
Unicode ブロックとカテゴリのクラス |
文字クラス |
定義済みの文字クラス |
境界正規表現エンジン |
最長一致数量子 |
最短一致数量子 |
論理演算子 |
正規表現関連ツールとその使用例 |
構文 |
一致対象 |
フラグ |
|
|
大文字と小文字を区別しない一致を有効にします。(デフォルトでは大文字と小文字を区別します) |
文字 |
|
|
文字 x(以下に示すもの以外) |
|
16 進値 |
|
タブ文字( |
|
改行(ラインフィード、LF)文字( |
|
キャリッジリターン(CR)文字( |
|
用紙送り文字( |
|
警告 (ベル) 文字( |
|
エスケープ文字( |
|
x に対応する制御文字 |
|
8 進値 |
|
8 進値 |
|
8 進値 |
|
16 進値 |
引用 |
|
|
次の文字をエスケープします。以下のメタ文字( |
|
例えば、この構文ではバックスラッシュ文字を表します |
|
|
|
|
Unicode ブロックとカテゴリのクラス |
|
|
ギリシャ語ブロックの文字(単純 ブロック) |
|
大文字(単純 カテゴリ) |
|
通貨記号 |
|
ギリシャ語ブロック以外の文字(否定) |
|
大文字以外の文字(減算) |
文字クラス |
|
|
|
|
|
|
|
定義済みの文字クラス |
|
|
任意の文字(行末記号を除く) |
|
数字: |
|
数字以外: |
|
空白文字: |
|
非空白文字: |
|
単語構成文字: |
|
非単語文字: |
境界正規表現エンジン |
|
|
行の先頭 |
|
行の末尾 |
|
単語境界 |
|
非単語境界 |
最長一致数量子 |
|
指定した文字となるべく多い文字数で一致します。例えば |
|
X |
X、1 または 0 回 |
X |
X、0 回以上 |
X |
X、1 回以上 |
最短一致数量子 |
|
指定した文字となるべく少ない文字数で一致します。例えば |
|
X |
X、1 または 0 回 |
X |
X、0 回以上 |
X |
X、1 回以上 |
論理演算子 |
|
XY |
X の直後に Y |
X |
X または Y |
|
XY を 1 つのグループとして扱います |
正規表現の便利な構文例は、OmegaT 自体にも含まれています。([設定]→[分節化規則...] を参照してください)以下は、特に翻訳メモリを検索する場合に便利な正規表現の一覧です:
正規表現 | 以下に一致します: |
(\b\w+\b)\s\1\b |
重複している単語 |
[\.,]\s*[\.,]+ | カンマとピリオドが連続している箇所 |
\. \s$ | 末尾がピリオドで終わる文章の後の、余分な空白 |
\s+a\s+[aeiou] | 英語:母音で始まる単語の前に "an" でなく "a" がある箇所 |
\s+an\s+[^aeiou] | 英語:子音で始まる単語の前に "a" でなく "an" がある箇所 |
\s\s+ | 2 個以上の空白 |
\.[A-Z] | ピリオドと次の文章の間に空白がない箇所 |
法律上の表示 | ホーム | 索引 |