Pliki do przetłumaczenia

Języki pisane z prawej do lewej [RTL -right to left]

Formaty plików


Języki zapisywane z prawej do lewej

Wyrównywanie segmentów źródłowych i docelowych zależy od języków projektu. Domyślnie ustawiane jest wyrównywanie do lewej dla języków zapisywanych z lewej do prawej [LTR - left to right] i wyrównywanie do prawej dla języków zapisywanych z prawej do lewej [RTL -right to left]. Możesz przełączać się między różnymi trybami wyświetlania, wciskając Ctrl+Shift+O (litera O, nie cyfra 0). Przełączanie przy użyciu Shift+Ctrl+O ma trzy stany:Używanie trybu RTL w programie OmegaT nie ma żadnego wpływu na sposób wyświetlania przetłumaczonych dokumentów utworzonych za pomocą OmegaT. Sposób wyświetlania przetłumaczonych dokumentów będzie musiał zostać zmieniony w aplikacji używanej do ich wyświetlania lub zmieniania (szczegóły w odpowiednich podręcznikach). Użycie Ctrl+Shift+O powoduje zmianę na RTL zarówno wprowadzania tekstu, jak i wyświetlania w OmegaT. Może ono być używane oddzielnie dla wszystkich trzech okien (Edycja, Dopasowania rozmyte i Glosariusze) przez kliknięcie na oknie i przełączenie trybu wyświetlania. Może też być używane we wszystkich polach edycyjnych występujących w OmegaT (okno wyszukiwania, zasady segmentacji itd.). Uwaga: Mac OSX używa tego samego skrótu (a nie Cmd+Shift+O).

Łączenie zapisu LTR i RTL w segmentach

Podczas pisania czystego tekstu RTL może być używany domyślny widok (LTR). W wielu wypadkach jednak konieczne jest wstawienie tekstu LTR w tekst RTL. Dotyczy to na przykład znaczników OmegaT, nazw produktów, które muszą pozostać w języku źródłowym LTR, symboli zastępczych w plikach lokalizacyjnych i liczb w tekstach. W takich przypadkach staje się konieczne przełączenie na tryb RTL, tak aby tekst RTL (tak naprawdę dwukierunkowy) został wyświetlony poprawnie. Trzeba podkreślić, że kiedy OmegaT jest w trybie RTL, zarówno teksty źródłowe, jak i docelowe są wyświetlane w trybie RTL. Oznacza to, że jeśli język źródłowy jest LTR, a docelowy RTL lub odwrotnie, może być konieczne przełączanie się w tę i z powrotem pomiędzy trybami RTL a LTR, aby przeglądać tekst źródłowy i wprowadzać tekst docelowy w odpowiadających im trybach.

Znaczniki OmegaT w segmentach RTL

Jak napisano powyżej, znaczniki OmegaT to ciągi znaków LTR. Podczas tłumaczenia pomiędzy językami RTL i LTR, prawidłowe czytanie znaczników ze źródła i prawidłowe wprowadzanie ich do tekstu docelowego może wymagać od tłumacza przełączania się wiele razy pomiędzy trybami LTR a RTL.

Jeżeli dokument na to pozwala, jest zalecane, aby tłumacz usunął informacje o stylach z oryginalnego dokumentu, tak aby jak najmniej znaczników pojawiło się w interfejsie OmegaT. Postępuj według zaleceń podanych w rozdziale "Podpowiedzi dotyczące zarządzania znacznikami". Często przeprowadzaj walidację znaczników (patrz Walidacja znaczników) i twórz dokumenty docelowe (patrz poniżej i Menu) w regularnych odstępach, aby ułatwić wychwycenie jakichkolwiek pojawiających się problemów. Można też przetłumaczyć tekst w postaci niesformatowanej, a później dodać potrzebny styl w odpowiedniej aplikacji.

Tworzenie przetłumaczonych dokumentów RTL

Kiedy tworzony jest dokument docelowy, kierunek wyświetlania tekstu będzie w nim taki sam jak w oryginalnym dokumencie. Jeżeli oryginalny dokument był LTR, kierunek wyświetlania dokumentu docelowego musi zostać zmieniony ręcznie na RTL w aplikacji, w której jest oglądany. Każdy format wyjściowy ma specyficzny sposób radzenia sobie z wyświetlaniem RTL; szczegóły w podręcznikach odpowiednich aplikacji.

Aby uniknąć zmieniania parametrów wyświetlania plików docelowych za każdym razem, kiedy te pliki są otwierane, czasem można zmienić parametry wyświetlania plików źródłowych, tak aby te parametry zostały przeniesione na pliki docelowe. Takie zmiany są możliwe na przykład w plikach OpenOffice.org.


Formaty plików

Przy użyciu programu OmegaT można tłumaczyć pliki w różnych formatach. Występują dwa podstawowe rodzaje formatów pliku, tekst niesformatowany i tekst sformatowany.

Pliki tekstowe niesformatowane (znakowe)

Niesformatowane pliki tekstowe zawierają tylko tekst, więc ich tłumaczenie polega tylko na wpisaniu tłumaczenia. Jest wiele metod określania kodowania pliku, tak aby jego zawartość nie została przekręcona, kiedy jest otwierany w OmegaT. Takie pliki nie zawierają żadnej informacji o formatowaniu poza "białymi znakami" używanymi do wyrównywania tekstu, wyodrębniania akapitów lub rozdzielania stron. Nie mogą one zawierać informacji dotyczącej koloru, czcionki itd. Aktualnie, OmegaT obsługuje następujące formaty tekstu niesformatowanego:

Inne typy plików tekstowych niesformatowanych mogą być przetwarzane w OmegaT przez powiązanie ich rozszerzenia z obsługiwanym typem pliku (na przykład, pliki .pod mogłyby być powiązane z filtrem ASCII) i ich wstępne przetworzenie z użyciem odpowiednich zasad segmentacji.

Pliki tekstowe sformatowane

Pliki tekstowe sformatowane zawierają tekst oraz informacje takie jak rodzaj i rozmiar czcionki, kolor itd. Są one zwykle tworzone przez edytory tekstu lub edytory stron internetowych. Takie formaty plików są tworzone w ten sposób, aby przechowywały informację o formatowaniu. Informacja o formatowaniu może być prosta, jak np. to jest tekst pogrubiony, lub złożona, jak dane w tabeli z różnymi rozmiarami czcionek, kolorami, położeniem itd. W większości prac tłumaczeniowych ważne jest, żeby przetłumaczony dokument wyglądał podobnie do oryginalnego. OmegaT pozwala to uzyskać przez zaznaczanie znaków/słów mających specjalne formatowanie przy pomocy łatwych w obsłudze znaczników. Uproszczenie formatowania tekstu oryginalnego znacząco przyczynia się do zmniejszenia liczby znaczników. Należy rozważyć, jeśli to możliwe, ujednolicenie stosowanych rodzajów czcionek, rozmiarów czcionek, kolorów itd., aby uprościć tłumaczenie i zmniejszyć liczbę możliwych błędów znaczników. Każdy typ pliku jest inaczej obsługiwany w OmegaT. Specyficzne postępowanie może być ustawione w filtrach plików. Aktualnie, OmegaT obsługuje następujące formaty tekstu sformatowanego:

Inne typy plików tekstowych sformatowanych mogą być przetwarzane w OmegaT przez powiązanie ich rozszerzenia z obsługiwanym typem pliku i ich wstępne przetworzenie z użyciem odpowiednich zasad segmentacji.

Inne formaty plików

Inne formaty plików tekstowych niesformatowanych lub sformatowanych mogą również być przetwarzane w OmegaT.

Można użyć zewnętrznych narzędzi, aby przekonwertować pliki do obsługiwanych formatów. Należy pamiętać, że przetłumaczone pliki muszą być przekonwertowane z powrotem do oryginalnego formatu. W ten sposób wiele formatów tekstu niesformatowanego (w tym LaTex itd.) można przetłumaczyć w programie OmegaT poprzez konwersję na format PO. Podobnie, wiele formatów tekstu sformatowanego (w tym pliki Microsoft Office) można przetłumaczyć w programie OmegaT poprzez konwersję na format Open Document.

Jakość pliku przetłumaczonego będzie zależała od jakości konwersji w obie strony. Upewnij się, że sprawdziłeś wszystkie możliwości przed rozpoczęciem takich konwersji. Dostępne wolne narzędzia konwersji:


OpenOffice.org
Oficjalna strona OpenOffice.org

OmegaT nie oferuje bezpośredniej obsługi formatów Microsoft Office Word, Excel i Power Point. OpenOffice.org (i warianty) może jednak być używany do konwersji tych formatów na format OpenDocument, który OmegaT bezpośrednio obsługuje.

Okapi Framework
Okapi for Mono
, podręcznik

Narzędzie Text Extraction Utility w Okapi Framework ma opcję tworzenia drzewa katalogów projektu OmegaT. Możliwe jest także stworzenie pliku XLIFF specyficznego dla OmegaT. Implementacja Java Okapi Framework jest dostępna w Okapi.opentag.com.

Translate Toolkit
Oficjalna strona Translate Toolkit

Translate Toolkit, zestaw narzędzi python, dostarcza użytkownikom wiele konwerterów formatu Portable Object, w tym dla Mozilla .properties i plików dtd, plików CSV, plików Qt .ts, plików XLIFF. Zawiera on wiele narzędzi do przetwarzania takich plików przed lub po ich tłumaczeniu w OmegaT.

Po4a
Oficjalna strona po4a

po4a jest narzędziem Debiana napisanym w języku perl. Umożliwia ono konwersję takich formatów plików jak LaTeX, TeX, POD itd. do i z formatu Portable Object.


Uwagi prawne Spis treści Indeks