Woordenlijsten zijn bestanden die handmatig gemaakt en bijgewerkt worden voor gebruik in OmegaT.
Als een project in OmegaT één of meer woordenlijsten bevat, worden termen uit de woordenlijst die ook worden gevonden in het huidige segment automatisch weergegeven in het venster Woordenlijst.
U definieert de locatie ervan in het dialoogvenster Projecteigenschappen. De extensie moet .txt
zijn (indien niet zal die worden toegevoegd). De locatie van het bestand moet liggen binnen de map /glossary
, maar het mag in een diepere map staan (bijv. glossary/sub/glossary.txt
). Het bestand hoeft niet te bestaan als het wordt ingesteld, het zal worden gemaakt (indien nodig) bij het toevoegen van
een item voor de woordenlijst. Als het bestand al bestaat, wordt er geen poging gedaan om de indeling of de tekenset van het
bestand te verifiëren: de nieuwe items zullen altijd in de indeling tab-gescheiden en UTF-8 zijn. Omdat de bestaande inhoud
niet wordt geraakt, zal schade aan een bestaand bestand beperkt zijn.
Plaats een bestaande woordenlijst eenvoudigweg in de map /glossary
, na het maken van het project, om die te gebruiken. OmegaT detecteert automatisch woordenlijstbestanden in deze map als een project wordt geopend. Termen in het huidige segment die
OmegaT vindt in het/de woordenlijstbestand(en) worden weergegeven in het venster Woordenlijst:
Het woord voor het =-teken is de bronterm en de vertaling is (of zijn) de woorden na =. Het woordenlijst-item kan een opmerking toegevoegd hebben (zie "bedrijvend werkwoord" voor het tweede item). De functie woordenlijst vindt alleen exacte overeenkomsten met het woordenlijst-item (bijv. vindt geen afgeleide vormen etc.). Nieuwe termen kunnen handmatig aan de woordenlijstbestanden worden toegevoegd tijdens het vertalen (bijvoorbeeld in een tekstverwerkingsprogramma), maar nieuw toegevoegde termen worden niet herkend totdat het project opnieuw wordt geladen.
De bronterm behoeft geen item met één woord te zijn, zoals het volgende voorbeeld laat zien:
Het onderstreepte item "pop-upmenu" kan worden gevonden in het venster Woordenlijst als "pojavni menu". Door het te accentueren in het venster Woordenlijst en er dan met rechts op te klikken voegt het in op de cursorpositie in het doelsegment.[1]
Woordenlijstbestanden zijn eenvoudige platte tekst-bestanden die drie-kolommen, tabgescheiden lijsten bevatten met de bron- en doeltermen in respectievelijk de eerste en tweede kolom. De derde kolom kan worden gebruikt voor aanvullende informatie. Woordenlijstbestanden kunnen of in de standaard systeemcodering (en aangegeven door de extensie .tab) zijn of in UTF-8 (de extensie .utf8). De codering Unicode (UTF8) wordt om voor de hand liggende redenen geprefereerd.
Ook het CSV-formaat wordt ondersteund. Dit formaat is hetzelfde als de tabgescheiden: bronterm, doelterm. Velden met opmerkingen worden gescheiden door een komma ','. Tekenreeksen kunnen worden omsloten door aanhalingstekens ", die het mogelijk maken een komma binnen een tekenreeks te hebben:
"This is a source term, which contains a comma","Dit is een bronterm, die een komma bevat"
In aanvulling op het platte tekst-formaat, wordt TBX-formaat ook ondersteund. TBX - Term Base eXchange - is de open, op XML gebaseerde standaard voor de uitwisseling van gestructureerde terminologische gegevens. TBX is goedgekeurd als een internationale standaard door LISA en ISO. Als u een bestaand systeem hebt voor de afhandeling van terminologie - MultiTerm bijvoorbeeld - is het zeer wel mogelijk dat het de mogelijkheid biedt om gegevens van terminologie in TBX-formaat te exporteren. Microsoft Terminology Collection kan worden gedownload in bijna 100 talen en kan dienen als hoeksteen IT-woordenlijst.
De projectinstellingen maken het mogelijk een naam in te voeren voor een te beschrijven woordenlijstbestand (zie het begin van dit hoofdstuk). Toevoegen van nieuwe items wordt gedaan met behulp van de sneltoets voor het toetsenbord Ctrl+Shift+G. Een dialoogvenster opent en maakt het u mogelijk maken een bronterm, doelterm en opmerkingen die u zou kunnen hebben in te voeren:
De inhoud van bestanden met woordenlijsten worden in het geheugen bewaard en geladen als het project wordt geopend of opnieuw geladen. Bijwerken van een woordenlijstbestand is dus vrij eenvoudig: druk op Ctrl+Shift+G en voer de nieuwe term in, de vertaling ervan en opmerkingen die u zou kunnen hebben (zorg er voor dat u op 'tab' drukt tussen de velden) en sla het bestand op. De inhoud van het venster Woordenlijst zal overeenkomstig worden bijgewerkt.
Opmerking: Natuurlijk zijn er andere wegen en manieren om een eenvoudig bestand met tabgescheiden items te maken, en zij zijn allemaal
eenvoudiger, en veel er van een heel stuk eenvoudiger dan bovenstaande suggestie. Men kan bijvoorbeeld de inhoud hierboven
exporteren als een CSV
, in plaats van als een UTF8
-tekstbestand. Er is niets tegen het gebruiken van Notepad++ op Windows of GEdit op Linux bijvoorbeeld: elke tekstverwerker
die UTF8 kan afhandelen en witruimte weer kan geven (zodat de vereiste TAB-tekens u niet ontgaan) kan worden gebruikt.
Woordenlijsten die zijn geëxporteerd vanuit Trados Multiterm kunnen zonder verdere aanpassingen worden gebruikt als woordenlijsten
voor OmegaT, vooropgesteld dat zij de bestandsextensie .tab
hebben gekregen en de velden voor bron- en doelterm respectievelijk de eerste twee velden zijn. Indien u exporteert met behulp
van de systeemoptie "Tabgescheiden exporteren", moet u de eerste 5 kolommen verwijderen (Seq. Nr, Date created etc). De nieuwere
versies van MultiTerm ondersteunen het exporteren naar TBX-formaat.
Probleem: Er worden geen items van de woordenlijst weergegeven - mogelijke oorzaken:
Geen bestand met woordenlijst gevonden in de map "glossary".
Het bestand met de woordenlijst is leeg.
De items worden niet gescheiden door een TAB-teken.
Het bestand met de woordenlijst heeft niet de juiste extensie (.tab of .utf8).
Er bestaat geen EXACTE overeenkomst tussen het item in de woordenlijst en de brontekst in uw document - bijvoorbeeld als het item meervoud is.
Het bestand met de woordenlijst heeft niet de juiste codering.
Er staan in het huidige segment geen termen die overeenkomen met enige term in de woordenlijst.
Eén of meer van bovenstaande problemen kan zijn gerepareerd, maar het project werd nog niet herladen.
Probleem: In het venster Woordenlijst worden sommige tekens niet juist weergegeven
...maar dezelfde tekens worden wel goed weergegeven in het venster Bewerken: de extensie en de codering van het bestand komen niet overeen.
[1] Onthoud dat in het bovenstaande geval, dit slechts het halve verhaal (of zelfs nog minder is) is, omdat de doeltaal (Sloveens) verbuigingen gebruikt. Het ingevoegde "pojavni meni" moet dus worden gewijzigd naar "pojavcnem meniju". Met andere woorden: het typen van de juiste term, zonder te accentueren en met rechts te klikken, is waarschijnlijk sneller.