Trados - separátor segmentů Thread poster: Milan Sochor
| Milan Sochor Czech Republic Local time: 04:02 German to Czech + ...
Vážení kolegové,
prosil bych o radu: Zákazník chce přeložit DOC soubor, který údajně vytvořil konverzí z PDF. DOC soubor má ale "tvrdé" konce řádků - jako když se psalo na psacím stroji, to znamená, že se ve Wordu, když zvolím "Zobrazit vše", objeví na konci řádku znak pro odřádkování (bohužel to sem nedokážu překopírovat).
Když takový text překládám Tradosem, tak výchozí segment skončí tímto odřádkováním a nikoli koncem věty, tak... See more Vážení kolegové,
prosil bych o radu: Zákazník chce přeložit DOC soubor, který údajně vytvořil konverzí z PDF. DOC soubor má ale "tvrdé" konce řádků - jako když se psalo na psacím stroji, to znamená, že se ve Wordu, když zvolím "Zobrazit vše", objeví na konci řádku znak pro odřádkování (bohužel to sem nedokážu překopírovat).
Když takový text překládám Tradosem, tak výchozí segment skončí tímto odřádkováním a nikoli koncem věty, takže je efektivita Tradosu značně snížena.
Mám takový pocit, že ve starších verzích Tradosu to šlo nějak nastavit, i když jsem to nezkoušel. Jde to v Tradosu 2011? Nebo to můžu nějak ovlivnit ve Wordu? Děkuji za každou radu.
Milan ▲ Collapse | | | Vladimír Hoffman Slovakia Local time: 04:02 Member (2009) Ingiriisi to Slovak + ... No, toto nie je uplne banalna uloha, | Sep 30, 2012 |
ale riesit sa da. Ja postupujem takto:
1. Vo Worde CTRL+F a do okienka Hladat vlozit znak pre koniec riadku /ta zahnuta sipka vpravo/, do okienka Nahradit cim znak pre koniec odseku /Vybrat zo specialnych znakov alebo ^p/. To je jednoduchy zaciatok, ak to problem nevyriesi /cize ak budu riadky zalomene niekde v polovicke/, pokracujeme dalej.
Napiste, ci to funguje, tento problem riesim velmi casto pri vytvarani pamati z textov prevzatych z webu, takze na to mam vyporac... See more ale riesit sa da. Ja postupujem takto:
1. Vo Worde CTRL+F a do okienka Hladat vlozit znak pre koniec riadku /ta zahnuta sipka vpravo/, do okienka Nahradit cim znak pre koniec odseku /Vybrat zo specialnych znakov alebo ^p/. To je jednoduchy zaciatok, ak to problem nevyriesi /cize ak budu riadky zalomene niekde v polovicke/, pokracujeme dalej.
Napiste, ci to funguje, tento problem riesim velmi casto pri vytvarani pamati z textov prevzatych z webu, takze na to mam vyporacovany postup.
Milan Sochor wrote:
Vážení kolegové,
prosil bych o radu: Zákazník chce přeložit DOC soubor, který údajně vytvořil konverzí z PDF. DOC soubor má ale "tvrdé" konce řádků - jako když se psalo na psacím stroji, to znamená, že se ve Wordu, když zvolím "Zobrazit vše", objeví na konci řádku znak pro odřádkování (bohužel to sem nedokážu překopírovat).
Když takový text překládám Tradosem, tak výchozí segment skončí tímto odřádkováním a nikoli koncem věty, takže je efektivita Tradosu značně snížena.
Mám takový pocit, že ve starších verzích Tradosu to šlo nějak nastavit, i když jsem to nezkoušel. Jde to v Tradosu 2011? Nebo to můžu nějak ovlivnit ve Wordu? Děkuji za každou radu.
Milan
▲ Collapse | | | Milan Sochor Czech Republic Local time: 04:02 German to Czech + ... TOPIC STARTER
Vladímíre - zdravím a děkuji.
Omlouvám se, že reaguji se zpožděním, ale celou tu dobu hledám možnosti, ale nic mně nefunguje.
Vypadá to logicky,
ale nějak se mě nedaří vložit příslušné znaky.
Můj postup:
Ve Wordu kliknu napravo na "Najít" /za symbolem dalekohledu/
Kliknu na "Vložení" pak "Symbol", podsada "Západoevropská latinka-dodatek" najdu si znak ¶, ten se mi vloží do Word souboru, ten nakopíruji do sloupce vlevo pod "Navi... See more Vladímíre - zdravím a děkuji.
Omlouvám se, že reaguji se zpožděním, ale celou tu dobu hledám možnosti, ale nic mně nefunguje.
Vypadá to logicky,
ale nějak se mě nedaří vložit příslušné znaky.
Můj postup:
Ve Wordu kliknu napravo na "Najít" /za symbolem dalekohledu/
Kliknu na "Vložení" pak "Symbol", podsada "Západoevropská latinka-dodatek" najdu si znak ¶, ten se mi vloží do Word souboru, ten nakopíruji do sloupce vlevo pod "Navigace" , ale neobjeví se mě žádný výskyt. Když tento znak nakopíruji přimo v "postiženém" textu a vložím pod "Navigace", neobjeví se v okénku vůbec nic a výskyt taky žádný.
Když jsem zvolil v Najít možnost rozšířené hledání a vkládal jsem různé pod "Zvláštní",tak jediný znak, který našel odpovídající počet výskytů byl ^p-Znak konce odstavce; znak ^l - ručně zadaný počet řádků, ani ^v- znak odstavce, což je v tabulce možností zobrazeno také jako ¶ , nepřinesly nic.
Takže možná ^p-znak konce odstavce je to, co hledám, ale nevím, čím to nahradit.
Mám Word 2010.
Milan ▲ Collapse | | | Vladimír Hoffman Slovakia Local time: 04:02 Member (2009) Ingiriisi to Slovak + ... Je to ten znak konca odstavca, | Sep 30, 2012 |
^p. Do Najit dajte ^l /to je manualny zlom riadku/, do Nahradit ^p /to je znak konca odstavca/. Potom si upraveny text oznacte, dajte ho zarovnat k okraju (Cez Format/Odsek) a dajte si zobrazovat skyte znaky (ikonka ¶ na liste). Hned uvidite, ci to zabralo, ked nie, skusime dalej.
Ja by som vam to kludne urobil sam, nie je to tazke, ale teraz dost nestiham s prekladom. Pozriem sa sem o dve hodiny, dajte vediet ako to vyslo.
Milan Sochor wrote:
Vladímíre - zdravím a děkuji.
Omlouvám se, že reaguji se zpožděním, ale celou tu dobu hledám možnosti, ale nic mně nefunguje.
Vypadá to logicky,
ale nějak se mě nedaří vložit příslušné znaky.
Můj postup:
Ve Wordu kliknu napravo na "Najít" /za symbolem dalekohledu/
Kliknu na "Vložení" pak "Symbol", podsada "Západoevropská latinka-dodatek" najdu si znak ¶, ten se mi vloží do Word souboru, ten nakopíruji do sloupce vlevo pod "Navigace" , ale neobjeví se mě žádný výskyt. Když tento znak nakopíruji přimo v "postiženém" textu a vložím pod "Navigace", neobjeví se v okénku vůbec nic a výskyt taky žádný.
Když jsem zvolil v Najít možnost rozšířené hledání a vkládal jsem různé pod "Zvláštní",tak jediný znak, který našel odpovídající počet výskytů byl ^p-Znak konce odstavce; znak ^l - ručně zadaný počet řádků, ani ^v- znak odstavce, což je v tabulce možností zobrazeno také jako ¶ , nepřinesly nic.
Takže možná ^p-znak konce odstavce je to, co hledám, ale nevím, čím to nahradit.
Mám Word 2010.
Milan | |
|
|
Milan Sochor Czech Republic Local time: 04:02 German to Czech + ... TOPIC STARTER
Děkuji Vladimíre,
ale když zadám ^l - manuální zlom řádku a vyhledání, tak mi to nic nenajde, takže to ani nemůže nic nahradit. Když zadám vyhledat ^p-znak konce odstavce a nahradit (třeba)mezerou, tak mě sice manuální zlomy odstraní, ale také všechny skutečné konce odstavce, které tam mají zůstat, což je sice o něco málo lepší, ale taky to moc neřeší.
Moc děkuji za snahu
Milan | | | Priprava dokumentu | Sep 30, 2012 |
V danem pripade bych nejprve pripravil odstavce, ktere tam maji zustat, tzn. prechodne nahradit tyto znaky (tam kde skutecne je odstavec!) budto rucne nebo pres hledat/nahradit libovolnym znakem, napr. $$
Potom nahradit zbyvajici znaky konec odstavce (rucne zalomene radky) mezerou.
V zaveru pak vratit $$ zpet na znak konec odstavce.
Pokud je dokument vytvoren z PDF, mohou tam byt jeste dalsi zaludnosti (tagy kolem mezer apod.). Nez zacnu prekladat, tak si takovy doument radeji ... See more V danem pripade bych nejprve pripravil odstavce, ktere tam maji zustat, tzn. prechodne nahradit tyto znaky (tam kde skutecne je odstavec!) budto rucne nebo pres hledat/nahradit libovolnym znakem, napr. $$
Potom nahradit zbyvajici znaky konec odstavce (rucne zalomene radky) mezerou.
V zaveru pak vratit $$ zpet na znak konec odstavce.
Pokud je dokument vytvoren z PDF, mohou tam byt jeste dalsi zaludnosti (tagy kolem mezer apod.). Nez zacnu prekladat, tak si takovy doument radeji vzdy v TagEditoru prochazim a pripadne se jeste vratim a doupravim original. Myslim, ze je lepsi venovat priprave dokumentu tech par minut navic, nez se pak trapit mnozstvim zbytecnych tagu. ▲ Collapse | | | PlusTools v MS Wordu | Sep 30, 2012 |
Milan Sochor wrote:
Jde to v Tradosu 2011? Nebo to můžu nějak ovlivnit ve Wordu? Děkuji za každou radu.
Milan
Ze stránek www.wordfast.net je možno stáhnout PlusTools.dot. Tato šablona umí vyextrahovat do DOCu text bez fontů nebo s fonty.
Pro úpravu formátováni odstavců a segmentů, stačí spustit MS Word + PlusTools, otevřít soubor a zašktnout jej. Na stránce Conv (konverze) stisknout tlačítko vpravo dole "Recreate paragraphs in current doc" .
Pokud nepotřebuji formátování a stačí mi jen segmentace, tak buď na extrakci do textu použiji LF Aligner. Další možností je uložit otevřený PDF (pokud jej mám) jako TXT a uložit jako UTF-8.
Tuto metodu jsem použil pro strojový překlad studií EU, všechno to jsou PDF
http://www.condak.net/lekce/eu-q-manag/encs/001.html
S pozdravem,
Milan Čondák | | | Vladimír Hoffman Slovakia Local time: 04:02 Member (2009) Ingiriisi to Slovak + ...
Toto je to pokracovanie, keby prvy postup nezabral. Splietlo ma, ze kolega hovoril o "tvrdych koncoch riadkov".
Daniel Meier wrote:
V danem pripade bych nejprve pripravil odstavce, ktere tam maji zustat, tzn. prechodne nahradit tyto znaky (tam kde skutecne je odstavec!) budto rucne nebo pres hledat/nahradit libovolnym znakem, napr. $$
Potom nahradit zbyvajici znaky konec odstavce (rucne zalomene radky) mezerou.
V zaveru pak vratit $$ zpet na znak konec odstavce.
| |
|
|
Milan Sochor Czech Republic Local time: 04:02 German to Czech + ... TOPIC STARTER
Děkuji všem kolegům, kteří se v neděli zabývali mým problémem.
Vyzkouším vše, bohužel však dnes musím (pro stejného zákazníka) dokončit jiný překlad.
Domníval jsem se, že je nějak možno "zlomit" Trados 2011, aby za konec segmentu považoval tečku a ne nějaký formátovací znak.
Znova děkuji, přeji všem spoustu dobře placené práce a pokud nějaká rada pomůže, rád se podělím o výsledek.
Milan | | | Vladimír Hoffman Slovakia Local time: 04:02 Member (2009) Ingiriisi to Slovak + ... Nema problema:-) | Sep 30, 2012 |
Postupujte takto:
1. CTRL+F Najit .^p /to je bodka + koniec odstavca/ Nahradit .qqq^p
1. CTRL+F Najit :^p Nahradit :.qqq^p
Potom si pozrite text pri zapnutom zobrazovani skryych znokov a za kazdy odsek, ktory by ste este chceli zachovat zalomeny (povedzme nadpisy, vety konciace ; a pod.) vlozte ten retazec qqq. Pozor, este pred znak konca odstavca (to je to ¶)
Ked mate pripravu hotovu, pokracujte.
1. CTRL+F Najit ^p Nahradit " " /jedna medzera,... See more Postupujte takto:
1. CTRL+F Najit .^p /to je bodka + koniec odstavca/ Nahradit .qqq^p
1. CTRL+F Najit :^p Nahradit :.qqq^p
Potom si pozrite text pri zapnutom zobrazovani skryych znokov a za kazdy odsek, ktory by ste este chceli zachovat zalomeny (povedzme nadpisy, vety konciace ; a pod.) vlozte ten retazec qqq. Pozor, este pred znak konca odstavca (to je to ¶)
Ked mate pripravu hotovu, pokracujte.
1. CTRL+F Najit ^p Nahradit " " /jedna medzera, tie uvodzovky tam nepiste/. Cely text vam to sprace do jednej hromady, ako ste pisali. A nakoniec:
1. CTRL+F Najit qqq Nahradit :^p
A mate to pozalamovane tam, kde ste chceli. Pre istotu to ale robte na zaloznej kopii, potom si ju premenujte na original.
Milan Sochor wrote:
Děkuji Vladimíre,
ale když zadám ^l - manuální zlom řádku a vyhledání, tak mi to nic nenajde, takže to ani nemůže nic nahradit. Když zadám vyhledat ^p-znak konce odstavce a nahradit (třeba)mezerou, tak mě sice manuální zlomy odstraní, ale také všechny skutečné konce odstavce, které tam mají zůstat, což je sice o něco málo lepší, ale taky to moc neřeší.
Moc děkuji za snahu
Milan ▲ Collapse | | | Jak funguje LF-Aligner | Sep 30, 2012 |
Milan Condak wrote:
Pokud nepotřebuji formátování a stačí mi jen segmentace, tak buď na extrakci do textu použiji LF Aligner.
S pozdravem,
Milan Čondák
LF-Aligner obsahuje skripty a programy pro Perl (a Windows) + data pro jednotlivé jazyky
1. PDF je převeden do TXT pomocí programu pdftotext
2. Textový soubor je nasegmentován pomocí programu split-sentences
3. V souborech nonbreaking_prefix jsou zkratky, které obsahují tečky, tj. výraz před tečkou nemá ukončit větu.
V programu je pouze 20 jazyků, soubory je možno editovat nebo vytvořit nové pro další jazyky.
Programy není nutno instalovat. Stačí je stáhnout a odzipovat.
http://sourceforge.net/projects/aligner/files/latest/download
Milan
[Upraveno: 2012-10-01 07:39 GMT] | | | Milan Sochor Czech Republic Local time: 04:02 German to Czech + ... TOPIC STARTER
Děkuji znovu všem.
Zkoušel jsem hlavně návod Vladimíra, dostal jsem se poněkud jiným způsobem (ale na základě jeho námětů) k nějakému výsledku, ale: v tom souboru je ještě spousta "konců odstavců" které by bylo nutné zachovat a tak by příprava byla neúnosná.
Zkusím to ještě uzadavatele.
Děkuji zdravím a hodně štěstí při práci.
Milan | | | There is no moderator assigned specifically to this forum. To report site rules violations or get help, please contact site staff » Trados - separátor segmentů LinguaCore | AI Translation at Your Fingertips
The underlying LLM technology of LinguaCore offers AI translations of unprecedented quality. Quick and simple. Add a human linguistic review at the end for expert-level quality at a fraction of the cost and time.
More info » |
| Pastey | Your smart companion app
Pastey is an innovative desktop application that bridges the gap between human expertise and artificial intelligence. With intuitive keyboard shortcuts, Pastey transforms your source text into AI-powered draft translations.
Find out more » |
|
| | | | X Sign in to your ProZ.com account... | | | | | |