Probleme der Übersetzung durch Mensch und Maschine

Probleme der Übersetzung durch Mensch und Maschine

Probleme der bersetzung durch Mensch und Maschine: Probleme der Analyse Morphologische Probleme Lexikalische Ambiguitt Strukturelle Ambiguitt Anaphernauflsung Mehrdeutigkeiten im Quantorenskopus Morphologische Probleme Vollformen-Wrterbuch: keine morphologische Analyse Spart Analysezeit Bringt Vorteile bei unregelmigen Formen Nachteil: bentigt viel Speicherplatz

Stammwrterbuch: morphologische Analyse Spart Speicherplatz ermglicht Wortartbestimmung und Erkennung grammatischer Relationen (Subjekt, Objekt etc.) auch bei unbekannten Wrtern im Englischen bezeichnet das Suffix ize gewhnlich ein Verb deutsche Wrter auf ung sind gewhnlich Nomina. Synkretismus fhrt zu massiver Ambiguitt, Beispiel en Mgliche Interpretationen von en im Deutschen

Nomen Plural (Pflaumen) Nomen Dativ Plural (den Tagen) schwaches Nomen Singular nicht-Nominativ starke Deklination Maskulin Singular Akkusativ starke Deklination Dativ Plural Adjektiv nichtNominativ Maskulin Singular nach definitem Artikel Adjektiv Dativ oder Genitiv Feminin oder Neutrum Singular nach bestimmtem Artikel Adjektiv Akkusativ oder Genitiv Maskulin Singular ohne Artikel Adjektiv Genitiv Neutrum Singular ohne Artikel Adjektiv Dativ Plural ohne Artikel Verb Infinitiv Verb 1. oder 3. Person Plural Verb Partizip (starkes Verb) Ein Wort, das zufllig auf en endet (Regen)

Probleme bei zusammengesetzten Wrtern steam engine, steam hammer; steamship Dampfmaschine, Dampfhammer, Dampfschiff Silberlffel, Suppenlffel, Schaumlffel Produktivitt (Dampfschiffahrtsgesellschaft) fehlende Kompositionalitt der Bedeutung Probleme bei zusammengesetzten Wrtern Beileid Kulturgeschichte

Uranbrenner Wachtraum Bei + Leid condolence Beil + Eid hatchet oath Kultur + Geschichte history of culture Kult + Urgeschichte pre-history of worship

Uran + Brenner uranium pile Ur + Anbrenner primitive kindler Wach + Traum day-dream Wacht + Raum guard-room Lexikalische Ambiguitt Kategoriale Ambiguitt light: N, V, A; control: N, V Konversion: fast jedes Nomen kann als Verb fungieren

Fast jedes Nomen kann als Adjektiv fungieren: stone wall Ein extremes aber nicht seltenes Beispiel ist round in den folgenden Stzen: Es ist Nomen (1), Verb (2), Adjektiv (3), Prposition (4), Partikel (5) und Adverb (6). 1. 2. 3. 4. 5. 6. Liverpool were eliminated in the first round. The cowboy started to round up the cattle. I want to buy a round table. We are going on a cruise round the world. A bucket of cold water soon brought him round. The tree measured six feet round. N V

A P Prt Adv Kategoriale Ambiguitt Gas pump prices rose last time oil stocks fell. N N N N

N N N N N V V V V V

V V V V (A) A Adv Zapfsulenpreise Zapfsulenpreisestiegen stiegenletztes letztesMal Malan, an,lvorrte lvorrtefielen

fielen Kategoriale Ambiguitt (1) (2) Foot heads arms body. British left waffles on Falklands Homographie und Homophonie Homographe sind zwei (oder mehrere) Wrter' mit deutlich verschiedener Bedeutung, die die gleiche Schreibung aufweisen. Beispiele: club (Waffe, Institution), bank (Ufer, Institution), dt. Bank (Sitzgelegenheit, Institution)

light (Antonym dark oder heavy) Schlo (Gebude, Schlievorrichtung) Homophone sind Wrter, die gleich ausgesprochen aber verschieden geschrieben werden (z.B. hair und hare). Aber da M hauptschlich geschriebene Texte betrifft, spielen sie hier kaum eine Rolle. Polysemie (Mehrdeutigkeit) Polyseme sind Wrter, die ein breites aber zusammenhngendes Bedeutungsspektrum aufweisen, z.B. durch metaphorische Erweiterungen und bertragungen: mouth of a river, branch of a bank,

flow of ideas, channel of communication, tide of opinion, etc.. Wenn sich die Erweiterung zu sehr vom Ursprung entfernt, werden Polyseme zu Homographen. Das Wort crane im Sinne von Kran mag aus einer metaphorischen bertragung der Bedeutung Kranich entstanden sein, aber die Wrter crane Kran und crane Kranich werden nicht mehr als Polyseme verstanden, sondern als Homographe. Strukturelle Ambiguitt Whrend lexikalische Mehrdeutigkeiten zu Problemen bei der Analyse einzelner Wrter und beim Transfer ihrer Bedeutungen fhren, involviert eine strukturelle Ambiguitt Probleme mit der syntaktischen Strukturen von Stzen und deren Reprsentation. Eine strukturelle Ambiguitt liegt vor, wenn es mehr als eine Mglichkeit gibt, die zugrunde liegende Struktur eines Satzes auf der Grundlage der vom System verwendeten Grammatik zu analysieren. Die beiden Einschrnkungen "eines Satzes" und auf der Grundlage der

vom System verwendeten Grammatik" sind wichtig. Die meisten M Systeme beschrnken sich auf die sequentielle Analyse einzelner Stze; sie behandeln im Allgemeinen keine greren bersetzungseinheiten wie z.B Abstze. Es werden zwar einzelne Versuche unternommen, sprachliche Elemente, durch die Stze zu Texten verknpft werden zu bercksichten (z.B. Pronomina, Thema-Rheme Struktur), sind die meisten dieser Systeme ber ein Experimentierstadium nicht hinausgekommen. Die zweite Einschrnkung ist eine Hinweis, dass kein Parser ber die Grenzen der implementierten Grammatik hinausgehen kann. Strukturelle Ambiguitt Wenn die Grammatik Unterscheidungen, die ein menschlicher Leser machen wrde, nicht macht, dann wird auch der Parser nicht in der Lage sein, zwischen alternativen Analysen zu entscheiden. Mit anderen Worten: es ist die Grammatik, die

bestimmt, ob eine bestimmte Struktur mehr als eine zulssige Interpretation hat und daher mehrdeutig ist. Es ist folglich gerechtfertigt, zu unterscheiden zwischen echten' Mehrdeutigkeiten, fr die auch ein Mensch mehrere Interpretationen finden knnte, 'System-Mehrdeutigkeiten, die der menschliche Leser nicht unbedingt erkennen wrde. Echte Strukturelle Ambiguitt Linguisten verwenden gerne echte strukturelle Ambiguitten, um alternative syntaktische Interpretationen zu demonstrieren, die von der formalen Analyse nahegelegt werden. Typische Beispiele dafr sind die folgenden: (1) Flying planes can be dangerous. (2) Time flies like an arrow. (3) The man saw the girl with the telescope. Echte Strukturelle Ambiguitt

(1) Flying planes can be dangerous. a. It can be dangerous to fly planes. b. Planes which are flying can be dangerous. (2) Time flies like an arrow. a. The passage of time is as quick as an arrow. b. A species of flies called 'time flies' enjoy an arrow. (3) The man saw the girl with the telescope. a. The man saw the girl who possessed the telescope. b. The man saw the girl with the aid of the telescope. Strukturelle Ambiguitt

Menschen fllt es oft schwer, strukturelle Mehrdeutigkeiten in solchen Stzen zu erkennen und im Kontext - in einer besonderen Situation oder in einem bestimmten Text - kann es sein, dass die Stze ziemlich eindeutig erscheinen. Wenn (3) zum Beispiel im Kontext einer Geschichte vorkommt, ist vermutlich aus dem Verlauf der Geschichte klar, wer denn im Besitz des Teleskops ist, der Mann oder das Mdchen. Da jedoch M-Systeme diese kontextuellen Anhaltspunkte im Allgemeinen nicht oder nur in sehr begrenztem Mae benutzen knnen, sind die Stze effektiv mehrdeutig. In diesen Fllen fallen die 'SystemMehrdeutigkeiten mit echten' Mehrdeutigkeiten zusammen. Zufllige strukturelle Ambiguitt Nicht-systematische strukturelle Mehrdeutigkeiten knnen

entstehen durch eine zufllige Kombination von Wrtern, die kategorial Mehrdeutig sind (Nomen, Verb, Adjektiv), aufgrund alternativer grammatischer Funktionen von syntaktischen Konstituenten oder aufgrund verschiedener Kombinationsmglichkeiten von syntaktischen Konstituenten. Die Arten von strukturellen Mehrdeutigkeiten, die auftreten knnen, unterscheiden sich von Sprache zu Sprache und insbesondere von Grammatik zu Grammatik. Sie sollen hier anhand englischer Beispiele exemplifiziert werden. Zufllige strukturelle Ambiguitt Viele Mehrdeutigkeiten ergeben sich aus der Tatsache, dass ein einzelnes Wort in verschiedenen Funktionen innerhalb desselben syntaktischen Kontexts dienen kann. Dies ist eine mgliche Folge der kategorialen Ambiguitt. Diese Mehrdeutigkeiten korrelieren mit verschiedenen strukturellen Interpretationen desselben Satzes. Im Sinne der

generativen Grammatik von Chomsky handelt es sich um tiefenstrukturelle Mehrdeutigkeiten. Es gibt verschiedene 'Tiefenstrukturen' fr dieselben 'Oberflchenstrukturen'. (1) He noticed her shaking hands (2) I like swimming (3) They complained to the guide that they could not hear. Strukturelle Ambiguitt Das Prsentspartizip shaking in (1) kann als Adjektiv fungieren wie tiny in a., oder als Gerundivum wie watching in a. He noticed her tiny feet. b. He noticed her watching television. Das Prsenspartizip (2) kann auch mit einer Mehrdeutigkeit zwischen seiner Verwendung als ein (verbales) Nomen (vgl. a) und als ein Gerundivum (b) verbunden sein: a. I like tennis. b. I like getting up late. Das Wort that in (3) kann eines sein ein Relativpronomen (wie

whom in a.) oder eine Konjunktion wie in b. a. They complained to the guide whom they could not hear. b. They complained to the guide that they could not hear him. Strukturelle Ambiguitt Ein letztes Beispiel fr eine tiefenstrukturelle Mehrdeutigkeit finden wir bei der Interpretation einer Folge von Nomina entweder als eine einzelne Konstituente, d.h. als ein zusammengesetztes Nomen, oder mit einer Konstituentengrenze dazwischen. Dies ist besonder problematisch im Englischen, weil dort in restriktiven Relativstzen das Relativpronomen weggelassen werden kann: (1) The mathematics students sat their examinations. (2) The mathematics students study today is very complex. Da im Englischen solche Nominalkomposita sehr hufig sind verbunden mit der Hufigkeit von kategorialen Ambiguitten ist in dieser Sprache diese Art struktureller Mehrdeutigkeit sehr verbreitet. Strukturelle Ambiguitt: weitere Beispiele

(1) (2) (3) (4) (5) (6) (7) (8) Have you seen the story about the air crash in the paper? Have you seen the story about the air crash in the jungle? John mentioned the book I sent to Susan. John mentioned the book I sent him to Susan. John mentioned the book I sent to Susan to his brother. I told everyone concerned about the strike. I told everyone concerned about the strike not to worry. I told everyone about the strike. Auflsung struktureller Ambiguitt Wenn die syntaktische Analyse mehr als eine mgliche Interpretation

fr einen Satz produziert, muss ein Weg gefunden werden, die richtige zu whlen. Das ist notwendig, weil zwar nicht immer, aber doch sehr hufig, die bersetzung in die Zielsprache je nach der gewhlten Interpretation anders ausfallen wird. Bei der bersetzung von The man saw the girl with the telescope ins Japanische zum Beispiel muss die Mehrdeutigkeit aufgelst werden: Otoko wa BOENKYO WO MOITE IRU onnanoko wo mita. MAN subj TELESCOPE obj HOLDING GIRL obj SAW 'The man saw the girl who was holding the telescope'. Otoko wa BOENKYO DE onnanoko wo mita. MAN subj TELESCOPE inst GIRL obj

SAW 'The man, using the telescope, saw the girl.' Auflsung struktureller Ambiguitt Die Mehrdeutigkeit von that in They complained to the guide that they could not hear muss bei der bersetzung ins Deutsche ebenfalls aufgelst werden. Sie beklagten sich bei dem Reisefhrer, DEN sie nicht hren konnten. Sie beklagten sich bei dem Reisefhrer, DASS sie nicht hren konnten. Auflsung struktureller Ambiguitt Es gibt eine Anzahl von Optionen, die fr Auflsung von Mehrdeutigkeit verfgbar sind: die Verwendung semantischer oder anderer linguistischer Information, des Verwendung kontextueller Anhaltspunkte,

dem Verwendung von auerlinguistischem 'Weltwissen Interaktive Befragung Eine weitere Mglichkeit besteht darin, die Mehrdeutigkeit einfach zu ignorieren und darauf zu bauen, dass in der Zielsprache die gleiche Ambiguitt vorliegt. Linguistisches Wissen Oft knnen potentiell mehrdeutige Stze unter Bezug auf linguistisches Wissen disambiguiert werden. Mann kann verschiedene Arten von sprachlichem Wissen unterscheiden. Sie alle haben gemeinsam, dass sie Informationen ber Wrter und die Art sie zu kombinieren benutzen und nicht ber die ber die Ereignisse im wirklichen Leben, welche die Stze beschreiben.

Ein Verfahren besteht darin, Parsern (Analsyseprogrammen) Informationen ber Vorkommensbeschrnkungen zur Verfgung zu stellen, d.h. Hinweise darauf, wie das Vorhandensein bestimmter Elemente in einer Struktur die Vorkommensmglichkeiten anderer Elemente beeinflusst. Linguistisches Wissen Ein typisches Beispiel dafr ist die Verwendung von Subkategorisierungsrahmen fr Verben. Diese zeigen an, welche Arten von Ergnzungen von einem bestimmten Verb 'erwartet' werden. Ein Verb wie give zum Beispiel, erwartet als Subjekt ein Nomen, das sich auf einen 'Geber' bezieht, als direktes Objekt ein Nomen, das sich auf das 'gegebene' Ding bezieht, und als indirektes Objekt ein Nomen, das auf einen 'Empfnger' referiert. Weiterhin knnen wir in einem gewissen Rahmen bestimmen, mit welchen Arten von Nomina diese syntaktischen Rollen gefllt werden knnen, z.B. durch die Verwendung von semantischen Merkmalen: der 'Geber' sollte belebt usw. sein.

Linguistisches Wissen Auf diese Weise kann der Parser fr ein potentiell mehrdeutiges Satzpaar wie unten die richtigen Interpretationen produzieren, wenn er die Information hat, dass read von einer Prpositionalphrase mit in modifiziert werden kann, wenn das betroffene Nomen zu einer Klasse von Nomina gehrt, die als 'lesbar' gekennzeichnet sind (z.B. book, magazine, newspaper, usw.) (1) I read about the air crash in France. (2) I read about the air crash in the paper. Linguistisches Wissen

Diese Art von Information kann auch auf einer allgemeineren Ebene durch Konzepte wie Valenz und Kasus im Sinne der Kasusgrammatik behandelt werden. Durch die Valenz werden Verben nach der Anzahl und Art der Ergnzungen charakterisiert, die mit ihnen entweder assoziiert sein mssen oder drfen. In der Kasusgrammatik werden die Rollen von abhngigen Ergnzungen z.B. als Agent, Patient (oder Object) Instrument, Manner, Accompanier, Location, usw. identifiziert. Eine typische Verallgemeinerung ist, dass die Subjekte von transitiven Verben Agenten sind, die normalerweise 'belebt', potent', usw. sind. Fr give wren die erwarteten Kasusrollen Agent, Recipient und Patient. Linguistisches Wissen Die folgenden Beispielstze werden richtig analysiert, wenn der Parser ber die Information verfgt, dass write eine instrumentale

with-Phrase zu sich nimmt und dass das Instrument ein physisches Objekt sein sollte. (1) He wrote the letter with a fountainpen. cf. He wrote the letter with the parcel. Der Accompanier von visit und hnliche Verben sollte belebt sein; und tell nimmt eine with-Phrase der Art und Weise zu sich, mit einem beschrnkten Bereich von mglichen Fllseln (stutter, accent, usw.). (2) He visited the museum with his brother. cf. He visited the museum with the Elgin marbles. (3) He told the story with a funny accent. cf. He told the story with a funny ending Kontextwissen

In der Praxis sind sehr wenige Stze wirklich mehrdeutig: in Abwesenheit anderer Disambiguierungskriterien wird normalerweise der Kontext, in dem der Satz auftritt, entscheiden welche von mehreren Lesarten zu bevorzugen ist. Allerdings sind nur sehr wenige M-Systeme in der Lage, solches kontextuelles Wissen zu benutzen. Der Grund dafr ist, dass es sehr schwer ist Regeln zu daf formulieren, wo man das 'Wissen' finden kann, das in einem konkreten Fall zur Disambiguierung dienen knnte. Zudem msste die Information, die whrend des bersetzungsprozesses anfllt, gespeichert werden. Weltwissen Der dritte Ansatz zur Auflsung von Mehrdeutigkeiten, wenn die syntaktische Analyse dafr nicht ausreicht, besteht darin,

allgemeines Weltwissen einzubeziehn. Ein Beispiel fr eine strukturelle Mehrdeutigkeit, die durch Verwendung von Weltwissen aufgelst wird, liefert der folgende Satz : (1) The man saw the horse with the telescope. Die Grenze zwischen Weltwissen und sprachlichem Wissen ist keineswegs klar gezogen. (2) We will meet the man you told us about yesterday. (3) We will meet the man you told us about tomorrow. Anaphorische Referenz

Neben der Auflsung von Mehrdeutigkeiten, die oft als das wichtigste linguistische Problem fr die M betrachtet wird, ist eine andere Hauptschwierigkeit die Auflsung von pronominalen Verweisen (anaphora resolution). 'Anapher' ist der linguistische Fachausdruck fr einen indirekte Bezug auf eine Entitt, die an einer anderen Textstelle explizit erwhnt wird. Das hufigste linguistische Mittel dafr ist die Verwendung von Personalpronomina wie es, er, sie, usw., Demonstratpronomina wie dies, dieser, diese etc. oder Phrasen wie der (die, das) Letztere. Die Identifizierung von Pronomina schliet deshalb die Identifizierung einer vorangegangen Nominalphrase ein, auf die sie sich beziehen. Dieses Bezugselement wird Antezedens genannt. Anaphorische Referenz Die Ermittlung des Antezedens von Anaphern ist sehr oft von entscheidender Wichtigkeit fr die richtige bersetzung. Wenn in Sprachen bersetzt wird, in denen die Pronomina genusmarkiert sind, ist es unerllich, die anaphorischen Beziehungen aufzulsen.

(1) The monkey ate the banana because it was hungry. (2) The monkey ate the banana because it was ripe. (3) The monkey ate the banana because it was teatime. Anaphorische Referenz In jedem dieser Beispiele bezieht sich das Pronomen it jeweils auf etwas Anderes: in (1) auf monkey, in (2) auf banana, und in (3) auf die Ereigniszeit. Fr die bersetzung ins Deutsche, wo die Pronomina im Genus mit dem Antezedens kongruieren, mssen die entsprechenden Bezge explizit gemacht werden. Da Affe maskulin ist, ist das entsprechende Pronomen er; Banane ist feminin und das entsprechende Pronomen mu sie sein; und das entsprechende Pronomen fr (3) ist es. (1) Der Affe hat die Banane gefressen, weil er Hunger hatte. (2) Der Affe hat die Banane gefressen, weil sie reif war. (3) Der Affe hat die Banane gefressen, weil es die Teestunde war. Anaphorische Referenz Die korrekte Auflsung von anaphorischen Bezgen involviert dieselben Wissensarten wie bei der Auflsung von Mehrdeutigkeiten.

In der Tat knnen Anaphern als eine Art von Mehrdeutigkeit betrachtet werden. Wie bei der Auflsung von Mehrdeutigkeiten reicht das linguistische Wissen manchmal fr die richtige Analyse nicht aus. Wenn man die folgenden Stze ins Franzsische bersetzen will, mu man wissen, ob some of them sich auf soldiers (maskulin) oder auf women (feminin) bezieht: (1) The soldiers shot at the women and some of them fell. (2) The soldiers shot at the women and some of them missed. (3) Les soldats ont tir sur les femmes et quelquesunes sont tombes. (4) Les soldats ont tire sur les femmes et quelquesuns ont rat. Quantorenskopus Als letztes Problem soll die Mehrdeutigkeit im Geltungsbereich (Skopus) von Quantoren errtert. Dieses Problem ist im Kontext von natrlichsprachlichen Dialogsystemen intensiv untersucht worden, wo es

wahrscheinlich entscheidender ist als in der M. Diese Art der Mehrdeutigkeit tritt auf, wenn der Geltungsbereich oder Skopus eines Quantors wie some, all, none unklar ist. Im Englischen insbesondere gibt es ein syntaktischen Phnomen namens 'Quantorenanhebung (quantifier raising), das die Position des Quantors im Satz verschiebt. Quantorenskopus (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11)

I don't think he'll come. I think he won't come. All women don't like fur coats. Not all women like fur coats, only some do. There are no women who like fur coats. All wires are attached to a pin. There is one (large) pin to which all wires are attached. Each wire is attached to its own pin. No smoking seats are available on domestic flights. There are no seats where you may smoke on domestic flights. There are "no smoking" sections on domestic flights.

Recently Viewed Presentations

  • Capital processes - University of Manchester

    Capital processes - University of Manchester

    Exchange Transactions. Definition:A transaction with commercial substance i.e. goods or services delivered in exchange for resources of equivalent value.. Examples: Sale of goods or provision of services including education, accommodation and commercial research contracts.
  • Our Love Now - WordPress.com

    Our Love Now - WordPress.com

    I said,observe the scab of the scald,the red burnt flesh is ugly,but it can be hidden.In time it will disappear,Such is our love, such is our love. She said,Although the burn will no longer stingand we'll almost forget that it's...
  • Myths, Folktales, Tall Tales, Legends, and Fables

    Myths, Folktales, Tall Tales, Legends, and Fables

    Situational Archetypes. DEATH AND REBIRTH—grows out of a parallel between the cycle of nature and the cycle of life. Thus, morning and springtime represent birth, youth, or rebirth; evening and winter suggest old age or death.
  • Conoscenza E Comprensione Del Disagio Nel Contesto Scolastico

    Conoscenza E Comprensione Del Disagio Nel Contesto Scolastico

    Assimilando le tecniche richieste a scuola (imparare a leggere, a scrivere, a pensare seguendo un filo logico, a scoprire concetti e nuove realtà astratte) e tra i coetanei (come fare per entrare nel gruppo e poi restarvi, come partecipare ai...
  • Clinical Diagnostic Laboratory 1

    Clinical Diagnostic Laboratory 1

    Ignoring clinical data, theoretical knowledge and practical experience could lead to false conclusions or even to a false diagnosis. Blood is a dynamic system with no clear cut borderline between physiological and . pathological. Be wise making a diagnosis. The...
  • Classroom expectations presentation

    Classroom expectations presentation

    Causation Requires: Association. Sequence (causes preceded effects) Mechanism. Counter factual (no effect when causes are absent) To infer a causation we need three additional pieces of information. We need to know the sequence of the events. A cause must precede...
  • SAT Vocab Unit 1

    SAT Vocab Unit 1

    Arial Garamond Wingdings Calibri Times New Roman Edge 1_Edge SAT Vocab Unit 1 Words…Pronunciation…Part of Speech Let's Add Some Meaning Let's Add Some Meaning Memory Tips - Use these mnemonics (memory devices) to boost your vocabulary. Memory Tips - Use...
  • Pg. 76 Pg. 76 EQ: What are the

    Pg. 76 Pg. 76 EQ: What are the

    MAGNETS Elements that can be magnetic Fe: Iron soft iron loses magnetism easily Co: Cobalt used to harden tools Ni: Nickel used to make jewelry Other magnets: Compass Earth Materials whose atoms can be aligned MAGNETS Properties Have domain (lined...