Wadoku

Wadoku Wörterbuchsuche
Forum

Inhaltsverzeichnis

Zuletzt aktualisiert

Untergeordnete Seiten
  • Genus

Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

...

Für die Einarbeitung ist eine Version mit wenig Schreibarbeit praktischer. Das würde für die Version mit geschweifter Klammer sprechen. Echter XML-Code wäre wohl eleganter, wobei die letzte Version am ehsten auch von Menschen zu verstehen ist. "Nomen" als Name der Markierung ist wohl nicht optimal. Es geht nicht darum, dass es ein Nomen ist - das ist "Silberrand" bzw. "Silberschnitt", was wohl gemeint ist, auch. Es geht darum, dass es das wichtigste Nomen ist; also besser z.B. "main_noun"

...

Markierung des wesentlichen Nomens eines Eintrages macht praktisch dieselbe Arbeit, wie gleich das Genus anzugeben, bzw. es ist umgekehrt, das wichtige Nomen wird bislang durch Genusangabe als solches gekennzeichnet. Wenn man sich klar macht, was das wesentlich Nomen ist, weiß man auch das Genus. Man muss sich auch nichts überlegen, um Spezialfälle wie der, die oder das Korpus abzufangen. Eine zweite Datei zur Überprüfung der Genera ist jeoch bestimmt sinnvoll.

Anmerkungen

Die generische Alternative ist bezüglich Redundanz und Fehlerminimierung sicherlich vorzuziehen.

Bezüglich des Terminus 'wesentliches Nomen'

Dieser impliziert, dass nur ein wesentliches Nomen vorkommen kann, aber es Fälle wie z.B. 'Trauer {f} und Freude {f}'.

XML-Darstellung der Genera

Vorschlag:

Codeblock

ein Buch <genus type="n" /> mit Silberrand

Dies hätte den Vorteil, dass man eine XLST-Transformation sehr einfach schreiben kann.

Natürlich stellt sich hier die Frage, ob es einen Mehrwert darstellen würde, wenn man z.B.

Codeblock

ein <nomen genus="n">Buch</nomen> mit Silberrand

schreibt?

Erstellung einer Generatabelle

Die Erstellung gestaltet sich als recht 'einfach', wenn man in der WaDoku-Präambel schreibt, dass sich die Genusangabe auf das 'Standard Deutsch' bezieht, ungeachtet standardisierter Varietäten wie z.B. Österreichisch.

Eine solche Tabelle könnte folgendes Aussehen haben:

...

 

Mitteilen

n

Mitteilung

f

...

 

See

m

See

f

...

 

Wie soll man dieses Tag beim Bearbeiten oder Neuerstellen eines Eintrages angeben?

Vorschlag:

Codeblock

ein Buch {} mit Silberrand

Hier ist es möglich, einen Parser zu schreiben, der das Wort, vorrausgesetzt, man kann Wort eineindeutig definieren, vor {} in einer Tabelle nachschlägt, um den Genus zu erhalten.
Daraus könnte ein XML-Code derart errechnet werden:

Codeblock

ein Buch <genus type="n" /> mit Silberrand

Wiki-Markup
Diese Schreibweise würde mit der derzeitigen Schreibweise konform laufen, man muss lediglich \{n\|m\|f\|kA\|\[nmf\]kA\|\[nmf\]pl\} mit \{\} ersetzen, wenn das Nomen nur einmal in der Generatabelle vorkommt. Bei z.B. '*See \{m\} eines Vulkans*' <span style="color: #ff0000">muss</span> der Genus erhalten bleiben. Dies setzt bei der Bearbeitung oder Neuerstellung voraus, dass bevor der Eintrag gespeichert wird, eine Prüfung stattfinden muss, um z.B. '*See \{\} eines Vulkans*' abzufangen.

Ein Problem könnte auftauchen, wenn das mit einem Genus zu versehendes Nomen aus mehreren Wörtern besteht, wie z.B. 'Compact Disc'. Ein Regel der deutschen Sprache lautet, dass sich der Genus eines zusammengesetzten Substantivs nach der letzten Komponente richtet, also in diesem Falle nach 'Disc' - weiblich.

Codeblock

Compact Disc <genus type="f" />

Auch hier stellt sich die Frage, ob eine Alternativschreibweise

Codeblock

Compact <nomen genus="f">Disc</nomen>

oder besser

Codeblock

<nomen genus="n">Compact Disc</nomen>

vorzuziehen ist? Letztere bedingt außerdem eine völlig andere Art der Eingabe!

Was passiert bei Nomen, die in der Genustabelle noch nicht aufgeführt sind?

Beispiel eines neuen Eintrages:

Codeblock

Segge {}

Dies muss man abfangen und den Benutzer auffordern, den Genus in die Tabelle einzutragen. Die Frage hier nur ist, ob es technisch einfach realisierbar ist?

Ein anderer Ansatz wäre, dies einfach zuzulassen. Der XML-Parser würde in diesem Falle {} ignorieren und keinen Genus-Tag ausgeben. Erst nachdem für 'Segge' der Genus in die Generatabelle eingetragen wurde, würde die XML-Ausgabe aktualisiert.

Andere Vorschläge

Gibts andere Vorschläge bzw. Präferenzen?