Wadoku.de Forum
  [Search] Search   [Recent Topics] Recent Topics   [Hottest Topics] Hottest Topics  
[Register] Register /  [Login] Login 
Messages posted by: Ulrich Apel
Forum Index » Profile for Ulrich Apel » Messages posted by Ulrich Apel
Message
Ich habe die Seite gründlich überarbeitet und auf den aktuellen Stand gebracht.

Noch nicht alle entsprechenden Markierungen sind auch bereits online. Wahrscheinlich sind in naher Zukunft noch gewissen Anpassungen der Markierungen notwendig, z.B. englische Begriffe für Tags anstatt deutscher – unsere Daten sind auf so hohem Niveau und von solchem Umfang, dass selbst englischsprachige Forscher teilweise lieber auf unsere Daten zurückgreifen.

Wir werden versuchen, im Laufe der Zeit die einzelnen Markierungen noch weiter zu beschreiben: wie sie verwendet werden, warum wir sie eingeführt haben und was man schließlich damit auch machen kann.

Erstellen von Einträgen mit diesen Markierungen ist relativ aufwändig, und wir wissen, dass wir von den Nutzern schwerlich erwarten können, dass sie auf Anhieb entsprechende Einträge schreiben können.

Davon sollte sich aber niemand abschrecken lassen, neue Einträge zu erstellen. Wir werden versuchen, diese dann entsprechend zu überarbeiten.

Eine gewisse Ernsthaftigkeit würden wir uns bei neuen Einträgen allerdings schon wünschen. Das würde einfach schon bei richtiger Rechtschreibung anfangen, also Verwendung von Umlauten und Eszett, korrekte Groß- und Kleinschreibung, Getrenntschreibung nach deutschen Regeln und nicht nach englischen, oder dass man keine lateinischen Ganzgeviertzeichen (全角文字) verwendet. Korrekte Rechtschreibung hilft Missverständnisse zu vermeiden und ist deshalb bei Wörterbüchern sicher keine Prinzipienreiterei. Dann sollten Substantive als Substantive übersetzt werden und nicht als Verben oder Adjektive und so weiter. Unnötige Mehrarbeit machen weiter auch doppelte Einträge.

Yoroshiku o·negai itashimasu

Ulrich Apel
Hallo,

ob es auf WaDoku.de in absehbarer Zeit möglich sein wird, so eine komplexe Suche durchzuführen, wage ich zu bezweifeln. Vielleicht haben unsere Datenbankexperten — Thomas Latka und Hans-Jörg Bibiko — noch etwas dazu zu sagen.

Wenn man die Daten lokal auf seinem eigenen Rechner hat, ist das einfacher. Bei den Links http://www.wadoku.de/links.jsp gibt es dazu Hinweise.

Auch bei der Installation von Moji bekommt man eine Text-Version der Wörterbuch-Daten auf die Festplatte. Man könnte das dann relativ bequem z.B. mit einem grep-Programm durchsuchen (http://de.wikipedia.org/wiki/Grep).

Ganz ungewöhnlich ist so eine Suche nach schon bekannten Kanji nicht. Es sollte eigentlich mit vertretbarem Aufwand möglich sein, so etwas z.B. in Kanji-Lernsoftware oder eine entsprechende Website einzubauen.

Ulrich Apel
Man braucht in der Tat ein Programm, das das Format EPWING lesen kann.

Ich selbst verwende dazu "Jamming"
<http://dicwizard.jp/jamming.html>
und bin sehr zufrieden damit. Es gibt Jamming für Mac und Windows.

Eine Link-Sammlung zu allen möglichen EPWING-Viewern finden Sie z.B. hier:
<http://www.hloeffler.info/epwing/epwing_format.html#viewers>.

Ulrich Apel
Lieber Yoshtec, liebe Community,

vielen Dank für Ihren Forumsbeitrag!

Die Daten liegen in der Tat in einem Datenbankmanagementsystem vor. Einen Dump davon anzufertigen, und online zu stellen, wäre auch grundsätzlich kein allzu großes Problem.

Ich/wir sind nach wie vor dabei, die Daten grundsätzlich zu überarbeiten. Wer einen Dump der jetzigen Daten in ein eigenes System einspielt und dieses anpasst, müsste bei der nächsten Version wieder ganz von vorne anfangen.

Die Daten sollten weiter vor allem auch in einem Format sein, mit dem insbesondere Lehrende, Übersetzer und Dolmetscher arbeiten können, die wir als Mitarbeiter am Projekt ganz besonders gerne mit im Boot hätten.

Es wird sicher Download-Versionen der Daten in verschiedenen Formaten geben. Lassen Sie uns einfach noch etwas Zeit.

Es sind im Moment weiter ganz grundsätzliche Entscheidungen zu treffen, und wir müssen diese Entscheidungen vorbereiten. Unter anderem gibt es voraussichtlich im Januar die Vereinsgründung.

Ich bitte es zu entschuldigen, dass die Download-Version — wenigstens für mich — gerade nicht die oberste Priorität hat. Ich denke, dass wir ca. Dezember/Januar auch eine Lösung dafür haben.

Man kann versuchen, möglichst viele Arbeiten zu verteilen und zu automatisieren. Es wird trotzdem noch jede Menge übrigbleiben, diese Arbeiten zu koordinieren und zu integrieren, insbesondere für einen Übergang bis dahin. In dem Zusammenhang wiederhole ich mich: Das Projekt ist durchaus auf Spenden angewiesen.

Ulrich Apel
Beim Problem der Devokalsierung von z.B. す und く etc. kann man schon noch etwas genauer sein.

Hier also eine immer noch recht grobe Zusammenfassung:

Die wichtigste Regel heißt, das "u" und "i" zwischen zwei stimmlosen Konsonanten, also k, p, t, s, sh, h und f verschluckt wird.

Dasselbe gilt meistens auch, wenn auf -- nach stimmlosem Konsonanten stehendem -- "u" oder "i" das Wort- bzw. Phrasenende kommt; hier gilt der Zusatz, dass der Akzent der Silbe tief sein muss. Das す von です oder ます am Satz- oder Phrasenende ist ein Beispiel dafür.

Bei Zusammensetzungen mit Suffixen, die den Akzentkern tragen, kann sich der Akzentkern nach vorne verschieben, wenn die entsprechende Silbe devokalisiert wird.

Wenn mehrere Silben aufeinanderfolgen, die nach der Regel devokalisiert sein könnten, ist es vom Akzentkern abhängig, welche Silbe ihren Vokal behält. Eine Silbe mit Akzentkern wird nicht devokalisiert. Im Zweifelsfall -- und wenn es einem wirklich so wichtig ist -- muss man eben in einem Aussprachewörterbuch nachschlagen.

Für すすめる gibt das Shinmeikai Akzent-Wörterbuch (新明解日本語アクセント辞典) übrigens an, dass das erste す devokalisiert wird. Das NHK-Aussprache-Wörterbuch (NHK 日本語発音アクセント辞典) erwähnt das nicht ausdrücklich.

In hoffentlich nicht zu ferner Zukunft wird es wohl möglich sein, bei WaDoku.de auch Tonakzent und Devokalisierung anzeigen zu lassen. Die Daten dafür sind schon zu einem recht großen Teil vorhanden. Bei der EPWING-Version wird beispielsweise der Akzent auch bereits angezeigt -- soweit wir die Daten haben.
Hepburn-System ist ein System zur Umschrift von Japanisch mit lateinischen Buchstaben.

Wir machen keinen Unterschied bei der Umschrift, ob es sich dabei um Fremdwörter bzw. Gairaigo handelt. Bei Gairaigo gibt es ja inzwischen einige Spezialfälle.

Ich füge unten eine Tabelle über die Umwandlung ein -- insbesondere auch für die Spezialfälle.

„Langvokale“ werden mit „macron“ also einem Strich über dem Vokal dargestellt "ā", "ō", "ū". Langes "e" ist bei Katakana-Wörtern "ē", sonst "ei". Langes "i" ist bei Katakana-Wörtern "ī", sonst "ii".

Geminierte Konsonanten werden als Doppelkonsonant dargestellt. Bei kleinem "tsu" っ am Wortende bekommt der vorausgehende Vokal ein Brevezeichen "ă", "ĭ", "ŭ", "ĕ", "ŏ".

は als Joshi wird "wa" umschrieben -- を als Joshi "o" und へ als Joshi "e".

Das modifizierte Hepburn-System wird heutzutage häufiger benutzt als das ursprüngliche Hepburn-System.

Hauptunterschied ist, dass wenn auf den morischen Nasal ん ein bilabialer Verschluss, also "b" oder "p", folgt beim ursprünglichen Hepburn-System "m" transkribiert wird -- 新聞 = "shimbun". Beim modifizierten Hepburn-System wird hingegen "n" geschrieben, also "shinbun". Das hängt mit einer japanischen Regierungsveröffentlichung zusammen, die die Umschriften regeln sollte und die bestimmte Sachen vorschlägt bzw. erlaubt. Modifizierte Hepburn-Umschrift nimmt also Hepburn-System, soweit es dort "erlaubt" ist und richtet sich sonst nach dieser Vorschrift.

Eigennamen schreiben wir groß, genauso Satzanfänge.


Umschrift-Tabelle:

あ a い i う u え e お o
か ka き ki く ku け ke こ ko
さ sa し shi す su せ se そ so
た ta ち chi つ tsu て te と to
な na に ni ぬ nu ね ne の no
は ha ひ hi ふ fu へ he ほ ho
ま ma み mi む mu め me も mo
や ya ゆ yu よ yo
ら ra り ri る ru れ re ろ ro
わ wa ゐ i ゑ e を o
ん n
が ga ぎ gi ぐ gu げ ge ご go
ざ za じ ji ず zu ぜ ze ぞ zo
だ da ぢ ji づ zu で de ど do
ば ba び bi ぶ bu べ be ぼ bo
ぱ pa ぴ pi ぷ pu ぺ pe ぽ po
きゃ kya きゅ kyu きょ kyo
しゃ sha しゅ shu しょ sho
ちゃ cha ちゅ chu ちょ cho
ひゃ hya ひゅ hyu ひょ hyo
りゃ rya りゅ ryu りょ ryo
ぎゃ gya ぎゅ gyu ぎょ gyo
じゃ ja じゅ ju じょ jo
ぢゃ ja ぢゅ ju ぢょ jo
にゃ nya にゅ nyu にょ nyo
びゃ bya びゅ byu びょ byo
ぴゃ pya ぴゅ pyu ぴょ pyo
みゃ mya みゅ myu みょ myo

# Spezielle Kana-Kombinationen
くぁ kwa くぃ kwi くぇ kwe くぉ kwo
ぐぁ gwa ぐぃ gwi ぐぇ gwe ぐぉ gwo
しぇ she
ちぇ che
じぇ je
つぁ tsa つぃ tsi つぇ tse つぉ tso
とぅ tu
どぅ du
てぃ ti
でぃ di でゅ dyu
ひぇ hye
ふぁ fa ふぃ fi ふぇ fe ふぉ fo
ふゃ fya ふゅ fyu ふょ fyo
うぃ wi うぇ we うぉ wo
ゔぁ va ゔぃ vi ゔ vu ゔぇ ve ゔぉ vo
So eine Suche gibt es derzeit nicht.

Voraussichtlich werden wir aber in absehbarer Zeit versuchen, komplexere Suchen zu unterstützen.

Bisher hat sich der Ehrgeiz unser Datenbankspezialisten unter anderem darauf konzentriert, möglichst schon vorher zu erraten, was die Nutzer suchen könnten und die Suche entsprechend zu optimieren. Da war es eben nicht vorgesehen, z.B. nach Fachgebieten oder Beispielen zu suchen.
Die alte Seite in Osaka <http://bunmei7.hus.osaka-u.ac.jp:591/WaDokuJT/> haben meine ehemaligen Kommilitonen an der Uni Osaka weitergepflegt. Ich konnte mich nicht mehr darum kümmern. Es war klar, dass das nicht für immer so weitergehen konnte.

Suche nach Romaji-Umschrift gibt es auch unter <http://bibiko.de/wadoku/index.html>.

Warum es auf WaDoku.de bisher keine Romaji-Suche gibt, ist mir selbst auch gewisses Rätsel. Die Daten sind ja prinzipiell gleich. Wir sind an sich in der Lage Umschriften nach ganz unterschiedlichen Ansätzen zu erstellen.

Ich hoffe, dass dieser Wink mit dem Zaunpfahl bei unseren Datenbankspezielaisten angekommen ist und dass wir nach einer grundsätzlichen Überarbeitung der Daten auch differenziertere Suchen ermöglichen können.
tom wrote:Viel Spass beim Fragen und Anworten.

Dem kann ich mich nur anschließen!
Herzlichen Glückwunsch zur neuen Version des Forums!
 
Forum Index » Profile for Ulrich Apel » Messages posted by Ulrich Apel
Go to: