Wadoku.de Forum
  [Search] Search   [Recent Topics] Recent Topics   [Hottest Topics] Hottest Topics  
[Register] Register /  [Login] Login 
mecab  RSS feed
Forum Index » Japanisch auf PC/PDA
Author Message
boscowitch



Joined: 23/09/2008 16:03:04
Messages: 231
Location: ケルン
Offline

Hi,
nach einem bischen recherche nach japanischen volltext indexierungs methoden (in sqlite3) habe ich auf einigen japanischens sites von einem sehr nützlichen tool gelesen,

mecab ein Morphologisches analyse tool,
es kann z.b. japanische sätze / texte nach wörter/ prefixen ect trennen um daraus einen volltext such tabelle zu erstellen, aber auch so ist es überaus nützlich wenn man noch nicht so gut japanisch kann.
auserdem kann es die lesung in katakana ausgeben.
hier 2 beispiele für 2 spezielle ausgabe modis von mecab

$ mecab -O wakati
mecabは便利なソフトです。
mecab は 便利 な ソフト です 。

$ mecab -O yomi
mecabが大好きかも知れない。
mecabガダイスキカモシレナイ。

hier die standart ausgabe:
$ mecab
mecabはすごく便利なソフトです。
mecab 名詞,固有名詞,組織,*,*,*,*
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
すごく 形容詞,自立,*,*,形容詞・アウオ段,連用テ接続,すごい,スゴク,スゴク
便利 名詞,形容動詞語幹,*,*,*,*,便利,ベンリ,ベンリ
な 助動詞,*,*,*,特殊・ダ,体言接続,だ,ナ,ナ
ソフト 名詞,一般,*,*,*,*,ソフト,ソフト,ソフト
です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
。 記号,句点,*,*,*,*,。,。,。
EOS


das ganze geht nur in der shell bzw. konsole, dennoch wollte ich es hier mal sharen.

man braucht
mecab
und mecab benötigt ein wörterbuch für die trennung
mecab-ipadict
(bei ubuntu wird standartmäsig mecab-jumaidic installiert laut blogeintrag ist dies aber nicht so gut und die licens ist ungeklärt, aber es gibt auch ein mecab-ipadic packet)

die projekt website ist unter http://mecab.sourceforge.net/ (auf japanisch)
 
Forum Index » Japanisch auf PC/PDA
Go to: