Wadoku.de Forum
  [Search] Search   [Recent Topics] Recent Topics   [Hottest Topics] Hottest Topics  
[Register] Register /  [Login] Login 
Messages posted by: boscowitch
Forum Index » Profile for boscowitch » Messages posted by boscowitch
Message
also wie gesagt ich würde das gern in den anderen Thread ziehen: http://wadoku.de/forum/posts/list/1205.page

Anmerkungen:
Ich hab den Titel erstmal als Entwicklungsname gewählt, da momentan außer Entwicklern keiner dran arbeiten wird ist noch nichts entschieden. Dokuwa hätte ich ja genommen, aber es ist bereits belegt, ich kann aber mal der Besitzerin eine Mail schreiben ob da noch was draus wird.
Im Idealfall sollten die Zielgruppe auch mit steigendem Wissen zu Mitarbeitern werden.
Ich will aber eher ein Wiki Konzept anstreben, so das man nicht zu viele Mitarbeiten suchen muss.
Ich finde es bei Wadoku momentan auch was zu schwer, man muss z.b. sich als Autor bewerben oder im Forum anmelden um dann nur übers Forum Anmerkungen zu machen.
Bei einem Wiki Konzept wäre dies nicht nötig.

zur Rechtschreibung... ja ich sollte mich nicht so hasten, aber Leute die besser darin sind sind natürlich sehr willkommen!
Ich würde erstmal auch nur persönlichen Kontakt aufnehmen und auch nur
mit einer codebase, mit nichts kann man keinen überzeugen.
10 Jahre fände ich gar nicht mal so schlecht, dann müsste man aber sehr schnell mit der Entwicklung sein.
guter einwand! ich habe mal einen neuen thread aufgemacht: http://wadoku.de/forum/posts/list/1205.page

also hier back to topic, verbesserungsvorschläge für wadoku,
aus den überlegungen zu dokuwa ist mir da auch alle fälle was gekommen,

beispielsätze zu trennen von einzelwort einträgen, um das wörterbuch was schlanker zu halten und die beispielsätze dynamisch mti den einträgen zu verlinken, hier muss man serverlast beachten, man könnte aber auch zur performance verbesserung die verlinkung speichern um bei einer erneuten ansicht von anderen usern schneller reagieren zu können und cpu zu sparen.
Also mal an alle interresierten die mitarbeiten wollen und mehr wissen wollen

Momentan läuft das Projekt unter dem entwicklungsnamen: dokujibiki
Website (noch nix da): www.dokujibiki.de

Sourcecode: http://github.com/boscowitch/dokujibiki

falls der name doch zu absurd ist kann man den namen immer noch ändern (1 kostenloste de domain hab ich noch, wenn jemand spendabel ist kann er auch .jp oder .net holen aber ich sag nur leider relativ teuer

gesucht werden Entwickler und einfach nur user die auch gerne und gut aktiv was beitragen wollen.

Entwickler nehmen wir alle die wir bekommen im bereich:
PHP
XHTML / CSS
C/C++
SQL (MySQL / SQLite)

wer ersnsthaft mtiarbeiten will sollte sich bei mir melden und bei github anmelden um schreiberechte zu erhalten auf das git repository.

User alle die japanisch können! und natürlich Deutsch, jedoch wird es für dieses Projekt nötig sein mehr japanisch als deutsch zu schreiben hingegen zu wadoku.

Die idee kurz beschrieben:
-Ein freies dokuwa jiten Deutsch / Japanisch wörterbuch für bessere suche deutsch -> jap
-Die nutzer sollen hierbei auch die Autoren dieses sein, und auch kontrolieren (wiki like)


wer vorschläge hat ist willkommen, kritik ist auch erlaubt, blos bitte nicht pessimistisch und schlechtmachend ohne das es was bringt.
schon klar aber das problem haste beim n900 nich es gibt nur eine version, also nur 1 binary kein 64bit oder so was, es ist nru nice das man auf dem gerät direkkt testen udn neu kompilieren kann, hat mir seeehhr geholfen, vorallem weil der simulator am rechner 1. 10000mal schneller ist als das device und 2. der home als fat speichert wegen usb -> win und das z.b. immer filesize 0 zurück liefert was alles crashen lies undd die blksize = filesize ist...
jo das es einsames wörterbuch heist ist mir klar, soll so ne artt wortspiel sein, aber dokuwajibiki ist zu lang und is nicht so eingänglich wie auch z.b. dokuwajiten, deshalb soll es auch mehr ein markenname sein als die erklärung, der untertitle / seiten titel bekommt auf jedenfall noch 独和辞典 rein so das es per google als solches finbar ist.
mann kann sogar sagen das dokujibiki schon was lang ist aber ich find es kllingt eingänglicher angenehmner niedlicher ect und gerade da es falsch ist bleibs eher hängen alla markennamen und werbung die genau darauf abzielt.
auserdem wäre es das erstmal einzige freie dokuwajiten.

der punkt mit dem das dann nur die schon gesuchten gut sind stimmt ein wenig, daher müsste auch der eintragende schon einen relativ guten wert geben, aber eine verknüpfung besteht schon, da es ja nur die ergebnisse aneigt die zu der suche passen und diese naach diesem ranking sortiert nicht einach alle nach diesem ranking ausgibt.

noch besser wäre natürlich satistische daten über häufigkeit, die sollten aber umsonst sein, alternativ würde ich auch einen crawler schreiben der eifach mal ausgewählte jap websites durchgeht und selbst solche daten erzeugt. natürlich müsste man da gut auswählen, einfach nur auf google loszulassen wäre fatal bei all dem chat slang auf z.b. 2ch. also onlinezeitungen ect wären vieleicht gut (da gabs doch auch mal so zeitungs analyse für häfigkeit von wörtern , sind die frei verwendbar ? (c) ? dann könnt man ne anfrage an den (c) holder absetzten, und am wichtigsten sind die noch aktuell)

wegen bestehenden daten verwenden... das is so ne sache mit der lizenz und vorallem mit der wörterbuch form.
man kann nicht einfach einen konverter schreiben, da in einem dokuwa ja deutsche wörter alleine stehen müssen und als übersetzung mehrere japanische.
Zum teil auch ganze Sätze mit erklärung und beispielsätze (die beispiele aber in eine getrennte DB / tabelle, so das das reine wörterbuch nicht zu fett wird, man kann dann beim export immer noch mit oder ohne angeben und beides bereitstellen jeh nach ziel device)

ich weis das neu beginnen viel arbeit wird aber ich sag mir wenn keiner mal irgend einen anfag setzt wirds nie was,
auserdem könnte man gut werbung für so ein wörterbuch machen, ich denk da an alle japaner die deutsch lernen die ich kenn, Lehrer/innen von Kursen/Instituten ect. eben vieleicht auch die leute bei LEO wegen einer art integration.
man muss nur darauf achten das leute keine 1:1 kopien von bestehenden kommerziellen Wörterbüchern machen.
arrg eine schande ... ich mag nicht wenn devices einem sprachen aufzwingen

auf meine n900 sd karte hab ich nen kompletten Linux root chain mit make gcc QT GTK X libs ect alle debian tools ect.
python, lighttpd php mysql ect alles auch , auch wenn das overkill ist *g* aber nice das man alles damit mamchen kann. LINUX ROCKS halt
is nice unterwegs nen plugin zu editierne und compilen

muss mal screens / foto von machen wenns perfekt ist.

achja und bevor ichs vergess:
http://www.wadoku.de/forum/posts/list/0/1201.page#8393
hab beschlossen nen dokuwa zu machen für bessere deutsch jap such daten, wenn du lust hast
hmm also ich weiß nicht wie gut man mit LEO kooperieren kann aber ich hab an unserer uni gehört das LEO ein projekt von unserer uni ist (bzw von studenten die bei uns warn (TUM TU München)) fals ich da noch jemand finde der kontakt zu denne habe könnte persönlicher kontakt vieleicht helfen.
unabhängig davon hat die planung shcon bekonnen zusammen mit System mit dem ich auch schon an wadoku soft arbeite würde wir mal anfangen mit einem dokuwa das dann auch komplett frei ist (lizenzmäsig müssen wir noch übebrlegen ob was copyleft GPL oder komplett public domain, damit andere sites wie LEO auch da keine Bedenken haben müssen).
den code für das interface würden wir dann auch unter GPL stellen damit auch alle was davon haben (so eine art open dictionary codebase wäre ein erstrebenswertes endprodukt)

Jeder der interresse hat schon jetzt zu helfen is gern willkommen, programmier sprachen wäre erstmal:
PHP und SQL

wobei C/C++ coder auch willkommen sind, da wir die converter ect aus speedgründen ect darin schreiben werden und die daten über remote MySQL oder MySQL dump erzeugen wolen so das das ohne probleme cron mäsig 1 mal die woche möglich ist für immer aktuelle und viele export formate.


so noch leeres repos und site:
http://github.com/boscowitch/dokujibiki

www.dokujibiki.de
war es mit ner sqlite im offline modus nich machbar ? ^^ bzw wie viel ram / cpu hat so nen teil eigentlich.
gibts ne C oder c++ api dafür ?

nur aus neugier ^^, ich hab ja große fortschritte bei meinem N900 gemacht, muss ich auch mal bald hier zeigen was ich da so alles hergezaubert hab...
jop gut gesagt der.. das sind berechtigte punkte:

1. wadoku ist WA DOKU jap deutsch, und die suche jap deutshc funktioniert recht gut, aber es ist kein deutsch jap wörterbuch, ich wärdafür ein DOKUWA zu starten!!! umbedingt, denn soweit ich weis gibbet kein freies gutes.

die suche nach deutschen liefert nur dank der volltextsuche resultate natürlich nicht sehr gut da der deutsche text sonderzeichen udn sätze enthält z.b. wenn man nach "und" sucht dann komen natürlich alle die und im satz ham, in deinem doku wa würde natürlich zuerst der eintrag und kommen mit jap wörter und sätzen und erklärung dazu iund die jap suche wäre nciht zu gebrauchen.

zur verbesserung der resultate bin ich ach grad dran zu arbeiten in meiner eigenen software so eine art reihenfolge ändern funktion einzubauen, dennoch ist ein dokuwa immer noch besser und vorallem vieeeell schneller in der suche als volltext suche.

2. es sind viele einträge in wadoku... da sfinde ich zum teil sehr hilfreich, aber man könnte z.b. beispielsätze hinten einsortieren oder ganz trennen unter einer extra kategorie... aber wie gesagt oft is es echt hilfreich um ein konjungiertes wort in benutztung zu sehen.


Wär wäre dabei bei einem dokuwa ? 独和辞典を作ろう!
so für alle die mal ab und zu schaun wollen was da so entwickelt wird:

http://github.com/boscowitch/wadoku-notify

hier die read-only url: git://github.com/boscowitch/wadoku-notify.git

jeder der mitmachen will kann ja dann seine patches hier posten und dann kann ich immer noch adden.

achja @system schreib mir einfach mal ne mail über http://boscowitch.de/k.php mit github user ect, dann kann ich dir auchmal meine mail jabber ect schicken (absender nich vergessen

also musst enoch 2 sachen ändenr beim linux build, -ohne -pkg sqlite3 wollte valac nich linken und nach Gtk.init(ref args);
musste noch Notify.init("wadoku-notify"); rein sonst meldet der makieren von text dauernt dbus proxy errors ....
jetzt läufts, überleg grad noch unterverzeichnisse zu amchen alla ./src ./src-mac ./src-win ./src-unix damits was aufgeräumter ist, auserdem werde ich sobalt ich kann makefiles machen ist was schöner grad weil mein texteditor einen tastencombo hat zum compilierne mit make

Hmm das sieht ja shcon ganz nett aus, unter windoww habe ich nur posix und libnotify rausgehauen dann konnt ich mit der option -gtk ein schöneres fenster bekommen, leider halt nru viel zu langsam.
für libnotify braucht man einen daemon, auch unter normalen linux sollte man den schöneren ubuntu daemon isntallierne sonst hat man eine hässliche box von gnome oder halt die von Kde ohne schönne style.

Es so langsam zu splitten und objektorientierter zu machen find ich ne gute idee so langsam wirds mehr code und unübersichtlich...

wir sollten so langsam ein repos erstellen, einfachheitshalber mag ich svn aber git wär auch ok, vieleicht auf berlios oder github...

hier is noch der screen mit dem gtk:
http://www.boscowitch.de/tmp/win7.jpg

EDIT: was sind eigentlich diese ._Files ? die müssen nich in nen repos oder ?
hmm das klingt ja schonmal vielversprechend, also dank polling un dem sollte der mac und win port nicht mehr weit sein.

Ich hab mal ein polling mit timer geadded und die version hier upgeloaded:
http://www.boscowitch.de/jap/wadoku_notify-0.2.1.tar.xz
(xz is das neue lzma hoffe du kannst entpacken)

unter linux funktionierts auch recht gut, man kann jetzt per option:
-polling millisekunden
einstellen wie oft auf veränderung im clipboard gecheckt werdne soll.

so kann man auch selbst festlegen wie ungeduldig man sein will und wie viel cpu leistung verbraten werden soll oder ob man gerade an einer übersetzung arbeitet und schnelle ergebnisse braucht.

Als nächstes guck ich mir mal noch nen ordentliches forken an zum daemon.
Und dann muss ich mal gucken mit windoof und vorallem mit hotkeys da dies nicht so gut systemunabhängig udn unter linux sogar schwer desktop unabhängig zu machen , muss wohl einiges an Xserver gehacking machen.


EDIT:

Also erste tests unter Win7 VM zeigen ... es suckt unter windoof ^^ polling funktioniert, aber leider halt nur mim normalen clipboard, da windows kein "makierter text" clipboart hat.
Leider ist windoof sehr doof und behält die sql nich im speicher auch nach mehreren such anfragen... so dauert jede so an die 5-10sec ^^
(hoffe mac is da klüger oder die der advice call kann das regeln)

das mit dem index kann ich leider bei sql nich so bwz weiß nich in wie weit sqlite das kann, bei meiner ersten sqlite die ich aus dem sqldump von der links site gemacht habe musste ich den index kram rausschmeisen weil sqlite das nich geschluckt hat.... daher weiß ich nich obs es in derer weiße unterstüzt oder gar nicht.

zu überlegen wäre vielicht auch ganz von sql weg und zu einem schnellen vormat wie z.b. das dict format von stardict oder so, das is zwar was beschränkt was länge angeht der übersetzung aber es ist sehr schnell, was ich auch auf meinem handy merke, N900 so 10 dicts gleichzeitig live search und es reagiert sofort.
was da aber bestimmt dann nicht mehr so schön geht ist die ergebnissreihenvolge zu ändern, aber dafür ist die suche auch recht gut.

Mfg
Paso
He danke für diese arbeit, das selbe habe ich auch mal für windows in einer vm gemacht, das ergebniss war das selbe das owner_changed wird nicht gesendet und es passier tnich viel aber ohne das fadvise und libnotify compiliert es schonmal.
Das mit dem pollen hatte ich in der ersten version, ich kann es ohne probleme wieder einbauen als alternativ algo, denke das werde ich mal machen, einziger nachteil ist ich musste ein sleep(5000) einbauen damti die cpu last nur so 5-10% mehr beträgt, dann hat es auch sher schnellen response auser das system ist unter last denn dann kehrt er viel schcneller zu sleep zurück, alternativ werd ichs mal statt mit einem thread mit einem timer probieren die werden glaub was zuverlässiger aufgerufen als sleep schläft.


EDIT: achja und danke für den hinweis auf Meiryo, das ist natürlich auch keine standard linux font, hatts nur rein weil ich die habe und schön aussah ... muss ich auch im nächsten release fixen.
und das mit fadvise ist schade, unter win hat die erste suche ewig gedauert deswegen.

also neue TODO:
-daemon modus
-Polling als alternative für win/mac wer will auch linux
-win / mac ports
-hotkeys

-gaz wichtig auch noch endlich ne eigene seite für die ganze wadoku soft muss mal nen blog oder so aufsetzten und svn/git
heh nichts zu danken ^^ ich bin froh wenn meine arbeit auch genutzt wird also einen dank auch für deine rückmeldung, ohne die hätt ich gar nich gemerkt das es nicht so user freundlich is zum compilieren wegen deralten vala verison in ubuntu.

achja und wenn dus gut findest dann spread the word bei allen (momentan leider nur) linux usern die du kennst die japanisch lernen.

wenn nich dann sag bitte was noch doof ist ^^ nen paar sachen stehn da shcon auf meiner todo liste (daemon modus, hotkeys um sich den 2. und 3. treffer anzeigen zu lassen falls der erste nicht de rrichtige ist und noch nen hotkey um den neue ausgewählten als ersttreffer einzutragen
hmm praktikanten wären nice ^^

momentan schein ich so der einzige zu sein der im bereich wadoku auf PC ect. arbeitet, also wenn ich irgendwann mal zeit hab dann ....

na ja ich setz es mal auf meine ellenlange todo liste, leider is halt auch noch die uni da die mir dauernd aufgaben gibt wozu eigentlcih keiner ne lösung will
 
Forum Index » Profile for boscowitch » Messages posted by boscowitch
Go to: