Tesseract-Optimierung


#1

Hallo zusammen,

ich bin gerade dabei ein ähnliches Projekt auf die Beine zu stellen, habe aber im Moment das Problem, dass tesseract mir zu lange braucht um das Alarmfax auszulesen (ca. 20-30 sec.). Nachdem ich jetzt euren Sourcecode kurz überflogen habe, habe ich gesehen, dass ihr auch tesseract verwendet und wollte fragen, wie lange ein Fax bei euch braucht, bzw. wie ihr das ganze optimiert habt.

MfG

fflue


#2

Hallo fflue,

also bei uns dauert das nur einige Sekunden. (2-3 maximal). Kannst es ja gerne selber mal aus probieren.
Im Grunde haben wir keinerlei Modifikationen vorgenommen - außer an der Tesseract Schriftart selber.

Was planst du für ein Projekt? Hast du vlt. Interesse bei uns mitzuwirken?
LG
Flo


#3

Also praktisch nur ein Training der Schriftart…?

Ich hab vor erstmal ein Alarm-Bildschirm auf einem Einplatinen-Computer (RPi oder Odroid) unter Linux zu entwickeln und dann mit der Zeit weitere Funktionalitäten hinzuzufügen.

P.S.: Was machen eigentlich eure Fax-Pharser so im einzelnen. Wollte mir jetzt mal nicht den Source-Code anschauen… :wink: Studiere Informatik, kann also gern etwas programmiertechnischer werden…


#4

Jep mehr haben wir nicht gemacht.

Was die Parser machen ist relativ einfach: Wir haben die Zeilen welche aus der von tesseract generierten Datei gelesen werden.
Diese werden systematisch durch gegangen und auf die “Schlüsselwörter”/“Regionen”(Enums) untersucht. Sollte ich jezad das Schlüsselwort in einer bestimmten Region finden wird der Inhalt der Zeile ohne das Schlüsselwort in feste Felder einer Klasse gespeichert. So mal im Groben. Da steckt teilweise noch ein bisschen mehr dahinter, was du dir aber auch gerne selber mal anschauen kannst.

LG
Flo


#5

P.S. Ich habe keine Erfahrungswerte zu der Performance von Tesseract auf einem Raspberry o.ä. Kann gut sein das hier die Performance schlechter ist.


#6

Noch arbeite ich nicht auf einem MiniPC, sondern auf meinem HomeServer, der eigentlich genügend Leistung haben sollte… An wen könnte ich mich den wenden, wenn ich fragen zum Training von Tesseract habe?


#7

Öhm das Tesseract Training hab ich gemacht. Worum gehts.


#8

Noch um nichts. Muss mich da mal richtig einlesen wie das funktioniert. Bis jetzt hab ich das nur kurz überflogen… nur falls ich auf Probleme stoßen sollte…
Vielleicht komm ich morgen oder übermorgen mal dazu…


#9

Im Grunde sollte dir die Anleitung auf der Tesseract Seite genügen. Mehr hatte ich auch nicht zur Verfügung (außer Faxe von uns).
Mehr kann ich dir dazu nicht sagen/helfen.
LG
Flo


#10

Ist zwar etwas verspätet, aber mal eine blöde Frage. Ein “ähnliches” Projekt? Würde es nicht mehr Sinn machen, die Kräfte zu bündeln und zusammenzuarbeiten? Davon könnten wir alle profitieren.


#11

Hätte ich nichts dagegen… will halt mit Linux arbeiten. Wenn ihr da nen zweites Gleiß aufmachen wollt, gern…


#12

Danke für das Angebot, aber Linux ist derzeit nicht in unserem Fokus. Dann wünsche ich dir viel Erfolg bei deinem Projekt!