Ghostscript/Tesseract Einstellungen


#1

Hallo zusammen,

aktuell hab ich leider ein paar Probleme mit der Auswertung bzw. stellt diese mich nicht ganz zufrieden.
Gerne würde ich die Parameter vom Ghostscript und Tesseract etwas anpassen um zu sehen, ob das Ergebniss der Auswertung besser wird.
Aktuell werden beim Umwandeln aus “-” eine “7” bzw. fehlen einige Teile.

Ich habe nach langen Googeln ein Tool gefunden, welches ebenfalls ein *.pdf zu einem *.tiff umwandelt und dann in eine *.txt. Hier hat mit den eingestellten Parametern die Auswertung ohne Probleme oder Abweichenungen funktioniert. Daher würde ich das gerne mal mit AWF testen.

Gibt es eine Möglichkeit die Parameter zu ändern bzw. an welcher Stelle im Code müssen diese geändert werden?

Gruß
Philipp


#2

Den Aufruf von Tesseract kannst du hier anpassen: https://github.com/OpenFireSource/AlarmWorkflow/blob/94c94f9c3d15e279d469188a896aa06b8efecda0/AlarmSources/Fax/OcrSoftware/TesseractOcrSoftware.cs#L63
Den Aufruf von Ghostscript hier: https://github.com/OpenFireSource/AlarmWorkflow/blob/94c94f9c3d15e279d469188a896aa06b8efecda0/AlarmSources/Fax/FaxAlarmSource.cs#L142


#3

Dankeschön!

Ein kleines Anliegen hätte ich aber noch, wie schaff ich es denn nun das ganze zu kompilieren? Irgendwie komm ich da nicht weiter. Wäre super, wenn das jemand kurz erklären könnte.

Gruß
Philipp


#4

Hallo @Philipp238,

das letzte mal, als ich das kompiliert habe, ist schon ein wenig (zeitlich und versionsmäßig) her, ich hoffe, ich kann dir aber trotzdem helfen…

In den Dateien befindet sich ein Ordner BuildTools und darin wiederum eine Datei namens BuildWindows.Release.bat.
Bei mir war es notwendig, einen Pfad in dieser Datei noch anzupassen, da er auf meinem System nicht aufgelöst werden konnte. Falls du das gleiche Problem hast, dass er msbuild.exe nicht findet: Ich habe die Zeile 5 (build=....msbuild.exe) durch build="C:\Program Files (x86)\MSBuild\14.0\Bin\msbuild.exe" ersetzt.

Danach die Datei (BuildWindows.Release.bat) ausführen und er sollte das ganze kompilieren. Im Ordner build/ findest du dann die fertigen Dateien.

Anschließend musste ich noch die Parser.Library.dll in mein fertiges AlarmWorkflow Paket kopieren, das war aber noch zu Zeiten, als die Parser in einem eigenen Repository auf Github waren. Das glaub ich musst du daher nicht mehr machen.

Außerdem habe ich zu meinen fertigen Dateien (Hauptverzeichnis) noch die GeoUtility.dll kopieren müssen, damit die Koordinatenauswertung weiterhin funktioniert hat.

Wie gesagt, das war mein Ablauf für eine der älteren Versionen von AlarmWorkflow. Ob das mittlerweile immer noch so ist, kann ich nicht mit Sicherheit sagen. Vielleicht konnte ich aber trotzdem ein bisschen helfen.

MfG