OCR Texterkennung für Zwischendurch

Neulich fragt mich meine Freundin, welche OCR-Software ich ihr empfehlen könne, möglichst preisgünstig. Texterkennung — vor ein paar Jahren „ganz heißer Scheiß“, aber jetzt? Ich experimentiere damals damit (ebenso wie mit Spracherkennung), nutze es nie ernsthaft, weil auch eine scheinbar „fast perfekte“ Erkennung von 99 Prozent immer noch 6 Fehler auf 3.600 Zeichen bedeutet. Hört sich wenig an, bedeutet aber, daß ich in Fachtexten nochmal gründlichst Korrekturlesen muß und zugeschaltete Wörterbücher bieten trügerische Sicherheit, wenn sie ähnliche Begriffe verwechseln. Bei Zahlen kann man oft noch nicht einmal aus dem Zusammenhang auf mögliche Fehler schließen — man weiß ja nie, welche sechs Zeichen falsch erkannt wurden…

Texterkennung

Texterkennung

Weil sich für OCR im Privatbereich m. E. niemand mehr so richtig interessiert — und große Büros eher auf Spezialscanner mit automatischer Dokumentenverwaltung setzen — bin ich überzeugt davon, daß sich eine Menge „veralteter“ Software für den Heimbereich kostengünstig als „lite“, LE“ usw. finden lassen müßte. Irrtum. — Aber ich habe zwei interessante Ansätze gefunden.

OCR Texterkennung für Zwischendurch weiterlesen

Auf dem Weg zum E-Buch — aus einer Website.

Mein erstes E-Book ist „live “ und ich bin um einiges an Erfahrung reicher: BildSicherlich kann man mit Word u. ä. arbeiten und dann einfach die „gefilterte HTML“-Datei hochladen, der KDP-Import-Konverter wird’s schon richten… Bei einem Roman ein durchaus gangbarer Weg, bei einem Sachbuch mit Bildern, Links usw. nicht unbedingt. Und wenn man hinter die Kulissen guckt (also den XHTML-Quelltext), gruselt es einen.

Mein zweites E-Buch mit neuem technischen Konzept

Deshalb starte ich einen zweiten Versuch. Ich hoffe ja noch immer, die vielen im Blog veröffentlichten Einzelartikel als Grundlage für ein E-Buch verwenden zu können — ist ja ein ähnliches Dateiformat. Trotzdem findet sich leider kein wirklich brauchbares Plugin oder externes Tool, fast überall ist Nachbearbeitung notwendig.

Auf dem Weg zum E-Buch — aus einer Website. weiterlesen

3 Byte für 24 Nadeln

Mit dem Wechsel von kommandozeilen-basierten Betriebssystem wie DOS zu grafischen Benutzeroberflächen à la Windows vollzieht sich auch ein Symbol selbst programmiertWandel bei der Drucktechnik. Heute ist es selbstverständlich, daß man am Computer beliebige Schriften verwenden kann (inkl. zahlreicher Sonderzeichen und Symbolen) und Bildschirmdarstellung sowie das Ergebnis auf Papier weitgehend identisch sind („Wysiwyg“). Das ist nicht immer so.

Symbol für einen 24-Nadel-Drucker kodiert
(Bild: Luhm)

Während Textverarbeitungsprogramme „früher“ einfach nur ASCII-Codes auf die Druckerschnittstelle schicken, ist allein die Druckerhardware dafür verantwortlich wie das Ergebnis letztlich auf dem Papier aussieht. Man entscheidet sich für einen Drucker, weil er über eine bestimmte Anzahl unterschiedlicher eingebauter(!) Zeichensätze verfügt, die man nicht selten von Hand(!) direkt am Gerät über Tasten und Leuchtdioden einstellt.

3 Byte für 24 Nadeln weiterlesen