Wie scanne ich das wohl am effektivsten?

7. Mai 201016 J.

Wie kommst Du jetzt auf den 1. FC Kaiserslautern?
Von wegen "briegeln" und so?

7. Mai 201016 J.

Also, was XML angeht… Ich versuche es mal so einfach wie möglich zu machen.

XML ist ein Textformat. Textformat bedeutet, dass XML-Dateien keine besondere Software benötigen, um erzeugt, betrachtet und verändert zu werden. Der simpelste Texteditor reicht, z.B. WordPad (Windoof), TextEdit (MAC), vi (für die ganz harten). Das ist natürlich dann besonders wichtig, wenn es um Daten geht, die in 50 Jahren noch zugänglich sein sollen.

Drei Sachen machen XML besonders interessant. Zum einen gibt es die Konvention, dass die »eigentlichen« Daten, die verwaltet werden sollen, von der Beschreibung (»Auszeichnung«), was die einzelnen Datensätze genau sind, klar und explizit getrennt sind. Zum Vergleich: in herkömmlichen Datenformaten ist diese Trennung i.a.R. impliziert. Ein mit der Schreibmaschine getippter Schriftkartenkatalog könnte z.B. so aussehen:

SCHRIFTENKATALOG BLEISETZER.DE, 1. Auflage, Mai 2010

Name: Dominante
Schnitt: kursiv
Schöpfer: Johann Schweitzer, Frankfurt am Main
Hersteller: LUDWIG &amp; MAYER, Frankfurt am Main
Erstguss: 1959
Grade: 6 8 9 10 12 14 16 20 24 28 36
Kartennummer: XYZ-DOMIN-01

Name: Prägefest
Schöpfer: Eduard Lautenbach, Leipzig
Hersteller: LUDWIG &amp; MAYER
Erstguss: 1929
Grade: 12 14 16 20 24 28 36 48 60 72 84
Kartennummer: XYZ-PRAEG-01

Ein Mensch erkennt sehr schnell, wie das Format aufgebaut ist: die einzelnen Datensätze sind durch Leerzeilen getrennt, die »eigentlichen« Daten stehen hinter den Doppelpunkten, die Auszeichnungen davor. Ein Computer kann das aber nicht erkennen. Um diese Daten computermäßig zu verarbeiten (um die Daten auf einer Website zu zeigen oder alles Schriften von Lautenbach zu finden), müsste man ein eigenes Programm schreiben, nur für dieses Format. Obendrein sind solche Adhoc-Formate fehleranfällig. Fehlt irgendwo ein Doppelpunkt oder steht irgendwo einer, wo er nicht hingehört, versagt die Software.

Bei einer Excel-Tabelle sähe die Sache nicht viel anders aus.

Ein XML-Dokument sähe z.B. so aus:

Hier sind »eigentliche« Daten und Auszeichnungen explizit & klar voneinander getrennt. (Alles, was in <> steht, ist Auszeichnung, der Rest Daten.)

Auf den ersten Blick ist das für einen Menschen vielleicht weniger übersichtlich. Aber Computer können mit diesem Format viel besser umgehen. So kann man mit einem Standard-XML-Befehl sofort herausfinden, welche Schriften z.B. zwischen 1925 und 1930 erschienen sind. Es gibt frei verfügbare Standard-Software für alle Betriebssysteme, mit der man solche XML-Dokumente editieren, durchsuchen und verwalten kann. Das ist der zweite große Vorteil von XML: man muss nicht mehr für jedes Format ein neues Programm schreiben, das existiert schon alles. Der dritte große Vorteil: man kann sich sein Format frei zusammen stellen (also z.B. »schriftkatalog« als Wurzel, darunter beliebig viele »schrift«-Elemente, die wiederum xyz enthalten usw. usf.)

Hat man sich auf ein solches Format erst einmal geeinigt, ist es ein leichtes, daraus (mit den schon beschriebenen frei verfügbaren Standardtools) menschenfreundliche Formate zu erzeugen, also Webseiten, druckbare Dokumente, sogar Spreadsheet-Tabellen. Man kann das XML-Dokument auch computergestützt erzeugen. (Man muss also nicht manuell die ganzen <> und so eingeben.)

Die Technologie wurde übrigens genau für diesen Zweck — Dokumentenverwaltung — vor über 40 Jahren entwickelt und ist äußerst stabil und zukunftssicher. Ohne sie gäbe es kein Web. (Der XML-Vorläufer SGML und der webspezifische Dialekt HTML sind eng verwandt.)

Was die Präsentation im Web angeht, würde der Nutzer von der XML-Basis nichts sehen. Aus seiner Perspektive sähe das genauso aus wie eine PHP-basierte Website. Mit der XML-Basis ließen sicher aber eben noch so viele andere Sachen machen.

7. Mai 201016 J.

Ja, das schreit nach einer Datenbank – bitte nicht in Excel basteln …

Das Projekt hat ja mehrere Phasen. Da ist einmal die Dateneingabe und dann die Frage, wie man die ganzen Daten verwaltet. Wenn nun jemand gern mit Excel arbeitet und die Daten damit in ein Tabellenformat bringen möchte, soll der das gern tun. Das wäre sicher der Löwenanteil der Arbeit. Liegen die Daten erst einmal strukturiert vor, sollte man sie einfach in das endgültige Backend-Format exportieren können, egal ob das nun XML oder SQL ist. (Ich wäre immer noch für XML. Das wäre in vielerlei Hinsicht einfacher.)

7. Mai 201016 J.

Joh, danke auch :)
Macht gewaltig was her....

Georg, mein Beitrag war nicht auf deinen darüber bezogen, sondern auf die Option, erst einmal die Daten in irgendeine Form zu bringen. Und da eignet sich die im JPEG vorhandene IPTC-Liste hervorragend für, da heutzutage jedes halbwegs aktuelle Bildverarbeitungsprogramm (bei mir z.B. ACDSee8 von 2005) eine einfache und schnelle Eingabe dieser Daten erlaubt. Und diese Eingaben können viele Mitstreiter parallel vornehmen. Dann sind die Daten im Bild eingebettet und können automatisiert ausgelesen werden. Ich stecke da nicht so tief drin, aber meines Halbwissens nach basiert die IPTC-Liste sogar auf einer Markup-Language.

Jo

7. Mai 201016 J.

Ersteller

Was mir wichtig erscheint:

1. Der Besucher der Netzseite sollte in einen Bereich Typokartei wechseln können. Wir müssen uns doch in die Besucher hineinversetzen. Uns sagt eine Unterrubrik Gruppe Xa — Gotisch etwas, aber viele Besucher sind nicht vom Fach, lieben aber Schriften. Ich habe das in der jetzigen Schriftensammlung über ein Thumbnail gelöst:

http://www.bleisetzer.de/schriftensammlung.html

Aber mit ca. 500 Einträgen ist eine Grenze beim zeitlichen Aufbau erreicht. Hier 1.600 Scans so zu zeigen, würde wohl dein akzeptablen Zeitrahmen sprengen.

Also schon ein Problem, für das wir eine Lösung brauchen.

2. Ich bin Anwender, Händler. Meine Netzseite und der dort angebotene Inhalt dient mir zur Vertriebsunterstützung. Das Anbieten einer solchen Typokartei, in der der Besucher selbst recherchieren kann, tangiert meinen Umsatz nicht direkt, ist aber ein weiterer Vertriebs-Multiplikator, der den Bekanntheitsgrad der Existenz des PBM erhöhen wird.

Ich will damit sagen: Ich kann klar formulieren, wie ich es letztendlich gern hätte, was ich für den Besucher für sinnvoll und hochinteressant halte. Aber ich habe keine Kompetenz, um mir auch nur selbst ein Urteil zu erlauben, welche Programmierung am sinnvolsten eingesetzt werden sollte.

3. Ich kann (Frei)Zeit investieren. Daten manuell erfassen in welcher Form auch immer. Aber das war's. Ich bräuchte also letztendlich eine Zahl: Das wird Dich das kosten, Georg. Mein Job wäre dann wiederum, dieses Geld aufzutreiben. Das ginge schon... nicht von heute auf morgen, aber innerhalb von zwei, drei Wochen. Und dann könnte ich den Startschuß geben. Wenn's Geld zusammen ist. Und nur dann. Aber das bekomme ich schon hin. Joh, joh...

Dann diskutiert mal über die Programmierung.

Georg

7. Mai 201016 J.

Schon klar.

Wenn ich es recht verstehe, geht es erst einmal um Schritt 2: Verschlagwortung (hässliches Wort) der Scans. Dazu siehe oben. Daraus kann dann auch jedes Bildverwaltungsprogramm per Stapelverarbeitung sinnvolle Dateinamen erstellen. Diesen Schritt 2 kann die Community hier lösen, wenn die Scans in irgendeinem, wie du es nennen würdest, Netzraum liegen und die Mitstreiter Zugriff darauf haben. Man müsste sich nur auf die konkrete Vorgehensweise und die Zuordnung der Schrifteigenschaften auf die IPTC-Felder einigen. Ich würde mir zutrauen, an einem ruhigen Abend mal 50 Schriftmuster zu verarbeiten. Kosten: meine für diese Zeit umsonst bezahlten GEZ-Gebühren :P . Noch 9 andere Helfer und diese Phase wäre abgearbeitet.

In Schritt 3 würden dann die IPTC-Daten automatisiert ausgelesen und in eine Datenbank geschrieben. Da halte ich mich raus.

Und in Schritt 4 diskutieren wir dann die Präsentation.

So, und jetzt gehe ich meine GEZ-Gebühren verbrauchen.

Schönen Feierabend und schönes Wochenende

Jo

8. Mai 201016 J.

Ersteller

Moin, Moin,

ich gebe heute ein "Training On The Fly", wie Ihr Anglophilen es vielleicht nennt — ein Einführungsseminar, wie ich es verschämt beschönigend nenne. Der Käufer des Boston-Tiegels holt das gute Teil heute hier ab. Sie hatte noch nie einen Winkelhaken in der Hand. Aber wenn sie heute Abend heim nach Berlin fährt, dann wird sie wissen, wie man eine einfache Akzidenz baut und auf dem Tiegel druckt. Ach ja: Und Ihr Kofferraum wird etwas durchhängen von dem vielen Material, das sie ja auch noch nicht hat und sich heute zulegen wird. :)

@ Ralf

Dieser URL-Knopf funktioniert übrigens genial einfach für HTML-Laien wie mich. Kompliment und Dankeschön.

Wenn ich alles richtig verstanden habe, könnte man also die mit jedem JPEG automatisch mitgeführten Textdaten editieren und wie im Beispiel erweitern:

----------

Name: Dominante

Schnitt: kursiv

Schöpfer: Johann Schweitzer, Frankfurt am Main

Hersteller: LUDWIG & MAYER, Frankfurt am Main

Erstguss: 1959

Grade: 6 8 9 10 12 14 16 20 24 28 36

Kartennummer: XYZ-DOMIN-01

_______

Frage: Wie kommt man an diese Textdaten bei einem JPEG heran? Also mit welchem Editor muß ich was und wie aufrufen? Damit ich das einmal an einem Beispiel für mich durchziehen kann?

Ich müßte dann alle Bilder irgendwo hochladen und diejenigen, die helfen wollen beim Editieren, bräuchten einen Zugang, richtig? Das könnte ich sicher organisieren. Wenn wir nur unter uns Profis nach Helfern suchen, müßte das auch zuverlässig funktionieren.

Parallel diskutiere ich gerade mit Kollegen, Freunden und Kunden über den Tagebuch-Eintrag auf meiner eigenen Netzseite zum Thema Typokartei. Man sieht dort schon das Kernproblem der Finanzierung und macht entsprechend Vorschläge. Die ich allerdings zum jetzigen Zeitpunkt für verfrüht halte. Ich glaube an das Prinzip des Nehmens und Gebens bei solchen altruistischen Projekten. Frage: Wenn alles fertig ist und online gegangen ist: Wäre es dann möglich, in einem Rutsch Daten, Bilder und vor allem die Verwaltungsseite auf eine CD zu ziehen? Ich will die dann nicht verkaufen, sondern den Leuten kostenlos zur Verfügung stellen, die sich, wie Ihr hier, in welcher Form auch immer engagiert haben oder das noch werden.

Sieht doch ganz gut aus. Pachulkes Tipp mit dem wechselndem Bildschirmschoner ist einfach spitze. Seit gestern sitze ich regelmäßig (wie immer) vor meinem PC. Aber jetzt läuft verstärkt der Bildschirmschoner und ich schaue mir diese wundervollen Schriften an. Bisher gab's noch keine Wiederholungen. :)

Georg

8. Mai 201016 J.

Frage: Wie kommt man an diese Textdaten bei einem JPEG heran? Also mit welchem Editor muß ich was und wie aufrufen? Damit ich das einmal an einem Beispiel für mich durchziehen kann?

Ich glaube Du meinst die EXIF-Daten. Mir fällt auf Anhieb jetzt zwar kein Programm ein, um diese zu bearbeiten, aber suche doch einfach mal in der Suchmaschine Deines geringsten Misstrauens danach.

8. Mai 201016 J.

Frage: Wie kommt man an diese Textdaten bei einem JPEG heran? Also mit welchem Editor muß ich was und wie aufrufen? Damit ich das einmal an einem Beispiel für mich durchziehen kann?

Ich glaube Du meinst die EXIF-Daten. Mir fällt auf Anhieb jetzt zwar kein Programm ein, um diese zu bearbeiten, aber suche doch einfach mal in der Suchmaschine Deines geringsten Misstrauens danach.

Hallo,

nein nicht die EXIF-Daten. Die sind für die technischen Bilddaten da. Ich sprach von den IPTC-Daten, die den Bildinhalt kategorisieren.

Wie ich oben schon schrieb, benutze ich als Bildverwaltung ACDSee8. Aber auch jede Freeware-Bildverwaltung (StudioLine, PhotoManager, um nur die ersten Treffer zu nennen) sollte das über die Bildeigenschaften können.

Hier ein Screenshot:

http://www.jikie.de/Dominante%20kursiv.jpg

Und hier die Bilddatei mit Beispieleinträgen zum Download (rechte Maustaste, Ziel speichern unter):

http://www.jikie.de/ZZZ00_1_IPTC.jpg

Wir müssten uns nur einigen, welche Informationen in welches Feld eingegeben werden.

Jo

PS: Ich habe gerade in Photoshop (Version 8 ) geschaut: da geht es über die Datei-Information. Aber nicht so übersichtlich.

8. Mai 201016 J.

Ersteller

Uh, bin ich müde. Seit 6 Uhr auf den Beinen, ab 7 gearbeitet und ab 9 Uhr der Dame, die den perfekten Boston-Tiegel gekauft hat, eine schnelle Einweisung in den Bleisatz gegeben und eine Nyloprint-Anlage erklärt. Sie wird zukünftig übrigens in Berlin Letterpress anbieten. Eine Amerikanerin, sehr nett.

Ich hätte sogern Frakturfreaks Blog-Eintrag über die Cherry-Tastatur gelesen. Auf die stehe ich ungemein. Und zwar aus einem einzigen Grund: Der satte Rückdrall der Tasten. Seit ich an PC arbeite, also seit 1982, mag ich Tastaturen, bei denen eine echte Feder unter der Taste die Finger zurückrallen läßt... dralllll... einfach nur gut. Die aktuelle Cherry-Tasta, ist ein Schrott-Teil aus China. Die Tasten prellen zwar, aber recht häufig klemmen sie fest, wenn sie angeschlagen werden. Wirklich nervig. Dabei ist mir der Preis bei Tastaturen nicht so wichtig. Wenn der Drall stimmt. Seufz.

Wollte sagen: Bin jetzt einfach zu müden, um noch irgendetwas zu lesen.

9. Mai 201016 J.

Also auch von mir jetzt nochmal vielen Dank für dieses Projekt! Wir können nie genug Schriftmuster haben! :huhu: Ich helfe natürlich auch gerne (kostenlos) beim Erfassen von Daten oä.

Thorsten: Was der Vorteil von XML sein soll, verstehe ich leider nicht. Die naheliegende Lösung (und wohl auch einfachere und schnellere) wäre eine relationale Datenbank, MySQL zum Beispiel.

Die Datenbank wäre schnell entworfen, dann müßte man bloß noch ein Skript schreiben, daß die in die Bilder eingetragenen Metadaten in SQL umschreibt.

Das größte Problem ist meiner Meinung nach die Frage nach der Klassifikation. Die DIN ist ja wohl kaum geeignet.

9. Mai 201016 J.

Ersteller

Das größte Problem ist meiner Meinung nach die Frage nach der Klassifikation. Die DIN ist ja wohl kaum geeignet.

Ich denke, wir bewegen uns hier in der Welt der Bleisatz-Schriften. Somit sollte die DIN 16518 Anwendung finden. So ist auch die Schriftensammlung auf meiner Netzseite aufgebaut. Auch Ihr digitalen Druckvorstufen-Kasper nutzt diese DIN, wenn Ihr an Bleischriften herangeht.

9. Mai 201016 J.

Die DIN-Gliederung ist halt nicht einheitlich und unvollständig: Bei den gebrochenen Schriften sind die verschiedenen Schriftarten sinnvollerweise als Untergruppen angelegt, bei der Antiqua dagegen bilden sogar die Stil-Unterarten (Ven., Frz. Renaissance usw.) Hauptgruppen. Die Antiqua ist gleichzeitig die einzige Gruppe, bei der überhaupt verschiedene Stile unterschieden werden. Ein völlig unlogisches Durcheinander! Aber wenn’s halt sein soll … :?

9. Mai 201016 J.

Ersteller

Das größte Problem ist meiner Meinung nach die Frage nach der Klassifikation. Die DIN ist ja wohl kaum geeignet.

Ich denke, wir bewegen uns hier in der Welt der Bleisatz-Schriften. Somit sollte die DIN 16518 Anwendung finden. So ist auch die Schriftensammlung auf meiner Netzseite aufgebaut. Auch Ihr digitalen Druckvorstufen-Kasper nutzt diese DIN, wenn Ihr an Bleischriften herangeht.

Ja, Du hast völlig recht. In allen Punkten. Es geht nicht anders.

9. Mai 201016 J.

Was der Vorteil von XML sein soll, verstehe ich leider nicht. Die naheliegende Lösung (und wohl auch einfachere und schnellere) wäre eine relationale Datenbank, MySQL zum Beispiel.

Wenn heutzutage Daten strukturiert erfasst werden sollen, ist XML immer erste Wahl. Warum? Weil man daraus über einen entsprechenden Parser jedes beliebige Endformat generieren kann. Konsequent getagte Daten können selbst Aliens mit unserem heutigen Wissensstand entschlüsseln, auch wenn sie den Inhalt nicht unbedingt verstehen. Millionen verschiedener Bitfolgen, von denen sich einige immer wiederholen und bei denen in jeder direkten Wiederholung ein zusätzliches Zeichen an zweiter Stelle steht. <name>Dominante</name><schnitt>kursiv></schnitt><author_firstname>Johann</author_firstname> u.s.w. Ist wie HTML, nur konsequenter und flexibler.

Jo

9. Mai 201016 J.

Mit Absicht Doppelpost:

Frage an die Spezialisten hier: Kann man die IPTC-Datenbasis in den Scans in die von uns benötigten Kategorien ändern? Wenn ja, sollte das im nächsten Schritt erfolgen. Die benötigten Felder weiß sicher Georg am besten. Wenn hier kein Bildverarbeitungsspezialist dabei ist, kann ich die Frage ja mal bei den Nachbarn stellen.

Jo

10. Mai 201016 J.

Ersteller

Folgende Daten sollten meiner Meinung nach vorgehalten werden:

Schriftname inkl. Versionsbezeichnung und nicht abgekürzt.

Beispiel: Helvetica schmalmager

Schriftgießerei inkl. deren Sitz und Kürzel

Beispiel: Bauersche Gießerei, Frankfurt am Main BG

Erstgußjahr

Name des Schriftgestalters in der in Publikationen üblichen Form.

Beispiel: K.F. Baum

Gruppe/Untergruppe nach DIN 16518

Beispiel: Gruppe Xc — Gebrochene Schriften — Fraktur

Ich unterstelle, daß dies die häufigsten Suchmerkmale sind, die Interessenten dann zum entsprechenden Eintrag führen bzw. nach denen selektiert wird. Ausführliche Informationen finden sich dann auf der Karte selbst.

Fehlt etwas?

Vom nächsten Mittwoch bis Samstag bin ich nicht erreichbar.

10. Mai 201016 J.

Ich bin nach wie vor überzeugt, daß MySQL hier die bessere Wahl wäre. Daraus läßt sich (einfacher und schneller) ebenfalls jedes beliebige Ausgabeformat erzeugen. Relationale Datenbanken wurden schließlich dafür geschaffen, strukturierte Daten zu speichern, und einfach und schnell zugänglich zu machen.

Aliens müssen die Daten nicht lesen (was sie aber natürlich könnten) sondern in erster Linie ein PHP-Programm, das Suchabfragen erlaubt und die Muster anzeigt. Womöglich hat Georg bereits eine MySQL-Datenbank? Ansonsten ließe sich das bei seinem Anbieter sicher einfach nachrüsten.

10. Mai 201016 J.

Ersteller

Ich kenne Relationale Datenbanken (Ingres) aus meiner Atex-Zeit. Das lief auf Whitesmith-Unix auf unseren DEC-Großrechnern. Aber das ist 20 Jahre her. :) Aber zumindest ist mir das Prinzip vertraut.

"Wichtig is' auf'm Platz." Bedeutet für mich: Wer das Ding programmiert, sollte die Entscheidung treffen. Denn das ist dann seine Verantwortung, seine Baustelle.

10. Mai 201016 J.

Ersteller

Womöglich hat Georg bereits eine MySQL-Datenbank?

Habe gerade Antwort erhalten: Ja, so etwas habe ich.

10. Mai 201016 J.

Ich bin nach wie vor überzeugt, daß MySQL hier die bessere Wahl wäre. Daraus läßt sich (einfacher und schneller) ebenfalls jedes beliebige Ausgabeformat erzeugen. Relationale Datenbanken wurden schließlich dafür geschaffen, strukturierte Daten zu speichern, und einfach und schnell zugänglich zu machen.
Aliens müssen die Daten nicht lesen (was sie aber natürlich könnten) sondern in erster Linie ein PHP-Programm, das Suchabfragen erlaubt und die Muster anzeigt. Womöglich hat Georg bereits eine MySQL-Datenbank? Ansonsten ließe sich das bei seinem Anbieter sicher einfach nachrüsten.

Ich habe jetzt keine Lust, alle Artikel zur Wissensspeicherung auf der Basis von XML herauszusuchen. Deshalb nur eine Bemerkung: du sprichst von einem Datenbanktyp und einer Abfragesprache, SQL und PHP. Für beide benötigt man ein entsprechendes Frontend. Kann hier in der Runde noch jemand auf seinem aktuellen Rechner eine dBase-Datenbank öffenen? Oder gar eine Redabas-Datei?

Es geht imho nicht darum, wie Georg die Daten präsentieren kann, sondern, nach seinem bewundernswerten altruistischen Verständnis, um die Erhaltung für die Nachwelt. Seine Frage war nicht: „Wie kriege ich das hier am schnellsten meinen Besuchern präsentiert?“, sondern „Wie sichern wir diesen Schatz für unsere Nachkommen?“ Ergo führt kein Weg an einem ausschließlich textbasierten, ohne jegliches Frontend auskommenden Format wie XML vorbei.

Denn das kann ich sogar an der Konsole öffnen und trotz meiner rudimentären Kenntnisse von XML verstehen.

Wenn du dir dann daraus eine Datenbank bastelst, ein zweiter eine PP-Präsentation oder die ESA eine Laserdisk für die Kollegen hinter dem Andromeda-Nebel, es bleibt immer <publisher>Der Bleisetzer & Koll.</publisher>.

So wird man unsterblich!

Gute Nacht

Jo

PS: kann ich hier mal bitte ein wenig Unterstützung von den Spezialisten bekommen, die mich mit meinem soliden Halbwissen zumindest moralisch unterstützen?

11. Mai 201016 J.

Ich bin nach wie vor überzeugt, daß MySQL hier die bessere Wahl wäre. Daraus läßt sich (einfacher und schneller) ebenfalls jedes beliebige Ausgabeformat erzeugen.

Dass dies »einfacher und schneller« geht, werden wohl vor allem jene denken, die eben mehr Erfahrung mit MySQL/PHP haben als mit XML.

;-)

Relationale Datenbanken wurden schließlich dafür geschaffen, strukturierte Daten zu speichern, und einfach und schnell zugänglich zu machen.

Wäre das einfache Zugänglichmachen das entscheidende Kriterium, hätten RDBMS-Systeme schon verloren. Schließlich bieten sie keine Standard-Mechanismen, um die in einer Datenbank »eingeschlossenen« Daten ordentlich zu präsentieren. Nein, dazu muss immer erst eine eigene Softwareanwendung programmiert werden. Wirklich einfach ist das nicht. XML-Daten kann man hingegen wirklich einfach per Stylesheet präsentieren. Und die Stylesheet-Technologie ist eben schon eingebaut.

RDBMS-Systeme haben natürlich ihre Berechtigung, z.B. wenn es um Datendurchsatz geht, performante parallele Zugriffe und vor allem häufige Schreibzugriffe. Das ist bei dem Schriftenkatalog — der nach der vergleichsweise kurzen Dateneingabephase read-only bleiben kann — aber kein wichtiges Thema.

(Im Übrigen wären die Entwickler und Verfechter von SGML/XML ja wohl Idioten, wenn RDBMS das Allheilmittel zur Datenspeicherung wäre.) Wie auch immer, XML/SGML brilliert, wenn es um das langfristige Verwalten von Dokumenten geht, besonders wenn Untermengen aufgrund bestimmter Kriterien extrahiert werden müssen. So ist SGML schon seit Jahrzehnten das Format, in dem Wörterbuchverlage ihre Datensätze speichern.

Aber um wieder zum Thema zurück zu kehren… Die eigentliche Frage ist wohl, was Georg mit seinem Schatz eigentlich machen will. Geht es in erster Linie darum, Werbung für seine Website zu machen, soll er sich halt jemanden suchen, der ihm ein Adhoc-Webanwendung zusammen hackt; natürlich darf die dann auch auf PHP und MySQL aufsetzen. Geht es aber darum, die Informationen langfristig und verlässlich der Allgemeinheit zugänglich zu machen, würde ich wie (»CADtp«) schon einen robusteren Ansatz empfehlen. Dann würde ich auch gern (unentgeltlich) mithelfen. (Letzteres schlösse ein gesundes Maß an Publicity für den Hauptsponsor natürlich nicht aus. :D)

11. Mai 201016 J.

Kann man die IPTC-Datenbasis in den Scans in die von uns benötigten Kategorien ändern?

Ja, am besten sicherlich über XMP. XMP ist im Prinzip IPTC mit XML-Syntax. Man kann eigene Schemas definieren und so neue Datenfelder definieren. Adobe & Co. fördern XMP als IPTC-Nachfolger.

Wie es mit der Software-Unterstützung für das Schreiben eigener XMP-Felder aussieht, steht aber auf einem anderen Blatt. Die Perl-Bibliothek exiftools (hat auch ein Kommandozeilen-Interface) unterstützt das. Was grafische Bildverwaltungssoftware angeht, müsste ich erst mal ein bisschen suchen.

11. Mai 201016 J.

Ersteller

Moin,

zunächst zum mir unterstellten Altruismus bzw. meinem Motiv:

Ich bin ein Vertriebsprofi, der vor rund fünf Jahren, an seinem 50. Geburtstag, beschlossen hat, aus dem politischen System der Profitmaximierung auszusteigen. Den Rest meines Lebens möchte ich mich ausschließlich mit Dingen beschäftigen, die mir Freude machen (Freude ist etwas anderes als Spaß). Da ich ein armer Mann bin, muß ich aber auch weiterhin für meinen Lebensunterhalt arbeiten. Was nicht schlimm ist, denn ich mag die Arbeit. Konkret heißt das: Ich habe bei allen meinen Aktivitäten auch immer meine Reputation im Kopf, mache also (fast) nie etwas uneigennützig. Bei der Vermarktung von Bleisatz muß ich nur einen winzigen Bruchteil der Vertriebsmethoden einsetzen, die ich erlernt habe, um damit geschäftlich soviel Erfolg zu haben, daß ich davon leben kann. Das reicht mir völlig aus. Mehr wäre eher von Übel. Aber ich möchte die richtige Reputation. Nicht die, mit Bleisatz massig Geld zu verdienen. Das interessiert mich Null.

Bei diesem Typokartei-System heißt das: Ich bekomme die richtige Reputation, wenn ich das Projekt letztendlich so realisiere, daß die Abbildungen jedem zur Verfügung stehen und er automatisch und ohne etwas tun zu müssen (und ohne etwas dagegen tun zu können) die entsprechenden Informationen zur Schrift in der Abbildung mitkopiert. Ursprünglich war geplant, einen jeden Scan mit einer Signatur, um 90° gekippt, links außen mit ins Bild zu nehmen: www.Bleisetzer.de Wenn man diese Information mit in die Bilddaten hineinpacken könnte, empfände ich das als optimaler. Ideal wäre, wenn eine Google-Suche die Daten berücksichtigen würde. Aber das ist wohl zuviel verlangt? Eine solche Lösung wäre jedoch in meinen Augen die optimale Reputation für mich, weil sie meine Liebe zu den alten Schriften zeigt. Einen direkten Einfluß auf meinen Umsatz dagegen brauche ich nicht. Glaube auch nicht, daß dies Sinn machen würde.

Die Leute, die die Programmierung für mich realisieren werden, sind Hannah & Chris. Hannah kenne ich seit fast 23 Jahren, sie ist meine Tochter. Chris ist derjenige, der sich ungefragt mit ihr beschäftigt. (grmpf...). Aber der Typ ist schon in Ordnung. Sie werden mir die Programmierung so realisieren, daß ich sie bezahlen kann. Family-Klüngel und so... Damit es nun nicht zu unnötigen Reibungsverlusten bei der Informationsübermittlung kommt, habe ich Hannah gebeten, sich hier zu registrieren. Sie wollen wissen, was wir nun eigentlich wollen. Das ist nachvollziehbar.

Also: Wenn es möglich ist, alle notwendigen Informationen fest mit dem JPEG zu verbinden und diese Informationen so einfach einzugeben sind, daß mehrere Leute jeweils einen Teil der JPEGs bearbeiten können — eine Übermittlung über CD, so daß nicht mehrere Leute Zugriff zum Server brauchen (was aus Sicherheitsgründen nicht machbar wäre). Ich die bearbeiteten Daten dann zusammenfasse und Hannah & Chris als CD übergebe, so daß sie nach unseren Wünschen dann die Programmierung erledigen (einschließlich eines Abfrage-Menues als Netzseite), dann wäre es das meiner Auffassung nach. Je einfacher, desto besser.

Georg

11. Mai 201016 J.

Ursprünglich war geplant, einen jeden Scan mit einer Signatur, um 90° gekippt, links außen mit ins Bild zu nehmen: http://www.Bleisetzer.de Wenn man diese Information mit in die Bilddaten hineinpacken könnte, empfände ich das als optimaler. Ideal wäre, wenn eine Google-Suche die Daten berücksichtigen würde. Aber das ist wohl zuviel verlangt?
Also: Wenn es möglich ist, alle notwendigen Informationen fest mit dem JPEG zu verbinden und diese Informationen so einfach einzugeben sind, daß mehrere Leute jeweils einen Teil der JPEGs bearbeiten können

Vielleicht ist der Ansatz nicht schlecht (Details sind zu prüfen, aber lösbar):

Man kann JPEGs mittels XMP Metadaten mit auf den Weg geben. Das sind Informationen auf Textbasis, die an der Datei kleben, aber erst mal nicht im Bild sichtbar sind. Die Daten kriegt man mit verschiedensten Programmen* in die Bilder - vermutlich je nach Programm auch in ganzen Gruppen, damit das Eingeben nicht zu mühsam wird.

Damit wären schon mal die Bilder selbst sauber mit Informationen unterfüttert - wohl der beste Ausgangspunkt für alles weitere.

Hier spalten sich jetzt die Anwendungsmöglichkeiten:

- Es sollte möglich sein, mit einem Programm (kurzrecherche spuckt XSLT aus) aus diesen Bildern eine XML-Datei zu generieren. Dadurch hat man eine mensch+maschinenlesbare Liste aller Bilder und Daten.

- aus der XML-Datei kann man dann z.B. auch eine mysql-Datenbank füttern - für gängige Webanwendungen vielleicht nicht übel - aber die Experten können das sicher auch direkt ab XML?

- Mit den XMP-Daten die in den Bildern liegen, sollte man mit dem neuen tollen automatichen Bildunterschriften-Feature von Indesign CS5 doch eigentlich zu jedem Bild die um 90° gedrehte Bildunterschrift mit allen relevanten Daten generieren können? Wenn dann daraus neue JPGs generiert werden (ob aber die XMP-Daten der Originalbilder dann erhalten bleibt? Ich bezweifle es ...) hätte man fertig benamte Bilder.

- Wertet Google XMP-Daten der Bilder aus? Wenn ja: super. Wenn nein: Die Bilder werden auf der Webseite ja ohnehin im Kontext der Informationen präsentiert - Google wird damit zurecht kommen.

* Hier sind einige aufgelistet: http://en.wikipedia.org/wiki/Extensible ... support.29

Wie scanne ich das wohl am effektivsten?

Hervorgehobene Antworten

Erstelle ein Konto, um zu kommentieren

Wichtige Informationen

Konto

Navigation

Browser-Push-Nachrichten konfigurieren

Chrome (Android)

Chrome (Desktop)

Safari (iOS 16.4+)

Safari (macOS)

Edge (Android)

Edge (Desktop)

Firefox (Android)

Firefox (Desktop)