Metadaten Extraction Tool

Die Zeiten ändern sich.

Dieser Beitrag scheint älter als 19 Jahre zu sein – eine lange Zeit im Internet. Der Inhalt ist vielleicht veraltet.

Immer wieder gibt es die Anforderung aus einer Reihe von Dokumenten die Metadaten auszulesen. Die National Bibliothek von Neu Seeland hat sich dafür ein Werkzeug erstellt, was nun als Open Source zur Verfügung gestellt wird – Metadata Extraction Tool.

Das Werkzeug kann die Informationen aus diversen Grafik- und Dokumentenformaten auslesen.
Zum derzeitigen Zeitpunkt werden folgende Formate unterstützt:

Images: BMP, GIF, JPEG and TIFF.
Office documents: MS Word (version 2, 6), Word Perfect, Open Office (version 1), MS Works, MS Excel, MS PowerPoint, and PDF.
Audio and Video: WAV and MP3.
Markup languages: HTML and XML.

Die unterstützen Formate wurden als dtd / jar definiert, so dass man auch weitere Formate hinzufügen kann.

Die ausgelesenen Daten werden in einem XML-File gespeichert und können somit recht einfach in weiteren Anwendungen genutzt werden.

Die Software ist in Java geschrieben und läuft unter Unix und Windows. Steuern kann man per GUi oder Kommandozeile. Eine Installation ist nicht notwendig, einfach entpacken und starten.

1 Kommentar

Pingback: Links am Mittwoch

Die Kommentare sind geschlossen.

Ich liefere Ihnen umfassende Dienste, spezialisiert auf personifizierte Services für eine Website mit der Open Source Applikation WordPress™. Meine Dienstleistung kann eine einfache bis umfassende Beratung beinhalten, das Erstellen einer Installation mit entsprechender Anpassung im Rahmen der Sicherheit, das Anpassen oder Erstellen vom ersten Bit eines Designs, das Erstellen eines Plugins oder die Anpassung an Ihre Bedürfnisse. Ob Consulting oder Training der Mitarbeiter, eine Rezension der bestehenden Installation, die umfassende Beratung oder eine Zeile Code für Ihre Anforderung – ich kann Ihnen in den meisten Fällen helfen, eine Dienstleistung geben oder vermitteln. Parallel steht ein großes Team neben und hinter mir - Syde GmbH.

All mein Wissen und Können, ob als WordPress Experte bezeichnet oder nicht, steht Ihnen damit zur Verfügung. WordPress ist seit Jahren ein Begleiter von mir und spielt eine umfassende Rolle beim Entwickeln von Erweiterungen, Designs und Gesamtlösungen. Viele Inhalte und Nachweise meines Wissens bekommen Sie frei auf dieser Website, alternativ für einen recht geringen Preis in Buchform oder das Basiswissen in einem Video-Training. Entscheiden Sie, mit welchem Dienst Sie Ihre Zeit verbringen möchten oder ob Sie meine Erfahrung und Wissen persönlich nutzen wollen. WordPress ist meine Spezialität im Rahmen der Webentwicklung – Plugins, Dropins und Themes stammen aus meiner Feder. Sprechen Sie mich an, wenn Sie Hilfe brauchen, eine Lösung suchen oder eine Änderung an bestehenden Erweiterungen brauchen. ... mehr erfahren