5. September 2006

[Uni] Multae causae sunt scribendi

... wäre auch ein schöner Spruch für's Blogger-Shirt gewesen. Nichtsdestotrotz ist dieser Eintrag so betitelt, weil es um meine zukünftige Diplomarbeit am Lehrstuhl für Medieninformatik geht.

Und zwar Folgendes: Nach einigem Hin- und Herüberlegen wurde mir angetragen, ich könnte eine Arbeit zum Thema "Evaluation von elektronischen Repräsentationsformen von Handschriften am Beispiel von althochdeutschen Texten an der Uni Bamberg" schreiben. Oder so ähnlich. Im Klartext geht es darum, dass an der Split arme Hiwis Professoren händisch Texte aus dem Mittelalter in Word tippen.

Das ist mühsam und hat den Nachteil, dass man sie eigentlich nicht konvertieren kann, geschweige denn eine automatisierte Erfassung von solchen Handschriften möglich ist bisher. Ich könnte jetzt im Rahmen der Da herausfinden, welche anderen praktikablen Methoden es gibt, das Ganze in eine für den Computer verarbeitbare Form (sprich XML) zu bringen, welche Kriterien eine solche Methode haben muss und prototypisch den Aufwand für die Arbeit abschätzen, den man mit den Methoden hat.

Letzten Endes wäre es schön, eine XLS-Datei[1] zu haben oder eine LaTeX-Extension[2], die das umständliche Rumfummeln mit ALT+Irgendsonezahl in Word - wie es bisher eben läuft - ersetzt und viel effizienter ist und man so Zeug dann bspw. auch ins Netz stellen kann auf Knopfdruck, Texte gezielt durchsuchen kann, beliebige Formatierungen drüberlaufen lassen kann uswusf.

Insgesamt klingt das alles schrecklich einfach, ich frage mich ernsthaft, wo da der Haken ist?!

[1] Ein Schema, in dem z.B. alle Tags definiert sind, um die Schriftzeichen auszuzeichenen, also eine Art "hausgemachtes" HTML, welches sich dann ohne Probleme in jedes beliebige andere Format konvertieren läßt, z.B. .pdf, .doc. oder auch .txt, wenn es sein muss.
[2] Das ist nix Perverses, keine Angst.

Keine Kommentare: