Übersicht XML-Doctypes für Historisches Forschungsnetz

Einführung

„NLM, DocBook, TEI Lite, and DITA are all robust XML standards that can serve as great starting points for a painless conversion of your content to whatever e-book format you need.” http://www.dclab.com/blog/2010/09/future-proofing-your-e-books/

  • TEI: The “Let One Thousand Flowers Bloom” DTD
  • DocBook: The “Crank It Out” DTD . . .
  • NLM: The “Works and PlaysWell Together” DTD . . .
  • DTBook: The most important DTDpeople have neverheard of . . .
  • DITA: The “Slice & Dice” DTD . . .

http://assets.en.oreilly.com/1/event/19/XML%20in%20Practice_%20Formats,
%20Tools,%20and%20Techniques%20Presentation%203.pdf

Vergleich der relevanten Doctypes

TEI (Lite)

http://www.tei-c.org/Guidelines/Customization/Lite/

Dokumentstruktur:

<TEI>
  <teiHeader/>
  <text>
   <front/>
   <body/>
   <back/>
  </text>
 </TEI>

Gliederung: <div type=“chapter“ n=“38″><head>Titel des Abschnitts</head>
<p>…</p></div>

Fußnote: <p>Text mit Fußnote<note place=“foot“>Eine erste Fußnote</note> … </p>

Formatierung: <hi rend=“bold“></hi> (bzw. <emph>bold</emph>) <hi rend=“italic“>kursiv</hi>

Eingebettete Grafik mit Titel und Bildunterschrift:<figure><graphic url=“fessipic.png“/><head>MrFezziwig’s Ball</head><figDesc>A Cruikshank engraving showing MrFezziwig leading a group of revellers.</figDesc></figure>

(Simplified) DocBook

http://www.docbook.org/xml/simple/sdocbook/index.html

Bsp. von http://www.informatik.tu-cottbus.de/~agiurca/tutorials/DocBook/index.htm

Dokumentstruktur:

<article>
 <title>Artikeltitel</title>
 <articleinfo><!—Artikelinfo --></articleinfo>
 <section><title>Titel des Abschnitts</title><para>..</para></section>
</article>

Gliederung: <sectionlabel=“1″><title>Titel des Abschnitts</title><para>..</para></section>

Fußnote: <para>Text mit Fußnote <footnote><para>Eine erste Fußnote</para></footnote></para>

Formatierung: <emphasis role=“strong“>fett</emphasis>, <emphasis>kursiv</emphasis>

Eingebettete Grafik mit Bildunterschrift:
<figure><title>A geometrical figure</title><mediaobject><imageobject><imagedatafileref=“eiffeltower.png“ format=“PNG“/></imageobject>

<caption><para>Designed by Gustave Eiffel in 1889, The Eiffel Tower is one of the most widely recognized buildings in the world.</para></caption></mediaobject></figure>

 NLM

Beispiele unter http://www.ncbi.nlm.nih.gov/pmc/pmcdoc/tagging-guidelines/article/style.html#samples

Dokumentstruktur:

<article>
<front />
<body />
<back />
</article>

Gliederung: <sec id=“sec.id“><title>Abschnitts-Titel</title><p>…</p></sec>

Fußnoten[1]:<body><p>…<xref ref-type=“fn“ rid=“FN1″>1</xref>… </p>…</body>
<back>…<fn-group><fn id=“FN1″><label>1</label><p>ErsteAnmerkungen</p></fn>…</fn-group>…</back>

Formatierung: <bold>fett</bold>, <italic>kursiv</italic>

Eingebettete Grafik mit Bildunterschrift:
<fig id=“id-figure“><label>1</label><caption><title>Bildtitel</title><p>Bildbeschreibung</p></caption>
<graphicxmlns:xlink=“http://www.w3.org/1999/xlink“ xlink:href=“ch4f1″ mime-subtype=“gif“/>
</fig>

DTBook

Dokumentstruktur:

<dtbookxmlns="http://www.daisy.org/z3986/2005/dtbook/" 
  version="2005-3" xml:lang="de-DE">
 <head><!-- Dublin Core Metadaten -></head>
 <book>
 <frontmatter>
 <doctitle>Titel</doctitle>
 <docauthor>Ersteller</docauthor>
 </frontmatter>
 <bodymatter>…
 </bodymatter>
 </book>
 </dtbook>

Gliederung:

<level1><h1>Abschnittstitel</h1>
<p>…</p>
<level2><h2>Untertitel</h2>
<p>..</p>
</level2>
</level1>

Fußnote[2]: <p>und eine Fußnote<noterefidref=“#ftn1″ class=“footnote“>1</noteref>. …</p>
..
<note id=“ftn1″ class=“footnote“><p>ErsteFußnote</p></note>

Formatierung:<strong>fett</strong>, <em>kursiv</em>

Eingebettete Grafik mit Bildunterschrift:<imggroupid=“imggrp_1″><imgid=“img1_1″ src=“pic.png“ alt=“1. Bild: Mit einer Beschreibung“ /><caption><strong>1. Bild</strong> Mit einer Beschreibung</caption></imggroup>

Fazit

Insgesamt sind die Unterschiede für die grundlegenden Dokument- und Textauszeichnungen zwischen den vier hier betrachteten Doctypes recht marginal. Für eine reine Zeitschriftenplattform wie Ambra[3] bietet sich NLM durch die optimal auf wissenschaftliche Aufsätze abgestimmte Dokumentstruktur an. Da im Rahmen des Forschungsnetzes neben Aufsätzen insbesondere im Rahmen der Themenportale aber auch historische Quellen mit besonderen Anforderungen an Texttranskriptionen zu erwarten sind und in den historisch arbeitenden Geisteswissenschaften TEI immer noch die mit Abstand größte Verbreitung hat, scheint TEI für uns im Moment aber die die sicherere Wahl zu sein. Sollte sich in der Zukunft beispielsweise durch bessere Unterstützung von Browser-basierten Editoren mit NLM oder gegebenenfalls auch Docbook-Unterstützung Veränderungen ergeben oder Verlagsplattformen für Ihre Angebote NLM oder DTBook-basierte E-Book-Formate bevorzugen, sollten entsprechende Transformationen durch Stylesheets wie etwatei_to_nlm.xsloder tei-to-epub3.xsl ohne allzu große Schwierigkeiten umzusetzen zu sein.

Anhang

beispiel-teilite.xml

<?xmlversion="1.0" encoding="UTF-8"?>
<TEI>
     <teiHeader>
          <fileDesc>
                <titleStmt>
                     <title>Beispiel: TEI (Lite)</title>
                </titleStmt>
                <publicationStmt>
                     <publisher/>
                </publicationStmt>
                <sourceDesc><p/></sourceDesc>
          </fileDesc>
     </teiHeader>
     <text>
          <front/>
          <body>
              <div type="article"><head>Titel des Beitrages</head>
              <p>Etwas <hi rend="bold">fetter</hi> bzw. 
              <hi rend="italic">kursiver</hi> Text mit 
              Fußnote<noteplace="foot">Eine erste Fußnote</note>.</p>
              <div type="section"><head>Anhang</head>
              <figure><graphic url="pic.png"/><head>1. Bild</head>
              <figDesc>Mit einer Beschreibung</figDesc></figure>
              </div>
              </div>
          </body>
          <back/>
     </text>
</TEI>

beispiel-simplified-docbook.xml

<?xmlversion="1.0" encoding="UTF-8"?>
<article lang="de">
     <title>Beispiel: Simplified Docbook</title>

     <para>Etwas<emphasis role="strong">fetter</emphasis>
     bzw. <emphasis>kursiver</emphasis> Text mit Fußnote<footnote>
     <para>Eine ersteFußnote</para></footnote>.</para>
     <section><title>Anhang</title>
     <figure><title>1. Bild</title>
          <mediaobject>
              <imageobject><imagedatafileref="pic.png" format="PNG"/></imageobject>
              <caption><para>MiteinerBeschreibung</para></caption>
          </mediaobject>
     </figure>
   </section>
</article>

beispiel-nlm-article.xml

<?xml version="1.0" encoding="UTF-8"?>
<article xmlns:xlink="http://www.w3.org/1999/xlink" 
         article-type="research-article">
<front>
     <journal-meta>
          <journal-id>HSK</journal-id>
          <issn pub-type="epub"><!--1234-5678--></issn>
     </journal-meta>
     <article-meta>
          <article-id>hsk:1234</article-id>
          <title-group>
                <article-title>Beispiel: NLM Article</article-title>
          </title-group>
          <pub-date pub-type="epub">
                <day>5</day>
                <month>5</month>
                <year>2012</year>
          </pub-date>
     </article-meta>
</front>
<body>
     <p>Etwas<bold>fetter</bold>bzw. <italic>kursiver</italic> 
     Text mit Fußnote<xref ref-type="fn" rid="FN1">1</xref>.</p>
     <sec><title>Anhang</title>
     <fig id="id-figure"><label>Abbildung 1</label><caption><title>1. Bild</title><p>Mit einer Beschreibung</p></caption>
          <graphicxmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="pic.png" mime-subtype="png"/>
     </fig>
     </sec>
</body>
<back>
     <fn-group>
          <fnid="FN1"><label>1</label><p>Eine erste Fußnote</p></fn>
     </fn-group>
</back>
</article>

beispiel-dtbook.xml

<?xmlversion="1.0" encoding="UTF-8"?>
<dtbookxmlns="http://www.daisy.org/z3986/2005/dtbook/" version="2005-2" xml:lang="de-DE">
<head>
<meta name="dc:Language" content="de-DE"/>
<meta name="dc:Title" content="Beispiel: dtbook"/>
</head>
<book>
<frontmatter>
  <doctitle>Beispiel: dtbook</doctitle>
</frontmatter>
<bodymatter>
<level1>
<p>Etwas <strong>fetter</strong> bzw.<em>kursiver</em> Text mitFußnote<noterefidref="#ftn1" class="footnote">1</noteref></p>
<level2>
                     <h2>Anhang</h2>
                     <imggroup id="imggrp_1">
                          <imgid="img1_1" src="pic.png" alt="1. Bild: Mit einer Beschreibung" />
                          <caption><strong>1. Bild</strong> Mit einer Beschreibung</caption>
                     </imggroup>
</level2>
                <note id="ftn1">
                     <p>Eine erste Fußnote</p>
</note>
</level1>
</bodymatter>
</book>
</dtbook>


[1]Fußnoten sind keine Inline-Elemente sondern Verknüpfungen zwischen Markierung und Anmerkung; maximale Flexibilität aber relativ komplizierte Buchführung bei Einfügen/Löschen

[2] Fußnoten sind keine Inline-Elemente sondern Verknüpfungen zwischen Markierung und Anmerkung; maximale Flexibilität aber relativ komplizierte Buchführung bei Einfügen/Löschen

[3]http://www.ambraproject.org/

Dieser Beitrag wurde unter Uncategorized veröffentlicht. Setze ein Lesezeichen auf den Permalink.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.