This page in english

csv2wp ist ein kleines Script zum Umwandlung von Tabellen aus dem CSV-Format in eine Wiki-Tabelle. Der Sinn ist es, den Import von Tabellen aus Tabellenkalkulationsprogrammen wie z.B. Excel zu erleichtern. csv2wp ist in PHP geschrieben und kann somit über jeden Webbrowser bedient werden:

csv2wp online

Das Programm ist noch sehr experimentell und nicht ausführlich getestet. Kommentare und Anregungen bitte auf die Diskussionsseite von csv2wp, oder auf meine Diskussionsseite.

Der Quellcode dieses Programms ist unter der GPL freigegeben. Er kann hier heruntergeladen werden (als TGZ, 4,7KB): csv2wp Quellcode.

Kurzanweisung

Die Umwandlung der CSV-Daten erfordert nur wenige Schritte:

  1. Die CSV-Daten in das große gelbliche Textfeld oben eingeben. Dafür gibt es zwei Möglichkeiten:
    • Daten per Copy&paste aus einem Texteditor in das Feld kopieren. Dabei ist das Betriebssystem und/oder der Browser dafür zuständig, dass Sonderzeichen (Umlaute, etc.) korrekt umgewandelt werden.
    • Die Daten aus einer Datei Hochladen. Dafür steht unterhalb des Textfeldes das entsprechende Upload-Feld zur Verfügung. Dabei muss der Zeichensatz für die Datei angegeben werden, so dass Sonderzeichen korrekt umgewandelt werden. In Deutschland sind die üblichen Zeichensätze CP-1250 oder ISO-8859-15 (Windows), ISO-8859-1 oder UTF-8 (Linux), MacRoman (Macintosh). Bitte nicht vergessen den Knopf mit der Aufschrift "Upload File" anzuklicken. Der hochgeladene Text sollte dann in dem Textfeld erscheinen.
  2. Trennzeichen festlegen und andere Einstellungen vornehmen. Die voreingestellen Werte entsprechen dem, was von den meisten Programmen (z.B. Excel) verwendet wird. Für mehr Details, siehe unten.
  3. Knopf für die Umwandlung anklicken. Für die Verwendung in der Wikipedia (oder einem anderen Wiki) sollte das WikiMedia-Format gewählt werden, für die Verwendung in anderen Webseiten das HTML-Format.
  4. Das Ergebnis der Konvertierung wird dann im Browser angezeigt. Die Daten können jetzt wie jede Webseite gespeichert werden (mit "Seite Speichern"). Im Fall des WikiMedia-Formats kann man den Wiki-Code auch einfach per Copy&paste übernehmen. Im Fall von HTML ist das nicht der Fall, weil das Ergebnis dann schon vom Browser als HTML erkannt und entsprechend dargestellt wird - man kann also nicht ohne weiteres den HTML-Quellcode kopieren.

Importieren aus Excel

  1. In Excel die Tabelle auswählen (es kann immer nur eine Tabelle auf einmal exportiert werden). Dann "Speichern unter" wählen und als Format CSV angeben.
  2. Die Datei wie oben beschrieben in das Konverter-Formular einfügen: Entweder, indem man sie in einem Texteditor (z.B. Notepad) öffnet, oder indem man sie gleich als Datei hochlädt.
  3. Weiter wie oben beschrieben.

Details

Dieser Abschnitt beschreibt die verschiedenen Felder und Einstellungen von csv2wp. Die Unterüberschriften entsprechen den Überschriften auf der csv2wp-seite. Um die Bedeutung der einzelnen Einstellungen zu verstehen ist es hinfreich den Artikel über CSV-Dateien zu lesen.

CSV Data

In dieses Feld werden die zu konvertierenden CSV-Daten eingetragen. Das kann manuell (bzw. per Copy&Paste) geschehen, oder indem man eine Datei wie im folgenden beschrieben hochlädt.

Upload

Dieses Feld dient dem heraufladen einer CSV-Datei, so dass die Daten aus der Datei in das Feld CSV-Daten eingefügt werden. Zum Auswählen der Datei kann man den Knopf rechts neben dem Feld benutzen (Je nach Browser mit "Datei Auswählen", "Browse" oder Ähnlichem beschriftet).

Das zweite Feld dient der Auswahl des Zeichensatzes für die Datei: Wird dieser nicht richtig angegeben, so werden Sonderzeichen (wie z.B. Umlaute) nicht richtig übertragen. In Deutschland sind meistens die folgenden Zeichensätze eingestellt: Für Windows CP-1250, für Mac MacRoman, für Linux ISO-8859-1.

Nach auswählen von Datei und Zeichensatz kann die Datei mit dem Knopf Upload ganz rechts heraufgeladen werden. Die Daten werden dann in das Feld CSV Data eingefügt. Sollten dort Umlaute nicht richtig angezeigt werden, so wurde vermutlich der falsche Zeichensatz ausgewählt und die Datei muss erneut heraufgeladen werden.

Separator Character

Diese Einstellung bestimmt, welches Zeichen zur Trennung der einzelnen Datenfelder verwendet wurde:

Quotation Characters

Diese Einstellung bestimmt, welche Zeichen zum Zusammenfassen von Feldern benutzt werden, die Sonderzeichen enthalten. Zwischen zwei Quotation Characters ist die besondere Bedeutung der Separator Characters und sogar der Zeilenumbrüche aufgehoben.

Es folgt noch eine zusätzliche, von den anderen unabhängige Option:

Escape Character

Convert Linebreaks in Cells

Diese Einstellungen bestimmt, wie Daten, die einen Zeilenumbruch enthalten, gehandhabt werden. Die Zeilenumbrüche einfach zu übernehmen mach wenig Sinn, da in der Wiki-Syntax Zeilenumbrüche eine spezielle Bedeutung haben, und in HTML gar keine.

Convert Special Characters

Diese Einstellung bestimmt, wie Zeichen, die eine spezielle Bedeutung haben, behandelt werden.

HTML-Attributes

Hier kann man HTML-Attribute festlegen, die auf die Ausgabe angewendet werden sollen. Das ist besonders sinnvoll für das style="xxx" Attribut, mit dem sich das Aussehen der Tabelle definieren lässt. Ein anderes Beispiel wäre align="right" im for each cell Feld: das richtet alle Zellen rechtsbündig aus.

Output Encoding

Gibt an, in welchem Zeichensatz die Ausgabe erfolgen soll. Für die deutsche Wikipedia ist UTF-8 korrekt, das ist die Voreinstellung. Übrigens: Wenn das Resultat per Copy&paste verwendet wird, mach diese Angabe eigentlich keinen Unterschied - der Browser ist für dann die Konvertierung zuständig.

as binary download

Wenn diese Option gewählt ist wird der Browser gezwungen, die Daten als Binärdatei zu empfangen - die kann dann nur direkt heruntergeladen werden, der Text wird vom Browser nicht angezeigt oder konvertiert. Das ist nützlich, wenn man die Daten in einem bestimmten Zeichensatz speichern will und der Browser dabei Probleme macht. Ausserdem erspart es den Schritt "Speichern unter..." (siehe unten).

Convert to MediaWiki

Konvertiert den Inhalt des CSV Data Feldes entsprechend den Einstellungen in das MediaWiki-Format für Tabellen (Pipe-Syntax). Das Resultat wird entweder als Text im Browserfenster angezeigt, oder, wenn "as binary download" aktiviert war, zum herunterladen angeboten. Wenn man sich die Daten anzeigen lässt, kann man sie mit Copy&paste weiter verwenden, oder indem man die Seite in eine Datei speichert (je nach Browser und Sprache mit "Save Page", "Save as", "Seite Speichern", "Speichern unter" oder Ähnlichem).

Convert to HTML

Konvertiert den Inhalt des CSV Data Feldes entsprechend der Einstellungen in eine HTML-Tabelle. Das Resultat wird entweder als HTML-Quelltext im Browserfenster angezeigt, oder, wenn "as binary download" aktiviert war, zum Herunterladen angeboten. Wenn man sich die Daten anzeigen lässt, kann man sie mit Copy&paste weiter verwenden, oder indem man die Seite in eine Datei speichert (je nach Browser und Sprache mit "Save Page", "Save as", "Seite Speichern", "Speichern unter" oder Ähnlichem).

show preview

Wenn diese Option aktiviert ist (und "as binary download" nicht), dann wird die erzeugte HTML-Tabelle nicht als Quellcode, sondern als hübsch formatierte Tabelle angezeigt. Das ist ganz nützlich, um mit verschiedenen Formatierungen zu spielen. Man kann die Tabelle auch direkt aus der Vorschau speichern (je nach Browser und Sprache mit "Save Page", "Save as", "Seite Speichern", "Speichern unter" oder Ähnlichem).

To Do