- Richtlinien
- Mitmachen
- Qualitätssicherung
- Arbeitslisten
- Beobachtungskandidaten
- Sichtung
- Grundlagenartikel
- Bilder-/Artikelwünsche
- Struktur-/Ionenbilder
- Mitarbeiter/-Treffen
- Literaturstipendium
- eLiteraturstipendium
- Videokonferenz
- Wikidata
- Commons-Projekt
- Quellen
- Formatvorlagen
Leitfaden zur Erstellung einer Strukturformel
Dies ist ein kleiner Leitfaden darüber, wie man chemische Strukturformeln für die Wikipedia erstellt und welche Konventionen dabei beachtet werden sollten.
|
Welche Formel ist die Richtige?
Bevor man einen Chemikalienartikel mit einer Strukturformel versieht, sollte man überlegen und ggfs. in der Fachliteratur oder einem Lehrbuch nachsehen, welche Bindungsart überhaupt vorliegt.
Generell gilt: Wenn es sich um rein ionische Verbindungen handelt (das sind zumeist anorganische Salze), dann ist eine Strukturformel mit Valenzstrichen fehl am Platz.
Valenzstrichformeln kommen eigentlich nur bei Verbindungen zur Anwendung, die auch tatsächlich kovalente Bindungen enthalten. Es gibt natürlich Grenzfälle, in denen sowohl kovalente als auch ionische Bindungen vorkommen. Diese sind dann so darzustellen, dass klar hervorgeht, welche Bindungen ionisch und welche kovalent sind.
In komplexen Metall-Koordinationsverbindungen können Bindungsstriche verwendet werden, diese deuten dann aber eher die Geometrie der Ligandenanordnung an, als dass sie auf die Bindungsart Bezug nehmen. Die Angabe von Ladungen ionischer Liganden ist dann sehr sinnvoll.
Falls nicht klar ist, welche Strukturdarstellung in Frage kommt, ist die Redaktion Chemie gerne bereit, mit Rat und Tat zu helfen. Ansonsten ist es besser, die Struktur zunächst einmal wegzulassen. Dies gilt besonders für die bzgl. der Strukturen etwas problematischen ionischen Verbindungen. Eine einfache Ionendarstellung wie in obiger Tabelle ist sicher kein Fehler, eine Kristallgitterdarstellung sollte man aber nur versuchen, wenn man ein gewisses „Gefühl“ für die richtige Perspektive und den richtigen Ausschnitt des Gitters besitzt, sonst verwirrt eine solche Darstellung mehr, als sie zur Erklärung der strukturellen Verhältnisse beiträgt.
Software
Formel-Editoren sind in großer Auswahl erhältlich als Freeware / Open Source Programme. Hier eine Auswahl:
2D
- IsisDraw für Windows(Registrierung erforderlich) jetzt von Symyx und nicht mehr MDL
- XDrawChem für Linux / Mac OS X und dessen Windowsvariante WinDrawChem mit SVG-Export (neuste Version von 2005 Weiterentwicklung fraglich)
- Chemsketch von ACDLabs für Windows (auch 3D-Darstellung)
- MarvinSketch Javaprogramm für Windows (Registrierung erforderlich; auch 3D-Darstellung)
- BKChem mit SVG-Export, Freie Software, GNU/Linux, Mac, Windows
- JChemPaint Java-Applet zur Erstellung von Strukturformeln
- Formelmaker Struktur- und Reaktionsgleichungen, nur Windows
- chemtool Struktur- und Formeleditor, nur Linux (letzte Version 2007 - Weiterentwicklung fraglich)
- C-Design Freeware, nur Windows, beherrscht auch Generierung von nicht-optimierten 3D-Strukturen (allerdings keine Weiterentwicklung mehr)
- Strukturformeleditor - deutschsprachig, nur Windows, für privaten Gebrauch kostenlos
- EasyChem (Mac OS X, Linux; freie Lizenz) (2005 letzte Version - Weiterentwicklung?)
- GChemPaint (Linux GNOME; freie Lizenz)
- diese Liste darf (und soll) ergänzt werden
3D
- Agile Molecule Verschiedene Software-Dateien mit unterschiedlicher Anzahl an Bearbeitungsmöglichkeiten; umfangreich. Größtenteils Freeware
- Accelrys Discovery Studio Visualizer 2.0: Windows, Linux. Abgespeckte Version kostenlos. Besonders für Biopolymere geeignet.
- Avogadro: Windows, Linux, Mac OS X; Lizenz: GNU GPL
- Jmol OpenSource Java-Programm plattformunabhängig
- MoluCAD Windows; Demo ist kostenlos
- MarvinSpace Windows, Mac OS X; Besonders für Proteine geeignet. Registrierung erforderlich.
- BALLView Windows, Mac OS X, Linux, Unix; Besonders für Proteine geeignet. Freie GNU GPL Lizenz.
- QuteMol Windows, Mac OS X; besonders für Proteine geeignet. Open Source 3D mit GL
- PyMOL Python-Programm; Windows, Mac OS X, Linux; besonders für Proteine geeignet. Freie GNU GPL Lizenz.
- VMD Linux, Unix, Mac OS X, Windows; besonders für Proteine geeignet. Open Source mit spez. Lizenz, kostenlose Registrierung (letzte Version 2007)
- DeepView mit POV-Ray-Export. Windows, Mac OS X (Linux mit Wine aber unsupportet); Freeware.
- Ghemical[1] Windows, Linux; gut für kleinere Moleküle: Ausgefeilte Energieberechnungen. Lizenz: GNU GPL
- RasMol Windows, Linux, Mac OS X, Unix
- diese Liste darf (und soll) ergänzt werden
Empfohlene Formate und das Hochladen
Strukturformelm sollten möglichst als Vektorgrafik im SVG-Format hochgeladen werden, alternativ können sie auch im PNG-Format erstellt werden. Bilder im PNG-Format sollten eine hohe Auflösung haben (Breite von 1000 bis 2000 Pixeln), um in druckbaren Medien genutzt werden zu können. Bei so hoher Auflösung ist ein zusätzliches Glätten entbehrlich. Bei SVG spielt die Auflösung keine Rolle.
Das Hochladen auf Wikimedia Commons ermöglicht es Schwester-Projekten, die Strukturformeln mitnutzen zu können. Daraus folgt auch, dass Verbindungsnamen oder anderer deutschsprachiger Text in der Bildlegende untergebracht werden sollte, nicht in der Bilddatei selbst.
Werden Strukturformeln im SVG-Format erstellt, empfiehlt es sich sämtlichen Text, der in der Formel enthalten ist, in Pfade umzuwandeln. Andernfalls kann es leicht zu Darstellungsfehlern kommen. Der Grund dafür ist, dass die Mediawiki-Software SVGs nicht direkt nutzt, sondern mehrere sogenannte PNG-Thumbnails pro SVG erstellt, die dann in Artikeln verwendet werden. Die Umwandlung der SVGs in PNGs führt zu den oben genannten Problemen, da die Schriftelemente in den Bildern teils falsch interpretiert werden. Auch ist die Darstellung der Schriftelemente abhängig von der Software, die die Thumbnails erstellt, so dass die Schrift nach einer Änderung der Software plötzlich anders aussehen kann. Durch Umwandeln der Schriftelemente in Pfade wird dies umgangen.
Das Umwandeln der Textelemente in Pfade ist zum Beispiel dadurch möglich, dass man die Strukturformel mit Inkscape öffnet, die Textelemente markiert und dann die Funktion „Objekt in Pfad umwandeln“ verwendet (wahlweise über die obere Navigationsleiste „Pfad“ → „Objekt in Pfad umwandeln“ oder über die Tastenkombination „Shift + Strg + C“).
Da Strukturformeln nicht die nötige Schöpfungshöhe erreichen, um geschützt zu sein, reicht es, sie unter einer Public Domain-Lizenz einzustellen.
Erläuterung zur Lizensierung
Lizenzen sind dazu da, geistiges Eigentum zu schützen. Die meisten Strukturformelgrafiken dürften aber aufgrund der geringen bzw. nicht vorhandenen Schöpfungshöhe ohnehin nicht zu den schutzfähigen Werken gehören (vgl. §§ 1 und 2 Abs. 2 UrhG), wären also gemeinfrei und könnten gar nicht geschützt werden. Solche Strukturformelgrafiken sollten daher nicht unter eine Lizenz (weder die GNU FDL, noch eine CC-Lizenz) gestellt, sondern lieber gleich als public domain „({{Bild-PD-Schöpfungshöhe}}“; in Commons als „{{PD-chem}}“) gekennzeichnet werden.
Uniformität von Strukturformeln
Aussehen
Die Strukturformeln sollten schwarz auf transparentem (oder allenfalls weißem) Hintergrund gezeichnet werden. Für zusätzliche Angaben wie Lokanten, Bindungslängen oder -winkel empfiehlt es sich, Farben zu wählen, damit sie sich von der eigentlichen Formel abheben.
- Achtung: In die Chemobox sollte eine schlichte schwarz-weiße/transparente Formel eingefügt werden. Strukturformeln mit zusätzlichen Angaben können zur Veranschaulichung in den Fließtext eingearbeitet werden und sollten dann näher erläutert werden.
Lokanten
In den Strukturformeln, besonders in der Chemobox, sollten Lokanten nicht abgebildet werden, es sein denn, der Artikel behandelt explizit die Nomenklatur der Verbindung. Zur Abgrenzung sollten die Lokanten in einer anderen Farbe dargestellt werden.
Gerüstdarstellung
Bei organisch-chemischen Verbindungen ist das explizite Zeichnen von Kohlenstoffatomen unüblich, außer wenn das Atom eine besondere Bedeutung in der Struktur besitzt (als Reaktionspartner, um eine Stereoisomerie zu markieren etc.) oder allgemein in Verbindungen mit weniger als zehn Atomen. Eine solche Darstellung nennt man Gerüstdarstellung oder Skelettformel. Sie eignet sich insbesondere für Strukturformeln großer Moleküle, bei denen die Angabe von Wasserstoffatomen selbst an endständigen Gruppen zur Unübersichtlichkeit führen würde.
Wasserstoffatome
Die explizite Anführung von Wasserstoffatomen an Gerüstkohlenstoffatomen ist in der Regel nicht nötig. Eine Ausnahme bildet die Aldehydgruppe, die normalerweise, falls sie mit Bindungen ausgeschrieben wird, auch den aldehydischen Wasserstoff zeigt. Wasserstoffatome an Heteroatomen sollten dagegen grundsätzlich angeführt werden, da die Wertigkeiten unterschiedlich sein können und die Zahl der „fehlenden“ H-Atome nicht immer unbedingt klar erkennbar ist. Bei kleinen Molekülen sollten aus ästhetischen Gründen auch die endständigen Methylgruppen als –CH3 dargestellt werden, da die strenge Gerüstdarstellung hier zu spartanisch wirkt und es für Nicht-Chemiker zu Informationsverlust oder zu Missverständnissen kommen kann. Sollte die Angabe der endständigen CH3-Gruppen bei größeren Molekülen zur „Überladung“ und „Gedränge“ in der Strukturformel führen, verwendet man besser die Gerüstdarstellung. Innerhalb einer Strukturformel sollte einheitlich verfahren werden, also nicht etwa eine Methylgruppe mit H-Atomen, ein ander dagegen nur als Strich.
Abkürzungen
So bitte nicht!
In der Chemie ist es üblich, immer wieder auftretende Strukturteile, Reste oder Schutzgruppen abzukürzen, um die Strukturformeln übersichtlicher zu gestalten. Oft werden Methylgruppen als „–Me“, Ethylgruppen als „–Et“, Phenylgruppen als „–Ph“ oder „–Φ“ abgekürzt. Die Liste der gängigen Abkürzungen ist lang und beschränkt sich nicht nur auf einfache Reste, sondern sogar auf komplexere Moleküle (z.B. Aminosäuren oder Kohlenhydrate). In der Wikipedia sollte nach Möglichkeit auf solche Abkürzungen verzichtet werden, da man von Laien nicht erwarten kann, dass sie ständig eine Liste parat haben (oder aufrufen), die ihnen solche Abkürzungen in verständliche Strukturen „übersetzt“. Abkürzungen können ausnahmsweise dann verwendet werden, wenn es aus zeichnerischen Gründen geboten erscheint. Es dürfen aber nur Abkürzungen benutzt werden, die sich entweder selbst erklären (Me, Et) oder auch in allgemein zugänglichen Lehrbüchern zu finden sind. Auch hier sollte innerhalb einer Strukturformel Einheitlichkeit herrschen, also nicht Abkürzungen und Strukturdarstellungen von Resten gemischt verwendet werden.
Maße
Um innerhalb der Wikipedia ein einheitliches Aussehen der Strukturformeln zu erreichen, sollen folgende Werte als Leitlinie dienen, sie sind jedoch nicht zwingend. Die Parameter lassen sich in den Zeichenprogrammen an angegebener Stelle festlegen. Das nebenstehende Bild wurde mit diesen Einstellungen in ChemDraw (kommerzielles Zeichenprogramm) erstellt.
Parameter | Wert | ChemDraw | ISIS | BKChem |
---|---|---|---|---|
Bindungslänge | 1,4 cm / 39,7 pt | „Fixed Length“ | „Standard bond/grid length“ | „Bond length“ |
Liniendicke | 0,06 cm / 1,7 pt | „Line Width“ | „Line Style“ -> „Thickness“ | „Line width“ |
Liniendicke, breit | 0,18 cm / 5,1 pt | „Bold Width“ | „Stereo bond width“ | „Wedge/Hatch width“ |
Abstand Mehrfachbdg | 15 % d. Bdg-Länge / 0,21 cm | „Bond Spacing“ | „Double/triple bond“ | „Bond width“ |
Rand um Atome | 0,08 cm / 2,3 pt | „Margin width“ | „Atom label margin“ | – |
Strichabstand gestr. Linien/Keile |
0,15 cm / 4,3 pt | „Hash Spacing“ | „Down bond hashes“ | – |
Schriftgröße Atome | Arial: 24 pt | „Atom labels“ -> „Size“ | „Font“ -> „Size“ | „Font Size“ |
„Double-bond length ratio“ | 0,8–0,85 | nur BKChem |
Für BKChem unter Linux kann man die Werte leicht einstellen in dem man folgende beiden Dateien mit den angegebenen Werten füllt was per Copy & Paste gehen sollte (~/ steht für das Home-Verzeichnis üblicherweise /home/<username>/ wird aber von der Shell auch als Tilde richtig ausgewertet).
~/.bkchem/standard.cdml :
<?xml version="1.0" ?><cdml version="0.15" xmlns="http://www.freesoftware.fsf.org/bkchem/cdml"> <info> <author_program version="0.12.2">BKchem</author_program> </info> <standard area_color="" font_family="helvetica" font_size="24" line_color="#000" line_width="0.06cm" paper_crop_margin="5" paper_crop_svg="1" paper_orientation="portrait" paper_type="Legal"> <bond double-ratio="0.85" length="1.4cm" wedge-width="0.18cm" width="0.21cm"/> <arrow length="1.6cm"/> </standard> </cdml>
~/.bkchem/prefs.xml :
<?xml version="1.0" ?> <bkchem-prefs> <lang type="StringType">de</lang> <geometry type="StringType">1016x522+4+27</geometry> <recent-file1 type="StringType"></recent-file1> <recent-file2 type="StringType"></recent-file2> <use_real_minus type="IntType">0</use_real_minus> <default-dir type="StringType">~</default-dir> </bkchem-prefs>
Als Schriftart sollte Arial oder eine vergleichbare serifenlose Schriftart gewählt werden. Es empfiehlt sich ein Rand von etwa 5 px oder etwa 2,5 % der Breite/Höhe.
Keilstriche
Bei der Verwendung von Keilstrichen zur Veranschaulichung der Konfiguration eines Stereozentrums sollten die Keilstriche stets mit dem schmalen Ende zum Stereozentrum gezeichnet werden. Damit wird den Empfehlungen der IUPAC entsprochen. Keilstriche dürfen nie zur Verbindung zweier Stereozentren verwendet werden, da eine eindeutige Bestimmung der Konfiguration dann nicht möglich ist.
- Diskussionhinweis: Keilstrichformeln
3D-Modelle kleiner Moleküle
Das Erstellen korrekter 3D-Modelle, zum Beispiel mit Molecular Modelling, erfordert einiges an Sachverstand! 3D-Modelle sollten nur dort eingefügt werden, wo es für das Verständnis erforderlich ist. Das kann dann der Fall sein, wenn z.B. sterische und/oder elektronische Charakteristika eines Pharmakophors erklärt werden sollen. Eine Inflation „bunter Bildchen“ soll hingegen vermieden werden. 3D-Darstellungen sollen grundsätzlich in energieminimierter/-armer Konformation abgebildet werden, andernfalls verfehlen sie ihren Zweck. Dazu sind unbedingt(!) in der Bildbeschreibung (Commons) präzise und ausreichende Angaben zu machen: a) zur benutzten Software, b) zum benutzen Näherungsverfahren und c) ggf. weitere zur Nachvollziehbarkeit nötige Daten. Der Algorithmus sollte mindestens „semi-empirisch“ basiert sein.
Beim Darstellungsmodus sind Modelle zu bevorzugen, die sowohl einen guten Tiefenblick ermöglichen als auch Atome farblich markiert zeigen. Klobige Kalottenmodelle sind also in der Regel wenig zweckdienlich. Optimal sind für gewöhnlich Stäbchenmodelle (auch Ball-Stick-Modell) (siehe Bild). Als Faustregel kann gelten: wenn eine Kalottenansicht nicht alle Atome zumindest teilweise zeigt, ist ein Stäbchenmodell vorzuziehen. Ergo: Kalotten sind nur für kleinere Moleküle geeignet. Zuletzt sollte das Molekül räumlich so gedreht werden, dass die wesentlichen Strukturelemente gut sichtbar sind. In manchen Fällen liefern erst zwei unterschiedliche Ansichten optimalen Informationsgewinn. Solange ein genügender Kontrast gewährleistet ist, sollte die Hintergrundfarbe (im 3D-Editor) möglichst auf „weiß“ gesetzt werden.
Beispiel (subtil falsch)
Als Beispiel, wie man es nicht machen sollte und warum, ist rechts die 3D-Modell von Reserpin gezeigt. Um die Datei zu erstellen, wurde zunächst der SMILES-Code manuell erzeugt und in CORINA eingegeben. Die zurückgelieferte pdb-Datei wurde mit jmol in die optimale Position gebracht und damit auch das Stick-Modell zum Rendern mit Povray produziert, was eine Minute dauerte.
Allgemeines: Das Beispiel demonstriert sehr schön, dass man „korrekte“ 3D-Modell nicht im Vorbeigehen aus dem Hut zaubert, und es erklärt obige „mahnende“ Ausführungen. Die Kenntnis und korrekte Bedienung der Algorithmen ist durchaus das kleinere Problem. Der Zeichner braucht vor allem viel Gespür/Erfahrung und Geduld, bzw. den Willen, Recherche zu betreiben, was auch lästige Fernleihe mit einschließen kann.
Zur Ästhetik: Colorierung, perspektivische Erscheinung, Wahl des Renderings (Sticks) und Bildschärfe sind ausgezeichnet gelungen. Die Perspektive wäre gut gewählt, würde die Formel stimmen.
Aber warum ist die Formel falsch? Alle Atome sind mit den richtigen Partnern verbunden, auch die fünf stereoisometrischen Zentren haben die richtige Anordnung. Die Konformation jedoch offenbart das ganz typische Dilemma. Sie ist aus physikalischer und biologischer Sicht richtig schön falsch und damit aus allgemeiner Sicht irrelevant und – das ist entscheidend – im Gegensatz zur unproblematischen Strukturformel grob irreführend. Der Laie denkt, das Molekül sähe in natura genau so und nicht anders aus, und wird mit diesem Irrtum sich selbst überlassen.
Zur Korrektur: Ring D gehört umgeklappt (an N4 und C15); damit stehen die Ringe C und D cis (also genauso wie die Ringe D und E) zueinander, es ergibt sich also eine „Treppe“. In anderen Worten, bei tertiären Aminen ist die Konformation des Stickstoffatoms zu berücksichtigen (durch Protonierung entsteht ein weiteres Stereozentrum!). Eigenhändiges Nachrechnen bestätigte eine klare Energiedifferenz. In dieser Konformation stehen die Ester schön entspannt äquatorial, statt axial. Schwenkt man dann noch das Indol–OCH3 nach hinten, dann sollte es für mittlere Ansprüche reichen.
Folgerungen
Daraus folgt zunächst: CORINA online per se berechnet noch nicht die energieärmste Konformation und reicht daher nicht aus. Andere PC-Programme lassen keine besseren Ergebnisse erwarten.
Daher sind nur dreierlei Zustände für die Standard-Darstellung sinnvoll:
- Die Konformation im berechneten absoluten Energieminimum
- Die natürliche Kristallstruktur (Modifikationen beachten!)
- Die adaptierte Struktur im biologischen System (z. B. Hauptwirkrezeptoren).
Bei vielen Molekülen liegen diese drei Zustände einigermaßen dicht beieinander, daher dürfte es genügen, einen der Zustände mit genauer Herkunftsangabe zu verwenden.
Um an präzise Infos zur 3D-Struktur eines Stoffs zu kommen, lohnt es sich in vielen Fällen, eine online-Recherche zu machen, Anlaufadresse erster Wahl ist PubMed: dort die Suchbegriffe „Stoffname“ und „crystal-structure“ eingeben, liefert in diesem Fall: PMID 5694643.
(Quelle: Text entstammt größtenteils aus Diskussion mit 84.136.203.171, daher Dank an dieser Stelle)
3D Modelle von Biopolymeren (Proteine)
Was für kleine Moleküle gilt, ist bei großen akut: wenn es Software gäbe, die die Tertiärstruktur (und damit die exakte räumliche Position der Atome) von Proteinen schnell und korrekt vorhersagen könnte, gäbe es all die Kristallzüchtungsversuche in der Raumstation ISS nicht. Es sind also nur tatsächlich gemessene Werte akzeptabel. Das bedeutet, dass bei Darstellungen von Protein-Tertiärstrukturen
- in der Legende immer die Herkunft von Kristalldaten (Vorlage:PDB oder Vorlage:PDB2) angegeben werden sollte, sofern dies nicht in der Bildseite bei Commons steht. Guter Ton ist es trotzdem, da es mit einem Klick den Aufruf der pdb.org-Seite ermöglicht
- bitte immer in der Legende die Modellart angegeben (Bänder, Oberflächen, Stäbchen, Kalotten etc) werden sollte. Beachte: Modelle aus Kristalldaten sind keine Kristallstrukturen!
Speziell der prominente Bildbereich der Infobox Protein erfordert als 'Hingucker' weitere Qualitätsbetrachtungen.
- Die Infobox Protein sollte das vollständige Protein enthalten, keine Einzeldomänen oder Ausschnitte; so etwas gehört mit Erläuterung in den Artikel. Wenn keine vollständigen Kristalldaten existieren, dann bitte entweder nichts zeigen oder
- auch eine realistische Schemazeichnung des Proteins genügt zur Not in der Infobox
Und natürlich gilt
- Bilder ohne Legende sollten mit einer solchen ergänzt werden. Wenn die Bildinformationen unvollständig sind (PDB fehlt auch bei Commons beispielsweise), darf das Bild kommentarlos gelöscht werden.
Q: Warum schreiben die Engländer dann immer 'crystal structure'?
A: Die Struktur des jeweiligen Proteinkristalls ist genaugenommen die gesamte in der PDB-Datei enthaltene Information. Dieses greifbare Forschungsergebnis ist die Kristallstruktur und so wird sie in dem jeweiligen Paper auch genannt. Alle hier besprochenen Modelle sind ihre Visualisierungen mittels verschiedener Modelle.
Artikel mit fehlender Strukturformel
In der Vorlage „Infobox Chemikalie“ (wenn der Parameter {{{Strukturformel}}}
nicht angegeben wird) wird der Hinweis auf eine fehlende Strukturformel automatisch erzeugt. In dem betreffenden Feld wird dann ein Link auf diese Seite ausgegeben und der Artikel wird in die Kategorie:Wikipedia:Strukturformel nicht vorhanden einsortiert.
Siehe auch
Literatur
- Jonathan Brecher: Graphical representation standards for chemical structure diagrams (IUPAC Recommendations 2008). Pure Appl. Chem 80/2/2008, S. 277–410 doi:10.1351/pac200880020277. Online-Version – PDF (2,6 MB)
- Jonathan Brecher: Graphical representation of stereochemical configuration (IUPAC Recommendations 2006). Pure Appl. Chem. 78/10/2006, S. 1897–1970 doi:10.1351/pac200678101897. Online-Version – PDF (1,2 MB)