p C - G I N E E R q In the forseeable future problem- p Version 4.03 PD q solving computer programs with p ½ 1992 by q intelligence features will aquire p Ph. Kraft q similar importance for chemistry. I. Ugi in [1] Um Mižverst„ndnissen vorzubeugen, C-GINEER steht fr "Connectivity Generator", wobei sich zwar die Schreibweise an "engineer" anlehnt, das Programm sich aber weder an Maschinisten, noch an Techniker oder gar (milit„rische) Pioniere (lt. Englisch-Deutsch-W”rterbuch) wendet. Es handelt sich vielmehr um ein Programm zur einfachen Erstellung chemischer Strukturformeln - um einen 2D-Strukturformeleditor auf Basis von Atom-Connectivity-Matrices (ACM, [2]) und wenn berhaupt ist letzteres die einzige Form von 'Pioniertum' in diesem Programm. Atom-Connectivity-Matrices - auch als 'Adjazenzmatrizen' oder 'topo- logische Matrizen' bezeichnet [1] - wurden 1963 von L. Spialter [2] als mathematisches Modell zur Beschreibung chemischer Strukturen ein- gefhrt und bilden heute das Fundament von Synthese-Design-Programmen ( wie LHASA [3], SECS [4] und CAMEO [5] ), bei der 'Structure-Activity- Relationship' (SAR) und 'Structure Property Relationship' (SPR) ( etwa ADAPT [6] ), fr Substruktur-Recherchen in Datenbanken und finden auch Verwendung in Nomenklatur-Programmen. Die ACM A=[a(i,j)] einer durchnummerierten Verbindung mit n-Atomen ist eine quadratische (n,n)-Matrix, in deren Hauptdiagonale die Atom- symbole stehen. Fr die Aužerdiagonal-Elemente gilt: a(i,j) = 0 , wenn keine formale chemische Bindung zwischen den Atomen C(i) und C(j) besteht. a(i,j) = 1 , bei C(i)-C(j) (Einfachbindung) a(i,j) = 2 , bei C(i)=C(j) (Doppelbindung) a(i,j) = 3 , bei C(i)ðC(j) (Dreifachbindung) Darberhinaus gilt in C-GINEER (zur Stereodifferenzierung) bezogen auf den Eintrag im 'oberen aužerdiagonalen Dreieck' der ACM: a(i,j) = 5 , gestrichelter Keil von C(i) nach C(j) zulaufend a(i,j) = 6 , gestrichelter Keil von C(i) nach C(j) ausweitend a(i,j) = 7 , ausgefllter Keil von C(i) nach C(j) zulaufend a(i,j) = 8 , ausgefllter Keil von C(i) nach C(j) ausweitend Fr zuknftige Versionen ist geplant: a(i,j) = 4 , fr delokalisierte ã-Elektronensysteme a(i,j) = 9 , fr koodinative Bindungen in Komplexen p Hinweis: Das Verst„ndnis der ACM-Struktur ist keine Voraussetzung q p fr die Benutzung des Programmes. Die Atom-Connectivity-Matrix ist q p lediglich das interne Speicher- und Dateiformat von C-GINEER. q Die Verwendung der ACM in einem 2D-Zeichenprogramm bringt aber neben der šbereinstimmung in den Datenstrukturen mit Synthese-Design- und SAR / SPR -Programmen eine Reihe von neuen M”glichkeiten in C-GINEER. **************************************************************************** * * * Der zu dieser Anleitung geh”rende Ordner C_GINEER.403 inkl. Inhalt ist * * Public Domain, also frei kopierbar. Er darf daher nicht verkauft oder * * vertrieben werden, und nur komplett kopiert werden. * * * **************************************************************************** C - G I N E E R 4 . 0 3 P D Zum Zeichnen von Formeln... linke Maustaste gedrckt halten, Bindung ausziehen und justieren, dann Maustaste freigeben. Innerhalb des krzesten Bindungsabstandes erfolgt Anbindung an das n„chstliegendste Atom. Bei gedrckter rechter Maustaste l„žt sich die Formel verschieben. Das Men wird nach dem Zeichnen durch Anklicken der Menleiste aktiviert (dies verhindert šberschneidungen bei der Bildschirmrestauration), der Funkionsaufruf ber die Tastaturcodes ist hingegen immer m”glich. Folgende Zeichenmodi sind vorhanden: Norm mode - Bindungsl„ngen und Bindungswinkel (letztere bezogen auf Winkel, die beim Zeichnen von Fnf- oder Sechsecken h„ufig vorkommen) werden in diesem Modus beim Zeichnen normiert. Bind mode - Bindungsl„ngen und Bindungswinkel sind frei und entsprechen der ausgezogenen Linie. Innerhalb des Snap-Radius ist hierin die 'šberbrckung' entfernter Atome m”glich. Text mode - Um Heteroatome in die ACM einzufhren klickt man das ent- sprechende Atom an und gibt das Symbol (nur C,O,H,N,S,P) ein, befindet man sich nicht innerhalb des kleinsten Bindungsradius ist die Eingabe von Kommentaren oder Summenformeln m”glich, wobei Zahlen unmittelbar nach Buchstaben automatisch als Subscript gesetzt werden. Nach Abschluž der Eingabe wird der Cursor automatisch um eine Zeile nach unten gesetzt. Der Kommentartext wird nicht als ACM verwaltet, im Gegensatz zu den Atomsymbolen ist eine Korrektur nur durch šberschreiben (auch mit Spaces) und das Abspeichern nur im .PIC-Format m”glich. Doppel- und Dreifachbindungen... werden einfach dadurch generiert, daž man die betreffende Bindung einmal (fr Doppelbindungen) oder zweimal (fr Dreifachbindungen) darber- zeichnet, beim dritten Mal erh„lt man die wieder eine Einfachbindung. Stereochemische Differenzierungen... lassen sich durch Einfgen von filled wedges (ausgefllten Keilen) oder von stroke wedges (Strichkeilen) treffen. In der Menleiste ist der Reihe nach aufgefhrt: p C-GINEER File Matrices Params. Geometr. SAR / SPR q Unter den jeweiligen Menleisten-Punkten erscheinen folgende Operationen: C-GINEER Hierunter findet sich eine kurze Programm-p Information q p help q und eventuell vorhandene Accessories. File Enth„lt die Unterpunkte: p Merge .ACM [C]m q p Open .EM [C]o q p Save .ACM [C]a q p Save .EM [C]s q p Load .PIC [C]l q p Save .PIC [C]p q Es kann in folgenden Formaten geladen und gespeichert (mit Back-up) werden: .ACM Atom Connectivity Matrix .BAC Back-up of Atom Connectivity Matrix .EM Ensemble of Molecules .BEM Back-up Ensemble of Molecules .PIC Screen- bzw. Doodle-Format Das Laden und Speichern im Screen- bzw. Doodle-Format erfolgt ohne Back-up und erm”glicht die šbernahme der erstellten Formeln in andere Zeichenprogramme. Matrices Dieser Menpunkt enth„lt einen Stack p ACM[1] F1 q p ACM[2] F2 q p ACM[3] F3 q p ACM[4] F4 q p ACM[5] F5 q p ACM[6] F6 q p ACM[7] F7 q p ACM[8] F8 q p ACM[9] F9 q p ACM[10] F10 q der anzeigt, welche ACMs des EM belegt sind und welche die jeweils aktuelle ACM - mit einem H„ckchen gekenn- zeichnet - ist. Die Graphikoperationen wirken nur auf dieses ACM. Durch Anklicken der Eintr„ge kann man die aktuelle ACM bestimmen. Die Auswahl ist aužerdem durch Anklicken der Formel mit der rechten Maustaste m”glich. Beim Zeichnen wird jeweils die ACM aktualisiert, die am n„chsten liegt, es sei denn sie liegt aužerhalb des Snap- Radius. In diesem Fall wird eine neue ACM ge”ffnet. Die 10 ACMs in der Version 4.03 sind (50,50)-Matrizen mit zusammen 25000 Eintr„gen entsprechend 500 Atomen. Gr”žere Schemata mssen als .PIC-Datei zwischenge- speichert werden. Fr SAR / SPR -Korrelationen sind definiert nummerierte ACMs n”tig. Die Sortierung und Durchnummerierung der Matrizen kann in C-GINEER entweder durch den vom Chemical Abstracts Service (CAS) benutzten MORGAN-Algorithmus [7], programmiert nach [8] und konvergent erweitert, ber den Menpunkt p Morgan sort [A]m q oder durch einen fr dieses Programm entwickelten Algorithmus p Canonical q p form [A]c q erfolgen. Eine kanonische Form ist nach [9] jede fr ein spezielles Problem (hier die Geruchs- bestimmung) standartisierte Matrix. Der Algorithmus geht etwa folgendermažen vor: - Suche die polarste oder weitverzweigteste Stelle in der Verbindung (letzteres analog zum MORGAN-Algorithmus) - Durchlaufe von dort ausgehend zuerst die am wenigsten verzweigten (charakteristischen) Reste und gehe dann zur 'n„chstweitverzweigten' Stelle -> Iteration... Mit dem Meneintrag p Numbering # q kann man sich die jeweils aktuelle (sortierte bzw. unsortierte) Numerierung der Atome ansehen. Mit dem Menpunkt p Print | q die jeweils aktuelle ACM ausdrucken. Mit p Duplicate ins q wird die jeweils aktuelle Formel und ihre ACM vervielf„ltigt, mit p Delete... last atom q p undo q kann man den jeweils letzten Eintrag in die AC-Matrix l”schen (entspricht bei nichtsortierten Ver- bindungen der zuletzt gezeichneten Bindung) und mit dem Menpunkt p Delete... AC-matrix del q die ganze Formel und ihre ACM aus dem Stack entfernen. Den ganzen Stack und die gesamte Zeichenebene (d.h. inkl. geladener .PIC-Dateien) kann man ber p Clear stack q p clr q leeren. Params. Hier sind die bereits beschriebenen Zeichenmodi aufgefhrt: p Norm mode [A]n q p Bind mode [A]b q p Text mode [A]t q p------------------------ q p Insert... q p Filled wedge [A]f q p Stroke wedge [A]s q , die jeweils angew„hlt werden k”nnen. Sonderzeichen im 'Text mode' sind ber 'Control' A und Eingabe des ASCII- Codes zug„nglich. Zu den Insert...-Funktionen bleibt noch anzumerken, daž die betreffende Bindung bereits gezeichnet sein muž und sowohl Anfangs- als auch Zielpunkt des ausge- zogenen Keils innerhalb des Snap-Radius liegen mssen. Die Keile werden vom Anfangs- zum Zielpunkt ausweitend dar- gestellt und lassen sich durch 'Darberzeichnen' mit der- selben Keilform wieder l”schen bzw. variiren. Fr Normwinkel hat man die Auswahl zwischen... p Norm angles for ... q p Pentagon [A]p q p Hexagon [A]h q , der Normierung auf Winkel die h„ufig in Fnf- oder Sechs- ecken auftreten. Die Wahl dieser Normwinkel ist jedoch auch beim Zeichnen anderer Strukturen ntzlich, so wurde die Cyclohexan-Sesselform in der Formel-Bibliothek im Pentagon-Modus gezeichnet. Die drei Bindungsl„ngen auf die im Norm-Modus normiert wird lassen sich ber p Input bond lengths [A]i q frei w„hlen. Es erscheint eine Box die ber die Maus oder die Tastatur bzw. den rechten Zahlenblock bedient werden kann. Hierbei entspricht die Backspace-Taste dem ' <- '-Feld, die Delete-Taste dem 'Clr'-Feld und die Return/Enter- Taste dem 'Enter'-Feld. šber p Screen switch tab q l„žt sich einstellen, ob st„ndig zwischen physikalischem und logischem Bildschirm (auf Kosten von etwas Rechenzeit) hin- und hergeschaltet werden soll oder die Ausgaben direkt erfolgen sollen. Bei Verwendung von Grožbildschirmen sollte 'Screen switch' nicht aktiviert werden! Aužerdem l„žt sich mit p Show matrices ^ q w„hlen, ob die jeweils aktuelle ACM in der linken oberen Bildschirm- ecke eingeblendet werden soll oder nicht. Geometr. p Draw formula with left mouse q p button / Transfer with right q Unter diesem Menpunkt sind die geometrischen Operationen aufgefhrt, die auf die gezeichnete Struktur wirken, aber ihre ACM unver„ndert lassen: p Rotate formula ... q p clockwise + q p - slightly [S]+ q p counterclockwise - q p - slightly [S]- q Rotation der Formel im oder gegen den Uhrzeigersinn mit dem Inkrement 15ø und dem Shift-Inkrement 3ø. p Mirror ... q p horizontal [S]h q p vertical [S]v q Spiegelung der Formel an einer horizontalen oder einer vertikal verlaufenden Achse. p Enlarge formula < q p Shrink formula > q Vergr”žerung bzw. Verkleinerung der Formel um je 10 %. p EPSON¿ hardcopy ~ q Vergr”žerte Hardcopy des Zeichenbereiches im EPSON¿-Modus. SAR / SPR Hierunter steht eine SAR / SPR - Routine zur Geruchs- bestimmung nach Strukturmerkmalen p Odor description q p [S]o q , die an die verwendete kanonische Form an- gepažt wurde, Keilbindungen werden jedoch nicht erkannt. Wenn eine Zuordnung m”glich ist, so wird eine Duftbe- schreibung zurckgegeben. Beispiele fr Riechstoff-Dateien: TAB_2_8.ACM TAB_4_3.ACM TAB_4_4.ACM TAB_4_10.ACM Andere Programme lassen sich - bei ausreichendem Speicher- platz - ber p Execute [C]e q von C_GINEER aus starten. Im Ordner C_GINEER.403 stehen folgende Bibliotheks- und Beispieldateien: Ordner \ ... \ Dateien ============================================================================ EXAMPLE \ EXAMPLE.PIC, EXAMPLE.EM, EXAMPLE1.ACM, EXAMPLE2.ACM, EXAMPLE3.ACM LIBRARY ------------------------------------------------------------------- \ TABLE_1.LIB \ TABLE_1.PIC, TABLE_1.EM, TAB_1_1.ACM ... TAB_1_10.ACM \ TABLE_2.LIB \ TABLE_2.PIC, TABLE_2.EM, TAB_2_1.ACM ... TAB_2_10.ACM \ TABLE_3.LIB \ TABLE_3.PIC, TABLE_3.EM, TAB_3_1.ACM ... TAB_3_10.ACM \ TABLE_4.LIB \ TABLE_4.PIC, TABLE_4.EM, TAB_4_1.ACM ... TAB_4_10.ACM \ TABLE_5.LIB \ TABLE_5.PIC, TABLE_5.EM, TAB_5_1.ACM ... TAB_5_10.ACM ============================================================================ Literatur: [1] I. Ugi et. al., The Deductive Solution of Chemical Problems by Computer Programms ... Pure & Appl. Chem. 50, 1303 (1978). [2] L. Spialter, The Atom Connectivity Matrix (ACM) and its Characteristic Polynomial (ACMCP) ... J. Am. Chem. Soc. 85 (1963), 2012. [3] LHASA - Logic and Heuristics Applied to Synthetic Analysis E.J. Corey, W.T. Wipke, Science 166, 178 (1969), sowie J. Am. Chem. Soc. 94 (1972), 421. [4] SECS - Simulation and Evaluation of Chemical Synthesis W.T. Wipke et al., J. Am. Chem. Soc. 98 (1976), 8107. [5] CAMEO - Computer Assisted Mechanistic Evaluation of Organic Reactions W.L. Jorgensen et al., J. Org. Chem. 45 (1980), 2043, ibid. 54 (1989), 2058. [6] ADAPT - Automated data analysis and pattern recognition toolkit A.J. Stuper, P.C. Jurs, J. Chem. Inform. Comput. Sci. 16 (1976), 99. Eine interessante Anwendung: P.C. Jurs et. al., Correlation of Odor Intensities with Structural Properties of Odorants, Chemical Senses 14 (1989), 281. [7] H.L. Morgan, J. Chem. Doc. 5 (1965), 107. [8] W.T. Wipke et al., J. Am. Chem. Soc. 96 (1974), 4834. [9] J. Blair, J. Gasteiger, C. Gillespie, P.D. Gillespie, I. Ugi, Tetrahedron 30 (1974), 1845.