Index of /atarilibrary/atari_cd04/CHEMIE/C_GINEER
Name Last modified Size Description
Parent Directory 11-May-2007 21:04 -
C_GINEER.PRG 21-Apr-1987 22:07 102k
EXAMPLE/ 11-May-2007 21:04 -
LIBRARY/ 11-May-2007 21:04 -
p C - G I N E E R q In the forseeable future problem-
p Version 4.03 PD q solving computer programs with
p ½ 1992 by q intelligence features will aquire
p Ph. Kraft q similar importance for chemistry.
I. Ugi in [1]
Um Mižverst„ndnissen vorzubeugen, C-GINEER steht fr "Connectivity
Generator", wobei sich zwar die Schreibweise an "engineer" anlehnt,
das Programm sich aber weder an Maschinisten, noch an Techniker oder
gar (milit„rische) Pioniere (lt. Englisch-Deutsch-W”rterbuch) wendet.
Es handelt sich vielmehr um ein Programm zur einfachen Erstellung
chemischer Strukturformeln - um einen 2D-Strukturformeleditor auf
Basis von Atom-Connectivity-Matrices (ACM, [2]) und wenn berhaupt
ist letzteres die einzige Form von 'Pioniertum' in diesem Programm.
Atom-Connectivity-Matrices - auch als 'Adjazenzmatrizen' oder 'topo-
logische Matrizen' bezeichnet [1] - wurden 1963 von L. Spialter [2]
als mathematisches Modell zur Beschreibung chemischer Strukturen ein-
gefhrt und bilden heute das Fundament von Synthese-Design-Programmen
( wie LHASA [3], SECS [4] und CAMEO [5] ), bei der 'Structure-Activity-
Relationship' (SAR) und 'Structure Property Relationship' (SPR) ( etwa
ADAPT [6] ), fr Substruktur-Recherchen in Datenbanken und finden auch
Verwendung in Nomenklatur-Programmen.
Die ACM A=[a(i,j)] einer durchnummerierten Verbindung mit n-Atomen
ist eine quadratische (n,n)-Matrix, in deren Hauptdiagonale die Atom-
symbole stehen. Fr die Aužerdiagonal-Elemente gilt:
a(i,j) = 0 , wenn keine formale chemische Bindung zwischen
den Atomen C(i) und C(j) besteht.
a(i,j) = 1 , bei C(i)-C(j) (Einfachbindung)
a(i,j) = 2 , bei C(i)=C(j) (Doppelbindung)
a(i,j) = 3 , bei C(i)ðC(j) (Dreifachbindung)
Darberhinaus gilt in C-GINEER (zur Stereodifferenzierung) bezogen
auf den Eintrag im 'oberen aužerdiagonalen Dreieck' der ACM:
a(i,j) = 5 , gestrichelter Keil von C(i) nach C(j) zulaufend
a(i,j) = 6 , gestrichelter Keil von C(i) nach C(j) ausweitend
a(i,j) = 7 , ausgefllter Keil von C(i) nach C(j) zulaufend
a(i,j) = 8 , ausgefllter Keil von C(i) nach C(j) ausweitend
Fr zuknftige Versionen ist geplant:
a(i,j) = 4 , fr delokalisierte ã-Elektronensysteme
a(i,j) = 9 , fr koodinative Bindungen in Komplexen
p Hinweis: Das Verst„ndnis der ACM-Struktur ist keine Voraussetzung q
p fr die Benutzung des Programmes. Die Atom-Connectivity-Matrix ist q
p lediglich das interne Speicher- und Dateiformat von C-GINEER. q
Die Verwendung der ACM in einem 2D-Zeichenprogramm bringt aber neben
der šbereinstimmung in den Datenstrukturen mit Synthese-Design- und
SAR / SPR -Programmen eine Reihe von neuen M”glichkeiten in C-GINEER.
****************************************************************************
* *
* Der zu dieser Anleitung geh”rende Ordner C_GINEER.403 inkl. Inhalt ist *
* Public Domain, also frei kopierbar. Er darf daher nicht verkauft oder *
* vertrieben werden, und nur komplett kopiert werden. *
* *
****************************************************************************
C - G I N E E R 4 . 0 3 P D
Zum Zeichnen von Formeln...
linke Maustaste gedrckt halten, Bindung ausziehen und justieren, dann
Maustaste freigeben. Innerhalb des krzesten Bindungsabstandes erfolgt
Anbindung an das n„chstliegendste Atom.
Bei gedrckter rechter Maustaste l„žt sich die Formel verschieben.
Das Men wird nach dem Zeichnen durch Anklicken der Menleiste aktiviert
(dies verhindert šberschneidungen bei der Bildschirmrestauration), der
Funkionsaufruf ber die Tastaturcodes ist hingegen immer m”glich.
Folgende Zeichenmodi sind vorhanden:
Norm mode - Bindungsl„ngen und Bindungswinkel (letztere bezogen auf
Winkel, die beim Zeichnen von Fnf- oder Sechsecken h„ufig
vorkommen) werden in diesem Modus beim Zeichnen normiert.
Bind mode - Bindungsl„ngen und Bindungswinkel sind frei und entsprechen
der ausgezogenen Linie. Innerhalb des Snap-Radius ist hierin
die 'šberbrckung' entfernter Atome m”glich.
Text mode - Um Heteroatome in die ACM einzufhren klickt man das ent-
sprechende Atom an und gibt das Symbol (nur C,O,H,N,S,P) ein,
befindet man sich nicht innerhalb des kleinsten Bindungsradius
ist die Eingabe von Kommentaren oder Summenformeln m”glich,
wobei Zahlen unmittelbar nach Buchstaben automatisch als
Subscript gesetzt werden. Nach Abschluž der Eingabe wird der
Cursor automatisch um eine Zeile nach unten gesetzt. Der
Kommentartext wird nicht als ACM verwaltet, im Gegensatz zu den
Atomsymbolen ist eine Korrektur nur durch šberschreiben (auch
mit Spaces) und das Abspeichern nur im .PIC-Format m”glich.
Doppel- und Dreifachbindungen...
werden einfach dadurch generiert, daž man die betreffende Bindung einmal
(fr Doppelbindungen) oder zweimal (fr Dreifachbindungen) darber-
zeichnet, beim dritten Mal erh„lt man die wieder eine Einfachbindung.
Stereochemische Differenzierungen...
lassen sich durch Einfgen von filled wedges (ausgefllten Keilen) oder
von stroke wedges (Strichkeilen) treffen.
In der Menleiste ist der Reihe nach aufgefhrt:
p C-GINEER File Matrices Params. Geometr. SAR / SPR q
Unter den jeweiligen Menleisten-Punkten erscheinen folgende Operationen:
C-GINEER Hierunter findet sich eine kurze Programm-p Information q
p help q und eventuell vorhandene Accessories.
File Enth„lt die Unterpunkte:
p Merge .ACM [C]m q
p Open .EM [C]o q
p Save .ACM [C]a q
p Save .EM [C]s q
p Load .PIC [C]l q
p Save .PIC [C]p q
Es kann in folgenden Formaten geladen und gespeichert
(mit Back-up) werden:
.ACM Atom Connectivity Matrix
.BAC Back-up of Atom Connectivity Matrix
.EM Ensemble of Molecules
.BEM Back-up Ensemble of Molecules
.PIC Screen- bzw. Doodle-Format
Das Laden und Speichern im Screen- bzw. Doodle-Format
erfolgt ohne Back-up und erm”glicht die šbernahme der
erstellten Formeln in andere Zeichenprogramme.
Matrices Dieser Menpunkt enth„lt einen Stack
p ACM[1] F1 q
p ACM[2] F2 q
p ACM[3] F3 q
p ACM[4] F4 q
p ACM[5] F5 q
p ACM[6] F6 q
p ACM[7] F7 q
p ACM[8] F8 q
p ACM[9] F9 q
p ACM[10] F10 q
der anzeigt, welche ACMs des EM belegt sind und welche
die jeweils aktuelle ACM - mit einem H„ckchen gekenn-
zeichnet - ist. Die Graphikoperationen wirken nur auf
dieses ACM. Durch Anklicken der Eintr„ge kann man die
aktuelle ACM bestimmen. Die Auswahl ist aužerdem durch
Anklicken der Formel mit der rechten Maustaste m”glich.
Beim Zeichnen wird jeweils die ACM aktualisiert, die am
n„chsten liegt, es sei denn sie liegt aužerhalb des Snap-
Radius. In diesem Fall wird eine neue ACM ge”ffnet.
Die 10 ACMs in der Version 4.03 sind (50,50)-Matrizen
mit zusammen 25000 Eintr„gen entsprechend 500 Atomen.
Gr”žere Schemata mssen als .PIC-Datei zwischenge-
speichert werden.
Fr SAR / SPR -Korrelationen sind definiert nummerierte
ACMs n”tig. Die Sortierung und Durchnummerierung der
Matrizen kann in C-GINEER entweder durch den vom Chemical
Abstracts Service (CAS) benutzten MORGAN-Algorithmus [7],
programmiert nach [8] und konvergent erweitert, ber den
Menpunkt p Morgan sort [A]m q oder durch einen fr
dieses Programm entwickelten Algorithmus p Canonical q
p form [A]c q erfolgen. Eine kanonische Form ist nach
[9] jede fr ein spezielles Problem (hier die Geruchs-
bestimmung) standartisierte Matrix. Der Algorithmus geht
etwa folgendermažen vor:
- Suche die polarste oder weitverzweigteste Stelle in
der Verbindung (letzteres analog zum MORGAN-Algorithmus)
- Durchlaufe von dort ausgehend zuerst die am wenigsten
verzweigten (charakteristischen) Reste und gehe dann
zur 'n„chstweitverzweigten' Stelle -> Iteration...
Mit dem Meneintrag p Numbering # q kann man sich die
jeweils aktuelle (sortierte bzw. unsortierte) Numerierung
der Atome ansehen. Mit dem Menpunkt p Print | q die
jeweils aktuelle ACM ausdrucken.
Mit p Duplicate ins q wird die jeweils aktuelle Formel
und ihre ACM vervielf„ltigt, mit p Delete... last atom q
p undo q kann man den jeweils letzten Eintrag in die
AC-Matrix l”schen (entspricht bei nichtsortierten Ver-
bindungen der zuletzt gezeichneten Bindung) und mit dem
Menpunkt p Delete... AC-matrix del q die ganze Formel
und ihre ACM aus dem Stack entfernen.
Den ganzen Stack und die gesamte Zeichenebene (d.h. inkl.
geladener .PIC-Dateien) kann man ber p Clear stack q
p clr q leeren.
Params. Hier sind die bereits beschriebenen Zeichenmodi aufgefhrt:
p Norm mode [A]n q
p Bind mode [A]b q
p Text mode [A]t q
p------------------------ q
p Insert... q
p Filled wedge [A]f q
p Stroke wedge [A]s q ,
die jeweils angew„hlt werden k”nnen. Sonderzeichen im
'Text mode' sind ber 'Control' A und Eingabe des ASCII-
Codes zug„nglich. Zu den Insert...-Funktionen bleibt noch
anzumerken, daž die betreffende Bindung bereits gezeichnet
sein muž und sowohl Anfangs- als auch Zielpunkt des ausge-
zogenen Keils innerhalb des Snap-Radius liegen mssen. Die
Keile werden vom Anfangs- zum Zielpunkt ausweitend dar-
gestellt und lassen sich durch 'Darberzeichnen' mit der-
selben Keilform wieder l”schen bzw. variiren.
Fr Normwinkel hat man die Auswahl zwischen...
p Norm angles for ... q
p Pentagon [A]p q
p Hexagon [A]h q ,
der Normierung auf Winkel die h„ufig in Fnf- oder Sechs-
ecken auftreten. Die Wahl dieser Normwinkel ist jedoch
auch beim Zeichnen anderer Strukturen ntzlich, so wurde
die Cyclohexan-Sesselform in der Formel-Bibliothek im
Pentagon-Modus gezeichnet.
Die drei Bindungsl„ngen auf die im Norm-Modus normiert
wird lassen sich ber p Input bond lengths [A]i q frei
w„hlen. Es erscheint eine Box die ber die Maus oder die
Tastatur bzw. den rechten Zahlenblock bedient werden kann.
Hierbei entspricht die Backspace-Taste dem ' <- '-Feld,
die Delete-Taste dem 'Clr'-Feld und die Return/Enter-
Taste dem 'Enter'-Feld.
šber p Screen switch tab q l„žt sich einstellen, ob
st„ndig zwischen physikalischem und logischem Bildschirm
(auf Kosten von etwas Rechenzeit) hin- und hergeschaltet
werden soll oder die Ausgaben direkt erfolgen sollen. Bei
Verwendung von Grožbildschirmen sollte 'Screen switch'
nicht aktiviert werden!
Aužerdem l„žt sich mit p Show matrices ^ q w„hlen, ob
die jeweils aktuelle ACM in der linken oberen Bildschirm-
ecke eingeblendet werden soll oder nicht.
Geometr. p Draw formula with left mouse q
p button / Transfer with right q
Unter diesem Menpunkt sind die geometrischen Operationen
aufgefhrt, die auf die gezeichnete Struktur wirken, aber
ihre ACM unver„ndert lassen:
p Rotate formula ... q
p clockwise + q
p - slightly [S]+ q
p counterclockwise - q
p - slightly [S]- q
Rotation der Formel im oder gegen den Uhrzeigersinn mit
dem Inkrement 15ø und dem Shift-Inkrement 3ø.
p Mirror ... q
p horizontal [S]h q
p vertical [S]v q
Spiegelung der Formel an einer horizontalen oder einer
vertikal verlaufenden Achse.
p Enlarge formula < q
p Shrink formula > q
Vergr”žerung bzw. Verkleinerung der Formel um je 10 %.
p EPSON¿ hardcopy ~ q
Vergr”žerte Hardcopy des Zeichenbereiches im EPSON¿-Modus.
SAR / SPR Hierunter steht eine SAR / SPR - Routine zur Geruchs-
bestimmung nach Strukturmerkmalen p Odor description q
p [S]o q , die an die verwendete kanonische Form an-
gepažt wurde, Keilbindungen werden jedoch nicht erkannt.
Wenn eine Zuordnung m”glich ist, so wird eine Duftbe-
schreibung zurckgegeben. Beispiele fr Riechstoff-Dateien:
TAB_2_8.ACM TAB_4_3.ACM TAB_4_4.ACM TAB_4_10.ACM
Andere Programme lassen sich - bei ausreichendem Speicher-
platz - ber p Execute [C]e q von C_GINEER aus starten.
Im Ordner C_GINEER.403 stehen folgende Bibliotheks- und Beispieldateien:
Ordner \ ... \ Dateien
============================================================================
EXAMPLE \ EXAMPLE.PIC, EXAMPLE.EM,
EXAMPLE1.ACM, EXAMPLE2.ACM, EXAMPLE3.ACM
LIBRARY -------------------------------------------------------------------
\ TABLE_1.LIB \ TABLE_1.PIC, TABLE_1.EM, TAB_1_1.ACM ... TAB_1_10.ACM
\ TABLE_2.LIB \ TABLE_2.PIC, TABLE_2.EM, TAB_2_1.ACM ... TAB_2_10.ACM
\ TABLE_3.LIB \ TABLE_3.PIC, TABLE_3.EM, TAB_3_1.ACM ... TAB_3_10.ACM
\ TABLE_4.LIB \ TABLE_4.PIC, TABLE_4.EM, TAB_4_1.ACM ... TAB_4_10.ACM
\ TABLE_5.LIB \ TABLE_5.PIC, TABLE_5.EM, TAB_5_1.ACM ... TAB_5_10.ACM
============================================================================
Literatur: [1] I. Ugi et. al.,
The Deductive Solution of Chemical Problems
by Computer Programms ...
Pure & Appl. Chem. 50, 1303 (1978).
[2] L. Spialter,
The Atom Connectivity Matrix (ACM) and
its Characteristic Polynomial (ACMCP) ...
J. Am. Chem. Soc. 85 (1963), 2012.
[3] LHASA - Logic and Heuristics Applied to
Synthetic Analysis
E.J. Corey, W.T. Wipke, Science 166, 178 (1969),
sowie J. Am. Chem. Soc. 94 (1972), 421.
[4] SECS - Simulation and Evaluation of
Chemical Synthesis
W.T. Wipke et al.,
J. Am. Chem. Soc. 98 (1976), 8107.
[5] CAMEO - Computer Assisted Mechanistic Evaluation
of Organic Reactions
W.L. Jorgensen et al., J. Org. Chem. 45 (1980),
2043, ibid. 54 (1989), 2058.
[6] ADAPT - Automated data analysis and pattern
recognition toolkit
A.J. Stuper, P.C. Jurs, J. Chem. Inform. Comput.
Sci. 16 (1976), 99. Eine interessante Anwendung:
P.C. Jurs et. al., Correlation of Odor Intensities
with Structural Properties of Odorants,
Chemical Senses 14 (1989), 281.
[7] H.L. Morgan, J. Chem. Doc. 5 (1965), 107.
[8] W.T. Wipke et al., J. Am. Chem. Soc. 96 (1974), 4834.
[9] J. Blair, J. Gasteiger, C. Gillespie, P.D. Gillespie,
I. Ugi, Tetrahedron 30 (1974), 1845.