Index of /atarilibrary/atari_cd04/CHEMIE/C_GINEER

      Name                    Last modified       Size  Description

[DIR] Parent Directory 11-May-2007 21:04 - [TXT] C_GINEER.PRG 21-Apr-1987 22:07 102k [DIR] EXAMPLE/ 11-May-2007 21:04 - [DIR] LIBRARY/ 11-May-2007 21:04 -


   p C - G I N E E R q        In the forseeable future problem-
   p Version 4.03 PD q        solving  computer  programs  with 
   p  ½ 1992 by      q        intelligence features will aquire 
   p     Ph. Kraft   q        similar importance for chemistry.   
                               
                                        I. Ugi in [1]                


   Um Mižverst„ndnissen vorzubeugen, C-GINEER steht fr "Connectivity
   Generator", wobei sich zwar die Schreibweise an "engineer" anlehnt,
   das Programm sich aber weder an Maschinisten, noch an Techniker oder
   gar (milit„rische) Pioniere (lt. Englisch-Deutsch-W”rterbuch) wendet.
        
   Es handelt sich vielmehr um ein Programm zur einfachen Erstellung
   chemischer Strukturformeln  -  um einen 2D-Strukturformeleditor auf
   Basis von Atom-Connectivity-Matrices (ACM, [2]) und wenn berhaupt
   ist letzteres die einzige Form von 'Pioniertum' in diesem Programm.

   Atom-Connectivity-Matrices  - auch als 'Adjazenzmatrizen' oder 'topo-
   logische Matrizen' bezeichnet [1] -  wurden 1963 von L. Spialter [2]
   als mathematisches Modell zur Beschreibung chemischer Strukturen ein-
   gefhrt und bilden heute das Fundament von Synthese-Design-Programmen
   ( wie LHASA [3], SECS [4] und CAMEO [5] ), bei der 'Structure-Activity-
   Relationship' (SAR) und 'Structure Property Relationship' (SPR) ( etwa
   ADAPT [6] ), fr Substruktur-Recherchen in Datenbanken und finden auch 
   Verwendung in Nomenklatur-Programmen. 
  

   Die ACM  A=[a(i,j)]  einer durchnummerierten Verbindung mit n-Atomen 
   ist eine quadratische (n,n)-Matrix, in deren Hauptdiagonale die Atom-
   symbole stehen. Fr die Aužerdiagonal-Elemente gilt:

        a(i,j) = 0 ,  wenn keine formale chemische Bindung zwischen 
                      den Atomen C(i) und C(j) besteht.

        a(i,j) = 1 ,  bei C(i)-C(j) (Einfachbindung)

        a(i,j) = 2 ,  bei C(i)=C(j) (Doppelbindung)

        a(i,j) = 3 ,  bei C(i)ðC(j) (Dreifachbindung)

   Darberhinaus gilt in C-GINEER (zur Stereodifferenzierung) bezogen 
   auf den Eintrag im 'oberen aužerdiagonalen Dreieck' der ACM:

        a(i,j) = 5 ,  gestrichelter Keil von C(i) nach C(j) zulaufend
        a(i,j) = 6 ,  gestrichelter Keil von C(i) nach C(j) ausweitend

        a(i,j) = 7 ,  ausgefllter Keil von C(i) nach C(j) zulaufend
        a(i,j) = 8 ,  ausgefllter Keil von C(i) nach C(j) ausweitend    

   Fr zuknftige Versionen ist geplant:

        a(i,j) = 4 ,  fr delokalisierte ã-Elektronensysteme
        a(i,j) = 9 ,  fr koodinative Bindungen in Komplexen


 p  Hinweis: Das Verst„ndnis der ACM-Struktur ist keine Voraussetzung   q
 p  fr die Benutzung des Programmes. Die Atom-Connectivity-Matrix ist  q
 p  lediglich das interne Speicher- und Dateiformat von C-GINEER.       q

   Die Verwendung der ACM in einem 2D-Zeichenprogramm bringt aber neben 
   der šbereinstimmung in den Datenstrukturen mit Synthese-Design- und 
   SAR / SPR -Programmen eine Reihe von neuen M”glichkeiten in C-GINEER.


 ****************************************************************************
 *                                                                          *
 *  Der zu dieser Anleitung geh”rende Ordner C_GINEER.403 inkl. Inhalt ist  *
 *  Public Domain, also frei kopierbar. Er darf daher nicht verkauft oder   *
 *  vertrieben werden, und nur komplett kopiert werden.                     *
 *                                                                          *
 ****************************************************************************


 C - G I N E E R   4 . 0 3   P D 


 Zum Zeichnen von Formeln...
 
 linke Maustaste gedrckt halten, Bindung ausziehen und justieren, dann
 Maustaste freigeben. Innerhalb des krzesten Bindungsabstandes erfolgt
 Anbindung an das n„chstliegendste Atom.

 Bei gedrckter rechter Maustaste l„žt sich die Formel verschieben.
 
 Das Men wird nach dem Zeichnen durch Anklicken der Menleiste aktiviert
 (dies verhindert šberschneidungen bei der Bildschirmrestauration), der
 Funkionsaufruf ber die Tastaturcodes ist hingegen immer m”glich.   

 Folgende Zeichenmodi sind vorhanden:


 Norm mode - Bindungsl„ngen und Bindungswinkel (letztere bezogen auf 
             Winkel, die beim Zeichnen von Fnf- oder Sechsecken h„ufig 
             vorkommen) werden in diesem Modus beim Zeichnen normiert.

 Bind mode - Bindungsl„ngen und Bindungswinkel sind frei und entsprechen
             der ausgezogenen Linie. Innerhalb des Snap-Radius ist hierin
             die 'šberbrckung' entfernter Atome m”glich. 
  
 Text mode - Um Heteroatome in die ACM einzufhren klickt man das ent-
             sprechende Atom an und gibt das Symbol (nur C,O,H,N,S,P) ein,
             befindet man sich nicht innerhalb des kleinsten Bindungsradius
             ist die Eingabe von Kommentaren oder Summenformeln m”glich,
             wobei Zahlen unmittelbar nach Buchstaben automatisch als
             Subscript gesetzt werden. Nach Abschluž der Eingabe wird der
             Cursor automatisch um eine Zeile nach unten gesetzt. Der
             Kommentartext wird nicht als ACM verwaltet, im Gegensatz zu den
             Atomsymbolen ist eine Korrektur nur durch šberschreiben (auch 
             mit Spaces) und das Abspeichern nur im .PIC-Format m”glich.


 Doppel- und Dreifachbindungen...

 werden einfach dadurch generiert, daž man die betreffende Bindung einmal
 (fr Doppelbindungen) oder zweimal (fr Dreifachbindungen) darber-
 zeichnet, beim dritten Mal erh„lt man die wieder eine Einfachbindung.

 Stereochemische Differenzierungen...

 lassen sich durch Einfgen von filled wedges (ausgefllten Keilen) oder
 von stroke wedges (Strichkeilen) treffen.



 In der Menleiste ist der Reihe nach aufgefhrt:
    
    p  C-GINEER   File   Matrices   Params.   Geometr.   SAR / SPR  q


 Unter den jeweiligen Menleisten-Punkten erscheinen folgende Operationen:


 C-GINEER        Hierunter findet sich eine kurze Programm-p Information q
                 p help q und eventuell vorhandene Accessories.


 File            Enth„lt die Unterpunkte:
  
                 p Merge .ACM  [C]m q
                 p Open  .EM   [C]o q         
                 p Save  .ACM  [C]a q 
                 p Save  .EM   [C]s q 
                 p Load  .PIC  [C]l q        
                 p Save  .PIC  [C]p q

                 Es kann in folgenden Formaten geladen und gespeichert
                 (mit Back-up) werden:
          
                 .ACM   Atom Connectivity Matrix  
                 .BAC   Back-up of Atom Connectivity Matrix
                 .EM    Ensemble of Molecules 
                 .BEM   Back-up Ensemble of Molecules             
                 .PIC   Screen- bzw. Doodle-Format 

                 Das Laden und Speichern im Screen- bzw. Doodle-Format
                 erfolgt ohne Back-up und erm”glicht die šbernahme der
                 erstellten Formeln in andere Zeichenprogramme.


 Matrices        Dieser Menpunkt enth„lt einen Stack

                 p ACM[1]   F1  q
                 p ACM[2]   F2  q
                 p ACM[3]   F3  q
                 p ACM[4]   F4  q
                 p ACM[5]   F5  q
                 p ACM[6]   F6  q
                 p ACM[7]   F7  q
                 p ACM[8]   F8  q
                 p ACM[9]   F9  q
                 p ACM[10]  F10 q

                 der anzeigt, welche ACMs des EM belegt sind und welche
                 die jeweils aktuelle ACM  - mit einem H„ckchen gekenn-
                 zeichnet -  ist. Die Graphikoperationen wirken nur auf 
                 dieses ACM. Durch Anklicken der Eintr„ge kann man die 
                 aktuelle ACM bestimmen. Die Auswahl ist aužerdem durch
                 Anklicken der Formel mit der rechten Maustaste m”glich.
                 Beim Zeichnen wird jeweils die ACM aktualisiert, die am
                 n„chsten liegt, es sei denn sie liegt aužerhalb des Snap-
                 Radius. In diesem Fall wird eine neue ACM ge”ffnet.

                 Die 10 ACMs in der Version 4.03 sind (50,50)-Matrizen
                 mit zusammen 25000 Eintr„gen entsprechend 500 Atomen.
                 Gr”žere Schemata mssen als .PIC-Datei zwischenge-
                 speichert werden. 
                
                 Fr SAR / SPR -Korrelationen sind definiert nummerierte
                 ACMs n”tig. Die Sortierung und Durchnummerierung der 
                 Matrizen kann in C-GINEER entweder durch den vom Chemical
                 Abstracts Service (CAS) benutzten MORGAN-Algorithmus [7],
                 programmiert nach [8] und konvergent erweitert, ber den
                 Menpunkt p Morgan sort [A]m q oder durch einen fr 
                 dieses Programm entwickelten Algorithmus p Canonical q
                 p form [A]c q erfolgen. Eine kanonische Form ist nach
                 [9] jede fr ein spezielles Problem (hier die Geruchs-
                 bestimmung) standartisierte Matrix. Der Algorithmus geht
                 etwa folgendermažen vor:

                 - Suche die polarste oder weitverzweigteste Stelle in
                   der Verbindung (letzteres analog zum MORGAN-Algorithmus)
               
                 - Durchlaufe von dort ausgehend zuerst die am wenigsten 
                   verzweigten (charakteristischen) Reste und gehe dann
                   zur 'n„chstweitverzweigten' Stelle -> Iteration...
                         
                 Mit dem Meneintrag p Numbering # q kann man sich die
                 jeweils aktuelle (sortierte bzw. unsortierte) Numerierung
                 der Atome ansehen. Mit dem Menpunkt p Print | q die
                 jeweils aktuelle ACM ausdrucken.

                 Mit p Duplicate ins q wird die jeweils aktuelle Formel
                 und ihre ACM vervielf„ltigt, mit p Delete... last atom q
                 p undo q kann man den jeweils letzten Eintrag in die 
                 AC-Matrix l”schen (entspricht bei nichtsortierten Ver-
                 bindungen der zuletzt gezeichneten Bindung) und mit dem
                 Menpunkt p Delete... AC-matrix del q die ganze Formel
                 und ihre ACM aus dem Stack entfernen.

                 Den ganzen Stack und die gesamte Zeichenebene (d.h. inkl.
                 geladener .PIC-Dateien) kann man ber p Clear stack q
                 p clr q leeren.                    


 Params.         Hier sind die bereits beschriebenen Zeichenmodi aufgefhrt:

                 p  Norm mode    [A]n      q
                 p  Bind mode    [A]b      q
                 p  Text mode    [A]t      q
                 p------------------------ q
                 p  Insert...              q
                 p    Filled wedge  [A]f   q
                 p    Stroke wedge  [A]s   q ,
     
                 die jeweils angew„hlt werden k”nnen. Sonderzeichen im
                 'Text mode' sind ber 'Control' A und Eingabe des ASCII-
                 Codes zug„nglich. Zu den Insert...-Funktionen bleibt noch 
                 anzumerken, daž die betreffende Bindung bereits gezeichnet
                 sein muž und sowohl Anfangs- als auch Zielpunkt des ausge-
                 zogenen Keils innerhalb des Snap-Radius liegen mssen. Die
                 Keile werden vom Anfangs- zum Zielpunkt ausweitend dar-
                 gestellt und lassen sich durch 'Darberzeichnen' mit der-
                 selben Keilform wieder l”schen bzw. variiren.
                              
                 Fr Normwinkel hat man die Auswahl zwischen...
                  
                 p Norm angles for ...      q
                 p   Pentagon          [A]p q  
                 p   Hexagon           [A]h q ,

                 der Normierung auf Winkel die h„ufig in Fnf- oder Sechs-
                 ecken auftreten. Die Wahl dieser Normwinkel ist jedoch
                 auch beim Zeichnen anderer Strukturen ntzlich, so wurde
                 die Cyclohexan-Sesselform in der Formel-Bibliothek im
                 Pentagon-Modus gezeichnet. 

                 Die drei Bindungsl„ngen auf die im Norm-Modus normiert
                 wird lassen sich ber p Input bond lengths [A]i q frei
                 w„hlen. Es erscheint eine Box die ber die Maus oder die
                 Tastatur bzw. den rechten Zahlenblock bedient werden kann.
                 Hierbei entspricht die Backspace-Taste dem ' <- '-Feld, 
                 die Delete-Taste dem 'Clr'-Feld und die Return/Enter-
                 Taste dem 'Enter'-Feld. 
          
                 šber p Screen switch  tab q l„žt sich einstellen, ob
                 st„ndig zwischen physikalischem und logischem Bildschirm
                 (auf Kosten von etwas Rechenzeit) hin- und hergeschaltet
                 werden soll oder die Ausgaben direkt erfolgen sollen. Bei 
                 Verwendung von Grožbildschirmen sollte 'Screen switch'
                 nicht aktiviert werden!
                 
                 Aužerdem l„žt sich mit p Show matrices ^ q w„hlen, ob
                 die jeweils aktuelle ACM in der linken oberen Bildschirm-
                 ecke eingeblendet werden soll oder nicht.


 Geometr.        p Draw formula with left mouse q
                 p button / Transfer with right q

                 Unter diesem Menpunkt sind die geometrischen Operationen
                 aufgefhrt, die auf die gezeichnete Struktur wirken, aber
                 ihre ACM unver„ndert lassen:

                 p Rotate formula ...        q
                 p   clockwise         +     q
                 p   - slightly        [S]+  q
                 p   counterclockwise  -     q
                 p   - slightly        [S]-  q

                 Rotation der Formel im oder gegen den Uhrzeigersinn mit
                 dem Inkrement 15ø und dem Shift-Inkrement 3ø.

                 p Mirror ...         q
                 p   horizontal  [S]h q 
                 p   vertical    [S]v q

                 Spiegelung der Formel an einer horizontalen oder einer
                 vertikal verlaufenden Achse.

                 p Enlarge formula  < q
                 p Shrink  formula  > q

                 Vergr”žerung bzw. Verkleinerung der Formel um je 10 %.

                 p EPSON¿ hardcopy  ~ q

                 Vergr”žerte Hardcopy des Zeichenbereiches im EPSON¿-Modus.


 SAR / SPR       Hierunter steht eine SAR / SPR - Routine zur Geruchs-
                 bestimmung nach Strukturmerkmalen p Odor description q
                 p [S]o q ,  die an die verwendete kanonische Form an-
                 gepažt wurde, Keilbindungen werden jedoch nicht erkannt.
                 Wenn eine Zuordnung m”glich ist, so wird eine Duftbe-
                 schreibung zurckgegeben. Beispiele fr Riechstoff-Dateien:     

                 TAB_2_8.ACM   TAB_4_3.ACM   TAB_4_4.ACM   TAB_4_10.ACM
                
                 Andere Programme lassen sich - bei ausreichendem Speicher-
                 platz - ber p Execute [C]e q von C_GINEER aus starten.


 Im Ordner C_GINEER.403 stehen folgende Bibliotheks- und Beispieldateien:


  Ordner        \ ... \  Dateien  

 ============================================================================

  EXAMPLE       \ EXAMPLE.PIC,  EXAMPLE.EM, 
                  EXAMPLE1.ACM, EXAMPLE2.ACM, EXAMPLE3.ACM       

  LIBRARY -------------------------------------------------------------------

  \ TABLE_1.LIB \ TABLE_1.PIC,  TABLE_1.EM,   TAB_1_1.ACM ... TAB_1_10.ACM  

  \ TABLE_2.LIB \ TABLE_2.PIC,  TABLE_2.EM,   TAB_2_1.ACM ... TAB_2_10.ACM

  \ TABLE_3.LIB \ TABLE_3.PIC,  TABLE_3.EM,   TAB_3_1.ACM ... TAB_3_10.ACM

  \ TABLE_4.LIB \ TABLE_4.PIC,  TABLE_4.EM,   TAB_4_1.ACM ... TAB_4_10.ACM

  \ TABLE_5.LIB \ TABLE_5.PIC,  TABLE_5.EM,   TAB_5_1.ACM ... TAB_5_10.ACM

 ============================================================================               
 

 Literatur:      [1] I. Ugi et. al., 
                     The Deductive Solution of Chemical Problems 
                     by Computer Programms ...
                     Pure & Appl. Chem. 50, 1303 (1978).

                 [2] L. Spialter, 
                     The Atom Connectivity Matrix (ACM) and
                     its Characteristic Polynomial (ACMCP) ... 
                     J. Am. Chem. Soc. 85 (1963), 2012.
                      
                 [3] LHASA - Logic and Heuristics Applied to
                             Synthetic Analysis

                     E.J. Corey, W.T. Wipke, Science 166, 178 (1969),
                     sowie J. Am. Chem. Soc. 94 (1972), 421.
                     
                 [4] SECS - Simulation and Evaluation of                   
                            Chemical Synthesis
                  
                     W.T. Wipke et al.,
                     J. Am. Chem. Soc. 98 (1976), 8107.

                 [5] CAMEO - Computer Assisted Mechanistic Evaluation
                             of Organic Reactions
                        
                     W.L. Jorgensen et al., J. Org. Chem. 45 (1980),
                     2043, ibid. 54 (1989), 2058.    

                 [6] ADAPT - Automated data analysis and pattern 
                             recognition toolkit

                     A.J. Stuper, P.C. Jurs, J. Chem. Inform. Comput.
                     Sci. 16 (1976), 99. Eine interessante Anwendung:

                     P.C. Jurs et. al., Correlation of Odor Intensities 
                     with Structural Properties of Odorants, 
                     Chemical Senses 14 (1989), 281.

                 [7] H.L. Morgan, J. Chem. Doc. 5 (1965), 107.

                 [8] W.T. Wipke et al., J. Am. Chem. Soc. 96 (1974), 4834.   

                 [9] J. Blair, J. Gasteiger, C. Gillespie, P.D. Gillespie,
                     I. Ugi, Tetrahedron 30 (1974), 1845.