Zum Inhalt springen

COBOL

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 28. November 2004 um 00:52 Uhr durch FlaBot (Diskussion | Beiträge) (robot Ergänze:he,ia,uk,ko Ändere:cs). Sie kann sich erheblich von der aktuellen Version unterscheiden.

COBOL ist eine Programmiersprache, die wie FORTRAN in der Frühzeit der Computerei nach dem zweiten Weltkrieg entstanden ist und eine für diese Branche ungewöhnliche Überlebensfähigkeit bis in die heutige Zeit hinein bewiesen hat.

Die Abkürzung COBOL steht für "Common Business Oriented Language".

Geschichte

Cobol entstand aus dem dringenden Wunsch, eine hardware-unabhängige standardisierte problemorientierte Sprache für die Erstellung von Programmen für den betriebswirtschaftlichen Bereich zu haben. Eine vom amerikanischen Verteidigungsministerium eingesetzte Arbeitsgruppe entwickelte einen Standard aus der Vermählung der damaligen Programmiersprachen FLOW-MATIC von Sperry Univac (Remington-Rand), Commercial Translator (COMTRAN) von IBM. und FACT von Minneapolis-Honeywell. Namentlich beteiligt hieran war eine Frau: Grace M. Hopper.

Das Ergebnis ist dann 1960 als Cobol-60 von CODASYL verabschiedet worden und in der Folgezeit weiterentwickelt und von nationalen und internationalen Normierungsinstituten (ANSI, ISO) standardisiert worden.

COBOL fand schnell den Weg in die zivile Nutzung als eine der ersten kommerziell eingesetzten kompilierbaren und bis heute am weitesten verbreiteten Programmiersprachen, vor allem für kommerzielle Anwendungen.

Sprachsyntax

COBOL zeichnet sich aus durch eine strikte Trennung von Datendeklaration und prozeduralen Anweisungen. Im Prozedurteil kann man nur Variablen benutzen, die vorher im Datenteil deklariert worden sind. Auch das Aussehen von formatierten Ausgaben wird nicht im Prozedurteil, sondern im Datenteil durch die PICTURE-Klausel festgelegt. Der "REPORT WRITER" macht es möglich, die Struktur einer Druckliste komplett im Datenteil als physische Struktur von Seiten, und logische Struktur von Postenzeilen mit Gruppensummen etc zu beschreiben, ohne dass sich der Prozedurteil darum kümmern muss.

Ein COBOL-Programm ist in Teile (DIVISION), Kapitel (SECTION) und Abschnitte (PARAGRAPH) gegliedert. Die vier DIVISIONs sind in ihrer festgelegten Reihenfolge:

  • Identification Division mit dem Programmnamen und einigen weitgehend obsoleten Paragraphen für Kommentare;
  • Environment Division, wo Schnittstellen zum Betriebs- und dessen Dateisystem definiert werden;
  • Data Division mit der Definition der Programmvariablen und Datenstrukturen
  • Procedure Division mit den prozeduralen Anweisungen.

In der IDENTIFICATION DIVISION gibt es keine SECTIONs, und in der PROCEDURE DIVISION können neuerdings SECTIONS und auch Paragraphs entfallen. ENVIRONMENT und DATA DIVISIONs können u.U. ganz entfallen.

Das traditionelle Kodierschema bei Cobol entspricht der Lochkarte mit ihren 80 Spalten, d. h. Schreibstellen. Dabei waren reserviert

  • die ersten 6 Stellen für Zeilennummerierungen
  • Spalte 7 zur Kennzeichnung einer Kommentar- oder einer Fortsetzungszeile oder einer, die nur für Debugging übersetzt werden soll
  • Spalte 73 bis 80 für sonstige Markierungen wie z.B. den Namen von Programm oder Sourceelement
  • Spalte 8 bis 11 für die Namen von Divisions, Sections und Paragraphs.

Der aktuelle Standard (2002) kennt ein fixes Zeilenformat, wo die rechte Randbegrenzung aufgehoben ist, und ein ganz freies Format, wo auch die Einteilung der ersten 12 Spalten aufgegeben ist.

Ursprünglich wurde COBOL nur in Großbuchstaben geschrieben (man hatte nur Lochkarten und Zeilendrucker ohne Kleinbuchstaben), heute können Variablen und COBOL-Anweisungen beliebig groß oder klein geschrieben werden. Die Sprache ist nicht case-sensitive:

Ein fast minimales Cobol-Programm:

       Identification Division.
       Program-ID. HALLOPGM.
       Procedure Division.
           Display "Hallo Wikipedianer!"
           Stop Run.

Datendeklarationen

... macht man in der Data Division

  • Dateien und deren Satzstrukturen werden in der File Section beschrieben.
  • Arbeitsvariable werden in der Working-Storage Section definiert.
  • Aufruf-Parameter werden in der Linkage Section definiert.
  • Komplexe Drucklisten werden in der Report Section definiert.
  • Bildschirmein- und ausgabe in der Screen Section.

Zur Deklaration von Variablen bietet COBOL zahlreiche Klauseln, deren wichtigsten die Stufennummer, die PICTURE-Klausel und die USAGE-Klausel sind.

Die Stufennummer 77 kennzeichnet eine freistehende Variable, 01 kann ebenfalls eine freistehende Variable bezeichnen, leitet aber normalerweise die Deklaration einer Gruppe ein, was in anderen Sprachen als Record (Pascal u.ä.) oder struct (C/C++ u.ä.) bezeichnet wird. Die Stufennummern 02 bis 49 kennzeichnen dann dieser Gruppe untergeordnete Datendeklarationen, die selber auch wieder Gruppen (Records) sein können. Eine Datendeklaration, die keine weiteren untergeordneten (mit höheren Stufennummern) Datendeklarationen hat, wird in COBOL als elementar (elementary Item) bezeichnet, ansonsten ist es eine Gruppen-Variable (Group Item). Eine solche Gruppe kann man abstrakt als Baum darstellen mit den Gruppen als Knoten und den elementary Items als Blättern.

Mit der speziellen Stufennummer 66 kann man ganzen Speicherbereichen einen anderen Namen geben, mit 88 einen Bedingungsnamen definieren, der wie ein boolescher Ausdruck in z. B. einer IF-Anweisung verwandt werden kann.

Die Stufennummern werden üblicherweise zweistellig geschrieben. Aus den Lochkartenzeiten stammt die Gewohnheit, die Stufennummern in einer Gruppendefinition nicht fortlaufend, sondern in Schritten von 5 oder 10 zu vergeben, weil man dann Zwischenstufen einfügen konnte, ohne gleich einen ganzen Kartenstapel neu lochen zu müssen.

Das folgende Beispiel beschreibt das Layout der traditionellen 80-stelligen COBOL-Programmzeile:

 01  Cobol-Zeile USAGE DISPLAY.
     05  Zeilennummer        PIC 9(6).
     05  Indikator           PIC X.
          88  Ist-Kommentar         VALUES '*' '/'.
          88  Ist-Fortsetzungszeile VALUE '-'.
          88  Ist-Debuggingzeile   VALUE 'D'. 'd'. 
     05  Bereich-A-und-B.
         10  Bereich-A       PIC X(4).
         10  Bereich-B       PIC X(61).
     05  Zeilen-Endekennung  PIC X(8).  

Die Definition eines Wertebereiches sieht als Beispiel so aus:

01 Wertebereich          PIC 99V99 USAGE COMPutational.
   88 Einerwerte        Value 1 thru 9.
   88 Zehnerwerte       Value 10 thru 19.
   88 Zwanzigerwerte    Value 20 thru 29.

Äußere Erscheinung und interne Repräsentation werden im wesentlichen durch die Klauseln PICTURE und USAGE bestimmt. . USAGE COMP, wenn damit gerechnet werden soll, DISPLAY zur Anzeige. Die Symbole hinter PICture legen die Anzahl Stellen oder Zeichen fest, bzw. Editiersymbole wie Dezimal- oder Tausendertrennzeichen, Vorzeichen, Währungssymbole, gedachtes Dezimaltrennzeichen (V) etc., und bestimmen eine elementare Variable damit als entweder alphabetisch, alphanumerisch, numerisch oder numerisch-editiert.

In COBOL wird die Formatierung für sichtbare Ausgabe eben durch die Datendeklaration erledigt, nicht durch prozedurale Anweisungen wie in Sprachen wie Pascal oder C. Den Rest der insgesamt etwa 60 möglichen Klauseln einer Datendeklaration möge man in einem COBOL-Handbuch nachschlagen.

Prozedurale Anweisungen

In der Procedure Divsion findet sich der ausführbare Programmcode. Die Ausführung beginnt mit der ersten Anweisung in hinter der Überschrift Procedure Division bzw. den DECLARATIVES, deren Ausführung nur durch bestimmte Ereignisse ausgelöst wird. Danach werden alle Anweisungen sequentiell ausgeführt, bis ein STOP RUN das Programm beendet, oder ein GO TO zu einer anderen Stelle im Programm verzweigt.

Die Procedure Divsion besteht aus einer oder mehreren Prozeduren. Eine Prozedur ist entweder

  • eine Section: Ein Name, der in Spalte 8 beginnt gefolgt von dem Schlüsselwort SECTION und einem Punkt.
  • eine Gruppe von Sections
  • ein Paragraph: Ein Name, der in Spalte 8 beginnt und mit Punkt endet.
  • eine Gruppe von Paragraphs

Eine solche Prozedur besteht dann aus einem oder mehreren Cobol-Anweisungen (Statements).

Prozeduren können mit der Cobol-Anweisung Perform ausgeführt werden. Es gibt keine formale Parameterübergabe, alle Prozeduren haben Zugriff auf alle Felder in der Data Division.

Mittels CALL können externe Programme (Cobol oder andere Programmiersprachen) aufgerufen werden. Dabei werden Parameter By Reference oder By Content übergeben.

Cobol unterstützt die strukturierte Programmierung; die Verwendung des ebenfalls zulässigen GOTOs ist heute verpönt. In der professionellen Programmierung herrschen hausinterne Programmierstandards, die legen dann in der Mehrzahl fest, dass Prozeduren ausschließlich aus einer Section bestehen.

Ziel der Cobol-Syntax soll sein, dass auch ein nicht an formale Programmiersyntax gewohnter Mensch den Sinn eines Cobol-Programm erahnen kann (wenn er oder sie denn etwas Englisch kann). Alle Cobol-Anweisungen beginnen mit einem Verb und davon gibt es viele.

Einfache Codeschnipsel

Zur Darstellung der Syntax wird einfaches C (oder Java) zu Hilfe genommen.

  • Ein a = b; ist in Cobol MOVE b TO a.
  • Wenn es z.B. in C heißt a = b + c;, dann schreibt ein Cobol-Programmierer entweder ADD b to c GIVING a oder alternativ COMPUTE a = b + c.
  • Ein a++; in C entspricht auf Cobol ADD 1 TO a.

IF/ELSE und EVALUATE

IF und ELSE sind so, wie man es erwartet.

   If Nenner > 0
        Compute Zahl = Zaehler / Nenner
   Else
        Display "Ich bin so unglücklich!"
        Move 0 To Zahl
   End-If

EVALUATE macht die mehrfache Fallunterscheidung, womit jede Form von CASE oder Switch (wie in C), Folgen von IF/ELSIF/ELSIF/END-IF bis hin zu kompletten Entscheidungstabellen dargestellt werden kann.

   Evaluate True
       When  Nenner > 0
             Compute Zahl = Zaehler / Nenner
       When  Nenner < 0
             Compute Zahl = Zaehler / Nenner * -1
       When Other
             Display "Ich bin schon wieder unglücklich!"
             Move 0 To Zaehler
   End-Evaluate

Eine Cobol-Spezialität sind die sogenannten Conditional Statements, das sind Cobol-Anweisungen mit einer Bedingungs-Klausel:

   Read Eingabesatz
        At End
            Display "Dateiende erreicht " Eingabe-Zaehler " gelesen!" 
            Set Ende-der-Verarbeitung To True
     Not At End
            Add 1 to Eingabe-Zaehler
   End-read

Schleifen

Eine C-Schleife wie for(i=0; i<10;i++) {...} wird in Cobol mit PERFORM kodiert:

   Perform Varying i From 1 By 1
             Until i > 10
      . . .
   End-Perform

Cobol heute

Die Sprache ist an Batch-Verarbeitung orientiert und enthält z.B. keine Elemente, um interaktive Ein/Ausgabe an einem Terminal oder PC zu programmieren. Dennoch spielt Cobol problemlos eine große Rolle als Programmiersprache bei der Erstellung von Online-Systemen wie CICS oder IMS; solche Transaktionsmonitore stellen ihre Dienste mit einem Cobol-tauglichen API zur Verfügung: Entweder wie z.B. bei IMS als reines CALL-Interface (CALL 'CBLTDLI') oder wie bei CICS als EXEC-Sprache, die von einem Preprozessor in Cobol-Code umgesetzt wird.

Das gleich gilt für den Zugriff auf relationale Datenbanken: Cobol-Programme benutzen dann embedded SQL (EXEC SQL). Auch kann man Stored Procedures in Cobol programmieren.

Neuerungen in Cobol aus der jüngsten Zeit:

  • Nested Program erlauben es, innerhalb eines Cobol-Programms Prozeduren mit lokalen Variablen zu schreiben.
  • Intrinsic Functions für mathematische und andere Funktionen.
  • Rekursion bei externen Calls ist möglich.
  • Das Cobol-Verb XML PARSE bietet einen integrierten XML-Parser.
  • OO-Erweiterungen erleichterten die Zusammenarbeit mit objektorientierten Menschen und Programmen.

Insgesamt lässt sich sagen, dass mit der Programmiersprache Cobol viel und mit Verstärkung durch Transaktionssysteme und kleinen Hilfsroutinen in C oder Assembler so ziemlich alles geht.

Entwicklung und Standardisierung

Ein Ausschuss des oben erwähnten CODASYL erarbeitete im Jahr 1959 einige Grundsätze, legte den Namen COBOL fest, und veröffentlichte im April 1960 seinen Abschlussbericht mit den ersten Spezifikationen der Programmiersprache, die als COBOL-60 in die Geschichte eingingen.

Im Rahmen von CODASYL gab es dann ständig einen Ausschuss, teilweise mit Unterausschüssen, der bzw. die sich mit der Weiterentwicklung von COBOL befassten und im Lauf der Jahrzehnte verschiedene Namen und verschiedene Status innerhalb von CODASYL hatten.

Entwicklung durch CODASYL

COBOL-60 zeigte die Praktikabilität der angestrebten gemeinsamen Programmiersprache.

COBOL-61 war nur teilweise kompatibel mit der Vorgängerversion, wurde aber weitgehend in zahlreichen Compilern implementiert. CODASYL hat sich dann darauf verpflichtet, die Sprache von da aus evolutionär zu weiterzuentwickeln, statt revolutionäre Änderungen vorzunehmen.

Mit COBOL-61 EXTENDED kamen u.a. die SORT-Möglichkeiten und der REPORT WRITER hinzu.

COBOL, EDITION 1965 fügte u.a. interne Tabellen und Optionen für Dateibearbeitung hinzu.

Weitere Dokumente zur Entwicklung sind die CODASYL COBOL JOURNAL OF DEVELOPMENT der Jahre 1968, 1969, 1970, 1973, 1976, 1978, 1981 und 1984.

Erweiterungen durch X/Open, die Open Group

Im Rahmen der Bemühungen um einen Standard für das Betriebssystem Unix durch die Industrievereinigung X/Open wurden dafür auch Spezifikationen für COBOL vereinbart, deren jüngste von 1991 aus den höchsten Stufen der vorgeschriebenen Module von COBOL-85 besteht, mit der Erweiterung von 1989 durch die "Intrinsic Functions", aber ohne Report-Writer, Segmentierung und Debugging, dafür aber mit eigenen Erweiterungen für Interaktion mit Bildschirmformularen (SCREEN SECTION und ACCEPT/DISPLAY), gemeinsamen Zugriff auf Dateien mit Sperren auf Dateien und Sätze, sowie Internationalisierung mit z.B. Doppelbyte-Zeichensätzen.

Standardisierung durch ANSI

Im Jahr 1960 wurde, angeregt durch den Industrieverband "Computer and Business Equipment Manufacturers Association" im Rahmen der US-amerikanischen Standardisierungsorganisation ( ASA) ein "Committee on Computers and Information Processing" mit der Nummer X3, geschaffen, welches dann einen Unterausschuss X3.4 für Programmiersprachen einrichtete, der wiederum einen Unterausschuß X3.3.4 für COBOL einrichtete. Im Dezember 1962 wurden Hersteller und andere Interessierte zur Mitarbeit an der Standardisierung eingeladen, wobei dann festgelegt wurde, dass die Standardisierung auf den Publikationen des CODASYL fußen sollten.

Der erste Standard wurde am 23. August 1968 als USA Standard COBOL 1968 verabschiedet und als Dokument X3.23-1968 veröffentlicht.

Der Ausschuß X3.4.4 wurde dann zum Technischen Komitee X3J4, wie er auch heute noch heißt, und machte sich an die Arbeit, den nächsten Standard zu entwickeln, der dann am 10.5.1974 als American National Standard COBOL 1974 verabschiedet und dann im Dokument ANS X3.23-1974 veröffentlicht wurde.

Der nächste Standard wurde im April 1985 von X3J4 verabschiedet und im September vom zuständigen Entscheidungsgremium der inzwischen ANSI heißenden Organisation angenommen und dann als ANS X3.23-1985 veröffentlicht. COBOL-85 führte mit Begrenzern wie END-IF und END-PERFORM erstmals die Möglichkeit ein, in COBOL beliebig geschachtelte Entscheidungs- (IF, EVALUATE) und Wiederholungsanweisungen (PERFORM) zu schreiben und damit die sog. "Strukturierte Programmierung" in COBOL zu praktizieren. Zu COBOL-85 wurde später ein Zusatz mit eingebauten (intrisic) Funktionen und eine weiterer mit Korrekturen zum Standard veröffentlicht.

Der aktuelle Standard wurde 2002 verabschiedet. Wesentliche Änderungen darin sind die Übernahme der Erweiterungen durch X/Open, die explizite Unterstützung von internationalen Zeichensätzen einschließlich Unicode, die Objektorientierte Programmierung sowie bedingte Compilierung, neben zahlreichen anderen Erweiterungen und Präzisierungen.

Nach dem Ende von CODASYL hat das Komitee J4 auch die Verantwortung nicht nur für die Standardisierung, sondern auch für die Entwicklung übernommen.

Der nächste Standard wird für das Jahr 2008 vorbereitet.

Internationale Standardisierung bei ISO

Das Komitee X3J4 (führe X3.4.4) hat von Anfang an eng mit verschiedenen internationalen Gremien zusammengearbeitet. Dementsprechend stimmte ANS COBOL X3.23-1968 mit der ISO-Empfehlung für COBOL überein.

In der ISO ist das Technical Committee ISO/TC 97, Computers and Information Processing'# zuständig, dessen Sekretariat vom ANSI gestellt wird.

ISO hat zu COBOL eine Empfehlung (Recommendation) R-1989:1972, sowie Standards ISO 1989:1978 und ISO 1989:1985 verabschiedet, und dabei die Vorgabe des US-Standardisierungsgremiums übernommen.

Der aktuelle Standard 2002 ist umgekehrt zuerst als ISO/IEC 1989:2002 veröffentlicht und dann von den nationalen Standardorganisationen übernommen worden.

Module und standardkonforme Implementierungen

COBOL-68, COBOL-74 und COBOL-85 ordneten die verschiedenen Features der Sprache einem Modul mit jeweils einem bis drei "Levels" zu, woraus dann minimale und volle Implementierungen des Standards als Kombination von bestimmten Levels der jeweiligen Module definiert wurden. Eine mit COBOL-2002 konforme Implementierung muss den gesamten Sprachumfang implementieren.

Cobol Compiler

Für Computer der Klassen "Großrechner" und "Mittlere Datentechnik" boten und bieten deren jeweiligen Hersteller -- IBM, Unisys, Siemens, HP, u.a. -- auf ihre proprietären Betriebssysteme zugeschnittene COBOL-Compiler an, z.T. verschiedene Compiler, die beispielsweise verschiedenen Standards entsprechen.

Für Betriebssysteme, die aus der UNIX bzw. MS-DOS-Tradition entstanden sind, gibt es COBOL-Compiler von verschiedenen Software-Herstellern. Näheres siehe in der unten verlinkten COBOL-FAQ von William M. Klein.