C (Programmiersprache)
Die Programmiersprache C wurde von Ken Thompson und Dennis Ritchie in den frühen 1970er Jahren für das neu entwickelte Betriebssystem Unix entworfen. Ken Thompson passte zunächst die Programmiersprache BCPL auf seine Bedürfnisse an und nannte die so entstandene Sprache "B" (nach den Bell Laboratories in denen die Sprache entwickelt wurde). Aus dieser Sprache entstand dann C. Die grundlegenden Programme aller Unix-Systeme und die Kerne vieler Betriebssysteme sind in C programmiert.
Die Sprache C++ ist aus C hervorgegangen und gegenüber C unter anderem um Möglichkeiten zur objektorienterten und generischen Programmierung erweitert.
Überblick
C ist eine Programmiersprache, die auf fast allen Computersystemen zur Verfügung steht. Im Gegensatz zu z.B. BASIC gibt es seit der Definition von ANSI C relativ einheitliche Implementierungen auf den verschiedenen Plattformen. In jedem C-System steht auch die genormte Standard C Library zur Verfügung. Dies und die sehr gute Performance der resultierenden Programme erklärt die weiterhin relativ hohe Popularität der Sprache, sowohl im kommerziellen als auch im Open-Source-Bereich.
Es gibt Meinungen, dass C softwaretechnologisch gesehen nicht dem heutigen Stand der Technik entspreche, manchmal wird C auch als portierbarer Highlevel-Assembler bezeichnet. Dem lässt sich entgegen halten, dass die Kerne fast aller heute verbreiteten Betriebssysteme in C implementiert wurden (und dies obwohl C++ bereits seit Mitte der 1980er Jahre zur Verfügung steht, wenn auch in der jetzigen, ISO-genormten Form erst seit 1998). C eignet sich gut für die Systemprogrammierung.
Anders sieht die Sache jedoch bei der Anwendungsentwicklung aus. Dort wird C zunehmend durch die Sprachen C++, Java und C# verdrängt, die gemeinsam haben, dass sie alle über Möglichkeiten zur objektorientierten Programmierung verfügen und C im Bezug auf Wartbarkeit, Entwurfsunterstützung und Abstraktionsniveau erweitern und verbessern.
An anderer Stelle zeigen sich die einfache Struktur und der kleine Umfang der Sprache als großer Vorteil: Die Portierung eines C-Compilers auf eine neue Prozessorplattform ist verglichen mit anderen Sprachen wenig aufwändig, so dass sich dies vom einfachsten Mikrocontroller bis zum Großrechner-Prozessor praktisch immer lohnt. Für den Entwickler bedeutet das, dass er, egal für welche Plattform er programmiert, immer davon ausgehen kann, einen C-Compiler zu bekommen. Die prozessor-spezifische Programmierung in Assembler bleibt ihm dadurch ganz oder weitgehend erspart, und er kann Quellcode, den er für andere Plattformen geschrieben hat, auf eine neue Plattform mitnehmen, und dieser wird (ganz ohne oder mit kleinen Änderungen) laufen.
Die Sprachbeschreibung wurde 1972 erstmals publiziert. Im Jahre 1989 wurde die Sprache erstmals standardisiert (C89). Dieser Standard wurde überarbeitet und 1999 erschien dann der internationale Standard ISO/IEC 9899:1999, der als C99 bekannt ist. Siehe auch ANSI C.
Ein ausführbares C-Programm wird durch den so genannten Linker oder Binder aus Objektcode erzeugt (gebunden). Dabei können mehrere Objectcodedateien zu einem Programm zusammengefasst werden. Die Objektcodedateien ihrerseits werden durch den Compiler aus Textdateien erzeugt (übersetzt), die eine Anzahl Funktions- und Variablendefinitionen enthalten. Ein ausführbares Programm muss eine Funktion mit dem Namen main enthalten. Neben Programmen kann man aber auch noch Bibliotheken erstellen. Diese enthalten im Gegensatz zu Programmen (normalerweise) keine Funktion namens main, werden ähnlich wie Programme gebunden oder in ein Archiv zusammengefasst. Diese Bibliotheken können dann in einem späteren Bindevorgang wiederum zu einem Programm hinzugebunden werden. Auf diese Weise kann man verhindern, dass für jedes Programm das erzeugt wird, tausende unveränderliche Objektcodedateien immer wieder erneut gebunden werden müssen.
Hallo-Welt-Programm in C
Der folgende Quelltext stellt ein einfaches C-Programm dar, das die Meldung Hallo Welt
und einen Zeilenumbruch auf dem Standardausgabemedium ausgibt.
#include <stdio.h> int main (void) { printf("Hallo Welt!\n"); return 0; }
In der dritten Zeile beginnt der Programmablauf. Es ist der Aufruf der Funktion main
. Die Funktion main()
ist die Hauptfunktion eines Programmes (in einem hosted environment) und in unserem Programm ist sie sogar die einzige Funktion. Sie wird immer als erste Funktion aufgerufen. Sie hat wie alle Funktionen einen Anfang (die öffnende geschweifte Klammer) und ein Ende (die schließende geschweifte Klammer). Man kann ihr beim Aufruf Werte übergeben, die dann zwischen den runden Klammern angegeben werden. Die Schlüsselwörter zwischen den runden Klammern werde bei einer Funktion auch Parameterliste genannt. Wird void
zwischen den Klammern angegeben, dann hat das die Bedeutung, dass keine Werte übergeben werden. Fügt man hingegen den Text int argc, char *argv[] in die Parameterliste ein, lässt sich während des Programmablaufs mittels der Ganzzahlvariable argc die Anzahl der beim Programmstart übergebenen Argumente abfragen:
int main (int argc, char* argv[]) { // ... }
Ein Zugriff auf die C-String-Reihung argv[] ermöglicht die Abfrage des n-ten Arguments, wobei hierzu eine Ganzzahl zwischen 0 und n in die eckigen Klammern von argv[] einzusetzen ist. Nach der Abarbeitung erhält man von der Funktion main
einen Wert zurück. Dieser Wert ist vom Typ int
. Typ int
heißt, dass eine Ganzzahl zurückgeliefert wird.
Die erste Anweisung in der Funktion main
ist eine Ausdrucksanweisung welche die Funktion printf
aufruft. Diese Funktion ist nicht Teil des Sprachkerns, sondern der Standardbibliothek. Daher ist sie dem Compiler nicht bekannt und muss gemäß C99 vor ihrer Verwendung deklariert werden.
Dies geschieht durch die Präprozessordirektive #include <stdio.h>
, die in der ersten Zeile angegeben wurde. Die Funktionen der Standardbibliothek werden in aller Regel durch eine Bibliothek mit Hilfe eines Linkers an das Programm gebunden, jedoch kann ein Compiler auch auf einem anderen Weg eine Funktion printf
zur Verfügung stellen.
Die zweite Anweisung ist die Sprung-Anweisung return 0;
. Die return
-Anweisung ist Teil des Sprachkerns. Für sie ist ein Header (#include...
), wie dies bei printf
der Fall war, nicht nötig. Der Rückgabewert 0
soll von dem Aufrufer des Programms als fehlerfreie Ausführung interpretiert werden.
Programmieren in C
Die Programmierung mit der Sprache C kann nach vier Kriterien unterteilt werden:
- Der erste Betrachtungspunkt ist die Sprache selbst. Also der Kern der Sprache, der vom Compiler direkt verstanden wird. Der Sprachkern wird in dem Kapitel zur Beschreibung der Sprache genauer erklärt werden.
- Die Bibliotheksfunktionen, die jedem C-Compiler zur Verfügung stehen, solange der Compiler den Anspruch hat, ANSI-kompatibel zu sein. Verwendet ein Programm lediglich den Sprachkern gemäß der Sprachdefinition und die Standardbibliothek, so ist es auf jedem System, das einen ANSI-kompatiblen Compiler zur Verfügung stellt, übersetzbar und zeigt auch auf allen Systemen das gleiche Verhalten.
- Die Bibliotheksfunktionen, die von dem (Betriebs-)System zur Verfügung gestellt werden. Diese Bibliotheken stammen also nicht von einem ANSI-kompatiblen Compiler. Daher sind Programme, die diese Bibliotheken verwenden, nur bedingt portabel. Ein Teil dieser Bibliotheken wird in dem Kapitel Weitere C-Bibliotheken beschrieben.
- Die Erweiterungen des Sprachkerns, die von einem Compiler zur Verfügung gestellt werden. Diese Erweiterungen betreffen die Werkzeuge.
Umgebung
Die Umgebung wird im Kapitel 5. Environment in C99 beschrieben.
Beschreibung der Sprache
Die Beschreibung der Sprache bezieht sich auf das Kapitel 6. Language in C99.
Die Standardbibliothek
Die Standardbibliothek beschreibt die Makros und Funktionen, die jedem Compiler zur Verfügung steht. Ihr ist der Artikel Standard C Library gewidmet.
Weitere C-Bibliotheken
Die nachfolgend beschriebenen Bibliotheken sind nicht Teil der Sprachbeschreibung von C. Daher stehen sie nur zur Verfügung, wenn die API des Systems sie anbietet.
- POSIX - Programmierung einer UNIX-Umgebung
- pcre - Perl Compatible Regular Expressions
- Zugriff auf eine MySQL-Datenbank
Algorithmen
Werkzeuge
Bewertung von Sprachmerkmalen
Stärken
- minimalistischer Sprachumfang, der kleinste bekannte C-Compiler besteht aus 3742 Bytes C-Code und kann sich selbst compilieren.
- C-Programme bestehen nur aus Unterprogrammen.
- Das Hauptprogramm ist ein Unterprogramm mit dem speziellen Namen main
- Kontrollstrukturen für strukturierte Programmierung
- Umfangreiche Datenstrukturen (Feldkonstanten, struct, Bitfelder)
- Vorbelegung aller Datenstrukturen mit Konstanten
- Keine symbolischen Konstanten (ersetzt durch Makroprozessor)
- Keine dynamische Speicherverwaltung (ersetzt durch Bibliotheksfunktionen)
- Keine Felder (ersetzt durch Feldkonstanten und Behandlung von Feldern als Zeiger)
- Zeigerarithmetik ermöglicht die effiziente Behandlung von Feldzugriffen, Parametern usw.
- Strings ersetzt durch eingebaute Stringkonstanten und einfache Bibliotheksfunktionen
- Zeiger auf Unterprogramme (Funktionszeiger) in Datenstrukturen speicherbar
- Einfache Variablen nur als Wertparameter, Felder nur als Referenzparameter
- Referenzparameter für einfache Variablen werden durch Zeiger ersetzt.
- Hardwarenahe Programmierung ist möglich, direkter Umgang mit Bits, Bytes, direkter Speicherzugriff und Zeigerarithmetik
- Präprozessor zur Spracherweiterung und bedingten Übersetzung
- Linker (Binder) (C war eine der ersten Sprachen, die das Einbinden von externen vorübersetzten Routinen in der Sprachdefinition berücksichtigt)
- Viele Optimierungen bei Übersetzung möglich
- Ein C-Compiler ist auf nahezu jedem modernen Prozessor vorhanden, sei es ein kleiner 8-Bit-Controller oder ein High-End-64-Bit-Prozessor.
Schwächen
- "Wilde" Zeiger
- Man kann Zeiger auf beliebige Stellen des Speichers richten. Insbesondere zeigen nicht explizit initialisierte Stack-Variablen oft auf beliebige Stellen des Speichers. Die Folge sind schwer zu diagnostizierende Fehler.
- Felder
- C kennt zwar den Datentyp Feld und erlaubt sogar die Definition von Feldern, die mit Konstanten vorbelegt sind. Intern werden Felder jedoch immer als Zeiger verwaltet. Dies bedeutet, dass eine eventuell nötige dynamische Speicherverwaltung von Feldern vom Programmierer implementiert werden muss. Auch die Feldgröße wird beim Zugriff nicht überprüft. Durch Programmierfehler können Speicherbereiche durch illegale Feldzugriffe während der Laufzeit unabsichtlich oder gezielt (Pufferüberlauf) verändert werden.
- Zeichenketten
- C hat keine integrierten Zeichenketten ("Strings"). Statt dessen wird ein Zeichenfeld verwendet, das mit einem Nullzeichen abgeschlossen wird. Die Speicherverwaltung von Zeichenketten muss vom Programmierer vorgenommen werden.
- Speicherverwaltung
- Der Programmierer muss den dynamischen Speicher selbst verwalten. Hierzu stehen in der Regel Bibliotheksfunktionen zur Verfügung.
- Niedriger Abstraktionsgrad
- Portabilitätsprobleme
- C schreibt die Speichergröße verschiedener Typen in der Sprachdefinition nicht vor. Dies ermöglicht die Portierung bestehender Programme auf andere, auch neue Prozessoren. Es ist nur zugesichert, dass ein short int nicht länger sein darf als ein long int. In den 1980er und 1990er Jahren wurden vorwiegend 32-Bit Systeme wie VAX, 68000, i386 eingesetzt. Bei diesen waren Zeiger, int und long alle 32 Bits lang, so dass sich dies als Quasistandard etabliert hat. Dies bereitet Probleme bei der Portierung auf modernere 64-Bit-Architekturen, falls der Programmierer von bestimmten Längen ausgegangen ist.
- Einige weitere Eigenschaften der Sprachdefinition (Ergebnistyp bei Zeigersubtraktion, Ausrichtung (Alignment) von Datentypen) bereiten ebenfalls Probleme, wenn statt der empfohlenen abstrakten Typen (wie ptrdiff_t für Zeigersubtraktionen, size_t für Größen von Speicherbereichen) direkt fundamentale Typen wie int verwendet werden.
- In der Sprachversion C99 sind Datentypen mit expliziten Bit-Längen definiert (int8_t, int16_t, etc.).
Man kann sagen, dass die größte Stärke von C - uneingeschränkte Freiheit des Progammierers mit Zeigern und Speicherstrukturen - gleichzeitig ihre größte Schwäche ist. Da der freizügige Umgang der Programmiersprache mit dem Speicher in kritischen Umgebungen (Banken, Börsen, Versicherungen, usw.) leicht hohe Schäden nach sich ziehen kann, wird hier mittlerweile ernsthaft erwogen, diese Programmiersprache bei neuen Projekten zu verbieten.
Siehe auch
- C++
- Java
- C#
- Objective-C
- GCC
- Zeittafel der Programmiersprachen
- DISTCC
- C-Programmierkurs auf Wikibooks
Literatur
- Jürgen Wolf: C von A bis Z - das umfassende Handbuch, Galileo Computing, ISBN 3-898-42392-1
- Brian W. Kernighan, Dennis Ritchie: Programmieren in C, Hanser Fachbuch, ISBN 3-446-15497-3
- Wolfgang Sommergut: Programmieren in C, DTV-Beck, ISBN 3-423-50158-8
- Byron S. Gottfried: Programmieren in C, McGraw-Hill, ISBN 389028907X
- Robert Klima, Siegfried Selberherr: Programmieren in C, Springer, ISBN 3-211-40514-3
- Helmut Erlenkötter: C - Programmieren von Anfang an, Rowohlt, ISBN 3-499-60074-9
- Joachim Goll, Ulrich Bröckl, Michael Dausmann: C als erste Programmiersprache - Vom Einsteiger zum Profi, Teubner, ISBN 3-519-32999-9
- Andre Willms: C-Programmierung lernen - Anfangen, anwenden, verstehen, Addison-Wesley, ISBN 3-8273-1405-4
- Karlheinz Zeiner: Programmieren lernen mit C, Hanser Fachbuch, ISBN 3-446-21596-4
- Jürgen Wolf: C - Mit einfachen Beispielen programmieren, Markt+Technik, ISBN 3-8272-6503-7
- Henning Mittelbach: Einführung in C, Fachbuchverlag Leipzig, ISBN 3-446-21981-1
- Stefan Heitsiek: Das Einsteigerseminar C, vmi Buch, ISBN 3-8266-7216-X
- Wolfgang Link: C-Programmierung, Franzis, ISBN 3-7723-6200-1
- Ulrich Cuber: C-Programmierung, Econ, ISBN 3-612-28157-7
- Robert Sedgewick: Algorithmen in C, Addison-Wesley, ISBN 3-89319-376-6
Weblinks
- Programming in C
- Dinkumware
- Die FAQ der deutschsprachigen Gruppe news:de.comp.lang.c
- Die FAQ der englischsprachigen Gruppe news:comp.lang.c
- C/C++ Users Journal
- Tutorium, Referenz
- Doku der GLibc, Doku der ANSI-C-Library, Tutorium...
- Die Programmiersprache C kritisch betrachtet
- C von A bis Z (Online-Version des Buches)
- C in 21 Tagen (Online-Version des Buches)
- The GNU C Programming Tutorial