为防止广告,目前nocow只有登录用户能够创建新页面。如要创建页面请先登录/注册(新用户需要等待1个小时才能正常使用该功能)。

C语言

来自NOCOW
(跳转自C)
跳转到: 导航, 搜索

C,是一种通用的、程序式的程序设计语言。具有高效、灵活、功能丰富、表达力强和移植性好等的特点,在程序员中备受青睐。

C语言是由UNIX的研制者丹尼斯·里奇(Dennis Ritchie)和肯·汤普逊(Ken Thompson)于1970年研制出的B语言的基础上发展和完善起来的。C语言可以广泛应用于不同的操作系统,例如UNIXLinuxMS-DOSMicrosoft Windows等。C语言影响了许多後来的程式语言,例如C++JavaC#等。

目录

[编辑] 特色

  • C语言是系统程序语言。流行的操作系统核心部分几乎无一例外的选择了C语言。
  • C语言保留了低级语言的特性,例如C语言允许使用指针来对任意内存做直接修改。
  • C语言使用了预处理机制,使得程序员可以在编译源程序之前对程序结构做出控制。常用的预处理机制包括-{A|zh-cn:宏;zh-tw:巨集}-与编译选择等。

C语言的主要不足是缺乏对真实事物的描述手段。用C语言表达复杂的逻辑系统将会十分困难,而且代码量也明显高于C++语言。同时C语言过度的信赖程序员的做法也一直存在很大争议,是否允许程序员随意修改内存中的任何东西一直都是争论的焦点所在。C语言的不足可以由C语言发展而来的新的编程语言所改进。Cyclone语言拥有提防内存错误的特性。C++和Objective C提供了用于面向对象的编程结构。JavaC#在提供面向对象编程结构的同时,也提供了垃圾收集机制,这使得对内存的管理更加透明与自动化。

在2006年後人们对垃圾收集机制开始发觉并非可行,由於C++的Smart Pointer理念简单而又多数人开始明白及使用,Smart Pointer理念反而特显了Java的垃圾收集机制本身的严重问题,更有人认为Java的垃圾收集机制是制做垃圾的一个主要原因。

[编辑] 主要特性

  • C语言保留了低级语言的特性,例如涉及内存指针
  • C语言透过参数可在函数里传递数值或内存地址。
  • 使用了预处理机制,使得程式里可以通过包含例如宏处理的方式来处理源代码
  • C语言提供了一套标准函数库,这些函数库里提供了十分有用的功能。

但是并不是所有的这些特性都是有效的。例如,前处理通常作为一个独立的程式被处理,这使得前处理的程式并不一定被完全编译。

虽然C是高级语言,但是它同时拥有一些组合语言的特性,对其他的语言来说这是接近低级语言的特点。例如,在C语言里,程式设计师可以对计算机内存进行管理。在许可的情况下,C语言不会对数组的范围进行检查,也就是说即使下标越界,C语言也不会作出错误提示。对内存的管理使得程序设计者可以设计出更快捷、更有效的程序,这对于设备驱动程序来说尤为重要。但是这也使得程式容易产生令人讨厌的「bug」,例如缓冲器溢出错误。然而,这些错误可以由一些工具来找出。

C语言的不足可以由从C语言发展而来的更新的编程语言改进。Cyclone语言的拥有提防对於记忆体错误的特性。C++和Objective C提供了用於面向物件(物件导向)的编程结构。Java和C#增加了面向物件的结构使得对记忆体的管理自动化。

[编辑] 历史

C语言的第一次发展在1969年到1973年之间。C之所以被称为C是因为C语言的很多特性是由一种更早的被称为B语言的编程语言中发展而来的。

到了1973年,C语言已经可以用来编写Unix操作系统的内核。这是第一次用C语言来编写操作系统的内核。丹尼斯·里奇和Brian Kernighan在1978年出版了《C程序设计语言》(The C Programming Language,经常简称为「白皮书」或「K&R」)。

1980年以後,贝尔实验室使得C变得更为广泛的流行,使得C一度成为了操作系统和应用程序编程的首选。甚至到今天,它仍被广泛用於编写操作系统以及作为广泛的计算机教育的语言。2005年4月,C++之父称C++用户超过300万。

1980年代晚期,比雅尼·斯特劳斯特鲁普贝尔实验室为C语言添加了面向对象的特性.这种语言成为了C++。C++现在广泛应用的在Microsoft Windows下运行的商业应用程序的编制,然而C仍然是UNIX世界的热门编程语言,尤其是Linux世界,因为 Linus Torvalds 极力反对 C++。

[编辑] 版本

[编辑] K&R C

C不断的从它的第一版本进行改进。在1978年,Kernighan和里奇的《C程序设计语言》第一版出版。它介绍了下面的有关C语言版本的特性:

  • struct数据类型
  • long int数据类型
  • unsigned int数据类型
  • 把运算符=+改为+=,依次类推。因为=+使得编译器混淆。

在以后的几年里,《C程序设计语言》一直被广泛作为C语言事实上的规范。在这本书中,C语言通常被表述成“K&R C”。(第二版的包括了ANSI C标准)

K&R C通常被作为C编译器所支持的最基本的C语言部分。虽然现在的编译器并不一定都完全遵循ANSI标准,但K&R C作为C语言的最低要求仍然要编程人员掌握。但是无论怎样,现在使用广泛的C语言版本都已经与K&R C相距甚远了,因为这些编译器都使用ANSI C标准。 //....

[编辑] ANSI C和ISO C(1985年)

1989年,C语言被ANSI标准化。(ANSI X3.159-1989)。标准化的一个目的是扩展K&R C。这个标准包括了一些新的特性。在K&R出版后,一些新的特征被“非官方”的加到C语言中。

  • void函数
  • 函数返回structunion类型
  • void *数据类型

在ANSI标准化自己的过程中,一些新的特征被加了进去。ANSI也规定一套了标准函数库。ANSI ISO国际标准化组织)成立 ISO/IEC JTC1/SC22/WG14工作组来规定国际标准的C语言。通过对ANSI标准的少量修改,最终通过了ISO 9899:1990。随后ISO标准被ANSI采纳。

传统C语言到ANSI/ISO标准C语言的改进包括:

  • 增加了真正的标准库
  • 新的预处理命令与特性
  • 函数原型允许在函数申明中指定参数类型
  • 一些新的关键字,包括constvolatilesigned
  • 宽字符、宽字符串与字节多字符
  • 对约定规则、声明和类型检查的许多小改动与澄清


[编辑] ANSI C和ISO C(1995年)

作为对标准的维护与更新,WG14工作小组在1995年对1985年颁布的标准做了两处技术修订(缺陷修复)和一个补充(扩展)。下面是1995年做出的所有修改:

  • 3个新的标准库头文件 iso646.h、wctype.h和wchar.h
  • 几个新的记号与预定义宏,用于对国际化提供更好的支持
  • printf/sprintf函数一系列新的格式代码
  • 大量函数和一些类型与常量,用于多字节字符和宽字节字符


[编辑] C99

在ANSI标准化后,WG14小组继续致力于改进C语言。新的标准很快推出,就是ISO9899:1999(1999年出版)。这个版本就是通常提及的C99。它被ANSI于2000年三月采用。

在C99中包括的特性有:

  • 对编译器限制增加了,比如源程序每行要求至少支持到 4095 字节,变量名函数名的要求支持到 63 字节 (extern 要求支持到 31)
  • 预处理增强了。例如:
    • 支持取参数 #define Macro(...) __VA_ARGS__
    • 使用的时候,参数如果不写,里用 #,## 这样的东西会扩展成空串。(以前会出错的)
    • 支持 // 行注释(这个特性实际上在C89的很多编译器上已经被支持了)
  • 增加了新关键字 restrict, inline, _Complex, _Imaginary, _Bool
    • 支持 long long, long double _Complex, float _Complex 这样的类型
  • 支持 <: :> <% %> %: %:%: ,等等奇怪的符号替代,D&E 里提过这个
  • 支持了不定长的数组。数组的长度就可以用变量了。声明类型的时候呢,就用 int a[*] 这样的写法。不过考虑到效率和实现,这玩意并不是一个新类型。所以就不能用在全局里,或者 struct union 里面,如果你用了这样的东西,goto 语句就受限制了。
  • 变量声明不必放在语句块的开头,for 语句提倡这么写 for(int i=0;i<100;++i) 就是说,int i 的声明放在里面,i 只在 for 里面有效。
  • 当一个类似结构的东西需要临时构造的时候,可以用 (type_name){xx,xx,xx} 这有点像 C++ 的构造函数
  • 初始化结构的时候现在可以这样写:
      struct {int a[3], b;} hehe[] =  { [0].a = {1}, [1].a = 2 };
      struct {int a, b, c, d;} hehe =  { .a = 1, .c = 3, 4, .b = 5}  // 3,4 是对 .c,.d 赋值的
  • 字符串里面,\u 支持 unicode 的字符
  • 支持 16 进制的浮点数的描述
  • 所以 printf scanf 的格式化串多支持了 ll / LL (VC6 里用的 I64) 对应新的 long long 类型。
  • 浮点数的内部数据描述支持了新标准,这个可以用 #pragma 编译器指定
  • 除了已经有的 __line__ __file__ 以外,又支持了一个 __func__ 可以得到当前的函数名
  • 对于非常数的表达式,也允许编译器做化简
  • 修改了对于 / % 处理负数上的定义,比如老的标准里 -22 / 7 = -3, -22 % 7 = -1 而现在 -22 / 7 = -4, -22 % 7 = 6
  • 取消了不写函数返回类型默认就是 int 的规定
  • 允许 struct 定义的最后一个数组写做 [] 不指定其长度描述
  • const const int i; 将被当作 const int i; 处理
  • 增加和修改了一些标准头文件, 比如定义 bool 的 <stdbool.h> 定义一些标准长度的 int 的 <inttypes.h> 定义复数的 <complex.h> 定义宽字符的 <wctype.h> 有点泛型味道的数学函数 <tgmath.h> 跟浮点数有关的 <fenv.h>。<stdarg.h> 里多了一个 va_copy 可以复制 ... 的参数。<time.h> 里多了个 struct tmx 对 struct tm 做了扩展
  • 输入输出对宽字符还有长整数等做了相应的支持

但是各个公司对C99的支持所表现出来的兴趣不同。当GCC和其它一些商业编译器支持C99的大部分特性的时候,微软Borland却似乎对此不感兴趣。

[编辑] 编译器

一般用 gcc 来编译 C 程序。

简单用法: $ gcc -o file file.c

[编辑] 调试器

一般用 gdb 来调试 C 程序。调试前应该使用 -g 开关使 gcc 生成调试信息。 具体用法自行 Google。

[编辑] 编辑器

C 语言程序员一般不用 IDE。 优秀的编辑器有 vimemacs

[编辑] Hello World程序

下面是一个在标准输出设备上输出Hello World的简单程序,这种程序通常作为开始学习编程语言时的第一个程序:

#include <stdio.h>
 
int main(void)
{
    puts("Hello, world!");
    return 0;
}

[编辑] 进一步了解

C语言由函数和变量组成。C的函数就像是Fortran中的子程序和函数。

在C语言中,程序从main开始执行。main函数通过调用和控制其他函数进行工作。例如上面的puts。程序员可以自己写函数,或从库中调用函数。在上面的return 0;使得main返回一个值给调用程序的 shell,0表示程序正确运行。

一个C语言的函数由返回值、函数名、参数列表(或void表示没有返回值)和函数体组成。函数体的语法和其它的复合的语句部分是一样的。

[编辑] 复合语句

C语言中的复合语句(或称语句块)的格式为:

{语句;语句;……}

复合语句可以使得几个语句变成一个语句。

但一般情况下,我们不推荐这样多个语句顺序书写, 因为这样会使其可读性减弱,加大代码维护难度。

[编辑] 条件语句

C语言有三种条件语句形式。两种是if,另一种是switch

两种if包括:

if (表达式)
    语句;

以及

if (表达式)
    语句;
else
    语句;

在条件表达式中,任何非零的值表示条件为真;如果条件不满足,程序将跳过if后面的语句,直接执行if后面的语句。但是如果if后面有else,则当条件不成立时,程序跳到else处执行。ifelse后面的语句可以是另个if语句,这种套叠式的结构,允许更复杂的逻辑控制流程得以实现。在一般情况下,else一定与最接近的if成对,必要时可用括弧{}越过此限制。比较下面两种情况:

if (表达式) if (表达式) {

   if (条件表达式)                if (条件表达式)
       语句;                         语句;
   else                       } else
       语句;                     语句;

switch通常用于对几种有明确值的条件进行控制。它要求的条件值通常是整数或字符。与switch搭配的条件转移是case。使用case后面的标值,控制程序将跳到满足条件的case处一直往下执行,直到语句结束或遇到break。通常可以使用default把其它例外的情况包含进去。如果switch语句中的条件不成立,控制程序将跳到default处执行;如果省略default子句,则直接执行下一语句,这有可能会产生bug,建议不要省去default。switch是可以嵌套的。

switch (<表达式>) {
    case <1> :
        <语句>
        break; // 可以不用,但意思不同
    case <2> :
        <语句>
        break; // 可以不用,但意思不同
    default:
        <语句>
}

[编辑] 循环语句

C语言有三种形式的循环语句:

do 
    <语句>
while (<表达式>);
while (<表达式>) 
    <语句>;
for (<表达式1>; <表达式2>; <表达式3>)
    <语句>;

whiledo中,语句将执行到表达式的值为零时结束。在do...while语句中,循环体将至少被执行一次。这三种循环结构可以互相转化:

for (e1; e2; e3)
    s;

相当于

e1;
while (e2) {
    s;
    e3;
}

当循环条件一直为真时,将产生死循环,除非在循环体内部有跳出循环的语句。

[编辑] 跳转语句

跳转语句包括四种:goto,continue,break和return

goto语句是无条件转移语句:

goto 标记

标记必须在当前函数中定义,使用“标记:”的格式定义。程序将跳到标记处继续执行。由于goto容易产生阅读上的困难,所以应该尽量少用。

continue语句用在循环语句中,作用是结束当前一轮的循环,马上开始下一轮循环。

break语句用在循环语句或switch中,作用是结束当前循环,跳到循环体外继续执行。但是使用break只能跳出一层循环。在要跳出多重循环时,可以使用goto使得程序更为简洁。

当一个函数执行结束后要返回一个值时,使用returnreturn可以跟一个表达式或变量。如果return后面没有值,将退出函数而不返回任何值。

[编辑] 在C99中运算符号

() [] -> . ! ++ -- (cast)  括号、成员、逻辑非、自加、自减、强制转换
++ -- * & ~ ! + - sizeof  单目运算符
* / % 算术运算符
+ -  算术运算符
<< >> 位运算符
< <= > >= 关系运算符
== != 关系运算符号
& 位与
^ 位异或
| 位或
&& 逻辑与
|| 逻辑或
 ?: 条件运算符
= += -= *= /= %= <<= >>= &= |= ^= 赋值运算符
, 顺序运算符

[编辑] 数据类型

[编辑] 基础数据类型

注意:以下是典型的数据位长和范围。但是编译器可能使用不同的数据位长和范围。这取决于使用的编译器。请参考具体的参考手册。

在头文件<limits.h>和<float.h>中说明了基础数据的长度。float,double和long double的范围就是在IEEE 754标准中提及的典型数据。

关键字 位长 范围 printf chars(详见 man 3 printf)
char 1 -128..127 (或演绎成ASCII字元0..255)  %c
unsigned char 1 0..255
signed char 1 -128..127
int 2 or
4
-32768..32767 or
-2147483648..2147483647
 %i, %d
unsigned int 2 or
4
0..65535 or
0..4294967295
 %u
signed int 2 or
4
-32768..32767 or
-2147483648..2147483647
 %i, %d
short int 2 -32768..32767  %hi
unsigned short 2 0..65535  %hu
signed short 2 -32768..32767
long int 4 -2147483648..2147483647  %li, %ld
unsigned long 4 0..4294967295  %lu
signed long 4 -2147483648..2147483647
long long 8 -9223372036854775808..9223372036854775807  %lli
unsigned long long 8 0..18446744073709551615  %llu
float 4 3.4x10-38..3.4x10+38 (7 sf)  %f, %e, %g
double 8 1.7x10-308..1.7x10+308 (15 sf)  %f, %e, %g
long double 8 或以上 编译器相关  %Lf, %Le, %Lg

[编辑] 数组

如果一个变量名后面跟着一个有数字的中括号,这个声明就是数组声明。字符串也是一种数组。它们以ASCII的NUL作为数组的结束。要特别注意的是,方括内的索引值是从0算起的。

例如:

int myvector[100];  /* 从myvector[0]至myvector[99]止共100个元素 */
int a[3][4];
int notfull[3][3] = {{1},{1,2,3},{4,5}};               // (*)
char mystring[80];
char lexicon [10000][300];  /* 共一万个最大长度为300的字符数组。*/
float mymatrix[3][2] = { 2.0, 10.0, 20.0, 123.0, 1.0, 1.0 };

上面最后一个例子创建了一个数组,但也可以把它看成是一个多维数组。注意数组的下标从0开始。这个数组的结构如下:

a[0][0] a[0][1] a[0][2] a[0][3]
a[1][0] a[1][1] a[1][2] a[1][3]
a[2][0] a[2][1] a[2][2] a[2][3]

例子(*)创建了一个3*3的二维数组,初始化时有些元素并未赋值.如下:

1 0 0
1 2 3
4 5 0

为0的位置的数值是随机的.

[编辑] 指针

如果一个变量声明时在前面使用 * 号,表明这个变量是一个指针。换句话说,该变量是一个地址,而 * 则是取内容操作符,意思是取这个内存地址里存储的内容。指针是 C 语言区别于其他同时代高级语言的主要特征之一。

实际上,在 32/64 位的机器上,所有指针、所有数组(包括字符串)、长整形、整形是同一种数据类型。

指针是一把双刃剑,许多操作可以通过指针自然的表达,但是不正确的或者过分的使用指针又会给程序带来大量潜在的错误。

例如:

int * pi;     /* 指向整型数据的指针 */
int * api[3]; /* 由指向整型数据的指针构成的数组,长度为 3 */
char ** argv; /* 指向一个字符指针的指针 */
 
int * a,   b; // a 是 int * 型,b 是 int   型
int * a, * b; // a 是 int * 型,b 是 int * 型
 
void * anything;     // void 指针可以指向任何数据而不需要[[强制类型转换]]
void (*func)(int i); // 函数指针

储存在指针中的地址所指向的数值在程序中可以由 * 读取。例如,在第一个例子中, *pi 是一个整型数据。这叫做解引用一个指针。

另一个运算符 &,叫做取地址运算符,它将返回一个变量、数组或函数的存储地址。因此,下面的例子:

int i, * pi; /* int and pointer to int */
pi = &i;

i*pi 在程序中可以相互交替使用,直到 pi 被改变成指向另一个变量的指针。

[编辑] 字符串

要使用字符串并不需要引用库,但是C标准库确实包含了一些用于对字符串进行操作的函数,使得它们看起来就像字符串而不是数组。使用这些函数需要引用头文件<string.h>


  • strcat(dest, source) - 连接两个字符串,把source加到dest末尾。
  • strchr(s, c) - 在字符串c中找出字符s第一次出现的位置。当没有找到时,返回Null。
  • strcmp(a, b) - 比较字符串ab的大小。如果两个字符串相同,返回0;如果a>b,返回正数;如果a<b,返回负数。
  • strcpy(dest, source) - 把字符串source全拷贝到字符串dest中。
  • strncat(dest, source, n) - 把source中的n个字符追加到dest后面。null后面的值将不会被添加。
  • strncmp(a, b, n) - 比较字符串abn个字符的大小。如果两个字符串相同,返回0;如果a>b,返回正数;如果a<b,返回负数。
  • strncpy(dest, source, n) - 把字符串source拷贝到字符串dest中。(最多拷贝n个)
  • strrchr(s, c) - 在s中查找最后一次出现c的位置。返回这个位置。如果找不到,返回null。

[编辑] 文件输入/输出

在C语言中,输入和输出是经由标准库中的一组函数来实现的。在ANSI/ISO C中,这些函数被定义在头文件<stdio.h>中。

[编辑] 标准输入/输出

有三个标准输入/输出是预定义的:

  • stdin 标准输入
  • stdout 标准输出
  • stderr 输入输出错误

这些定义在运行过程中是自动的打开和关闭的,所以它们并不需要进行显式定义。

下面的这个例子显示了一个过滤器程序(filter program)是怎样构成的。

#include <stdio.h>
 
int main(void)
{
    int c;
    while ((c = getchar()) != EOF) {
        if (an_error_occured) {
            fputs("an error eee occurred", stderr);
            break;
        }
        putchar(c);
    }
}

[编辑] 传递命令行参数/环境变量

在命令行赋予程序的参数将通过在main()函数中定义一个整型参数(int)和一个指向字符指针(字符串)的数组参数(char * argv[])来实现,前者传递命令行参数的个数,后者传递命令行参数内容。第三个参数与第二个类似,用来传递环境变量。习惯上将这三个参数分别命名为argcargvenv。程序文件名被作为第一个命令行参数,argv[argc](注意,不是argv[argc-1])为 NULL。

对于下列程序:

#include <stdio.h>
 
int main(int argc, char * argv[], char * env[])
{
    int i;
 
    // 输出参数
    for(i=0; i<argc; i++)
        printf("%d: %s\n", i, argv[i]);
 
    /* 也可这样输出:
    while (*argv) puts(*argv++);
    */
 
    // 输出环境变量
    while (*env) puts(*env++);
 
    return 0;
}

输入命令(以 UNIX 环境 bash 为例。假设该程序为 a.c):

$ gcc -o a a.c # 编译
$ export abc=something # 设置一个环境变量
$ ./a one two three

则会得到下面的输出结果:

0: ./a
1: one
2: two
3: three
abc=something
... # 环境变量会有很多,这里略去

[编辑] 标准库

以下列出由C语言提供的标准函数库,函数库通过#include进行引用。

在C89标准中:

  • <assert.h>
  • <ctype.h>
  • <errno.h>
  • <float.h>
  • <limits.h>
  • <locale.h>
  • <math.h>
  • <setjmp.h>
  • <signal.h>
  • <stdarg.h>
  • <stddef.h>
  • <stdio.h>
  • <stdlib.h>
  • <string.h>
  • <time.h>

在95年的修正版中

  • <iso646.h>
  • <wchar.h>
  • <wctype.h>

在C99中增加了六个函数库

  • <complex.h>
  • <fenv.h>
  • <inttypes.h>
  • <stdbool.h>
  • <stdint.h>
  • <tgmath.h>

[编辑] 保留关键字

char short int unsigned
long float double struct
union void enum signed
const volatile typedef auto
register static extern break
case continue default do
else for goto if
return switch while sizeof

[编辑] 参考文献


[编辑] 外部链接

[编辑] 参见

个人工具