作者: Daniel Barlow
译者: 陈建勋(Frank J.S. Chen)
v1.17, 28 February 1996
_________________________________________________________________
本文阐述安装GNU C编译器和程式馆的方法,同时概观地说明程式的编译、连结、
执行、除错的过程以及可能面临的诸多问题。写作的参考资料泰半来自於Mitch
DSouza先生所收集的GCC-FAQ;而另一个来源是ELF-HOWTO。此份HOWTO可以说已
代替了GCC-FAQ,而且即将要永久替代ELF-HOWTO了。此乃GCC-HOWTO第一份公开发
行的版本(不须理会版本序号;那是RCS的杰作),有任何指正与建议的,本人都
很欢迎。
_________________________________________________________________
1. 行远必自迩!
* 1.1 译者的话
* 1.2 动与静
* 1.3 作者的私语
* 1.4 印刷与排版
2. 东东在哪儿?
* 2.1 GCC-HOWTO在哪儿?
* 2.2 GCC相关的资料又在哪儿?
* 2.3 GCC
* 2.4 C程式馆与标头档
* 2.5 有关联的工具 (as, ld, ar, strings etc)
3. GCC的安装与GCC的设定
* 3.1 GCC的版本
* 3.2 东东装好後都到哪儿去了?
* 3.3 标头档ㄋㄟ?标头档ㄋㄟ?
* 3.4 建立交叉编译器(Building cross compilers)
4. 移植程式与编译程式
* 4.1 gcc自行定义的符号
* 4.2 线上求助说明
* 4.3 移植能力
5. 除错与监管
* 5.1 预防重於治疗(lint)
* 5.2 除错
* 5.3 监管
6. 连结
* 6.1 共享程式库 vs静态程式库
* 6.2 终极审判(‘sin() 在哪个程式库里?’)
* 6.3 X档案?
* 6.4 建立你自己的程式库
7. 动态载入
* 7.1 基本概念
* 7.2 错误讯息
* 7.3 控制动态载入器的运作
* 7.4 以动态载入撰写程式
8. 与发展人士联络
* 8.1 Bug报表
* 8.2 协助发展
9. 结语
* 9.1 名人榜
* 9.2 翻译
* 9.3 欢迎任何的回馈
* 9.4 合法的行迳规定
10. 索引
_________________________________________________________________
1. 行远必自迩!
1.1 译者的话
* 这份译文为Linux document projects(LDP)中文翻译计画系列之一。目前之
网址为 [1]http://www.linux.org.tw/CLDP/,欢迎各位网友踊跃投入此一计
画。
* 我并没有完全按照原文逐字翻译。为了力求译文通畅可读,我会稍稍的重组
一部份的文字,加油添醋,或是精简原文;这样做的话,可以弥补中英文间
语法结构的差异性,且语气可以贯通无碍。
* 一些关键字与专业词汇等,会附加上原文单字。
* 遇有转译困难,唯原文常见的字汇如bugs、shadow password、padding
、image之类的,则保留原文不变。若阁下对这些字汇有适当译辞的,请不吝
指教。
* 内文中若遇有""[译者注:**]""之标记,则为本人额外之注解。
* 对这篇译文有任何建议与疑问的,请email至
[email protected]。
* WWW Home Page: [2]http://linux.ntcic.edu.tw/~jsfrank/。
* 此中译文件之翻译权已取得英籍之原作者Daniel Barlow 先生之同意;另,
陈建勋先生保有此份中译版文件所有的权利,你可以任意的拷贝,以各种媒
体散布这份中译文件,唯此节补充说明需原封不动附上,且不可任意更动译
文。
* v0.1版的译文相当粗糙,连文句的语法结构都嫌太过於松散,v0.2版针对中
文的用字习惯来修正,并将上一版译的不妥当的地方修正过来,例如either
这个字,英国人常把either当名词用,指两者中任意一个;这份HOWTO就充份
反应出这个用字习性,跟美语有基本上的差异。
* 文中有几句话没有译出来,一方面是看不懂,另方面是直译也译不出来,所
以只好保留原文了,要是阁下有新的领悟的,无论如何请告诉我。
* v0.1版翻译起始日期为:11/7/97;截止日期为:11/19/97。
* v0.2版修正起始日期:5/13/98;截止日期为:6/3/98。
1.2 动与静
目前Linux的发展正波涛汹涌的进行著。简单一点讲,Linux有两种执行档的格式
可用,取决於你的系统是怎麽整合起来的;你的Linux应该是其中一种吧!阅读这
份文件,可以帮助你□清执行档的类别。
要如何区别呢?执行公用程式‘file’(例如,file /bin/bash)就对了。
就ELF的程式而言,萤幕上显示出来的讯息会含有ELF的字眼;如果说是a.out的,
讯息内会箝有 Linux/i386的字样。
ELF与a.out格式的差异之处会在後续的章节中讨论(很广泛喔!)。ELF是比较新
的格式,一般而言,接受的程度较佳。
1.3 作者的私语
版权说明与合法的行迳规定,就摆在这份文件的尾端。除此之外,我还有一些不
得不提醒你的话要讲。就算你□著没事干,也不要在Usenet上丢一些呆瓜问的问
题;还有,不要老以为自己C语言的功力深厚,专门发表一些不是bugs的bugs出来
丢人现眼,这不就等於告诉别人你不学无术,在关老爷面前耍大刀了吗?所以说
自以为是的英雄主义是得不偿失的。
1.4 印刷与排版
如果你现在读的是Postscript、dvi或是html格式,那麽你所看到的字型变化就会
比只读纯文字格式的人多一些。特别是档案名称、命令、命令的输出与摘录出来
的原始码等,统统都是打字机的字型。这样做的话,对於某些需要强调的‘变数
’还有那些没有固定结果的□例而言,就可以达到强调的效果了。
读这份文件的同时,你也会得到一套蛮有用的索引。假若是dvi、 postscript之
类的版本,索引的数字就是章节(section)的编号;如果是HTML的话,这些数字会
按顺序排列,你可以用滑鼠左键去连结相对的索引内容;如果你看的是纯文字版
本的话, 数字就只是数字,没别的含意;建议你赶快升级为妙哩!
我用的shell是Bourne shell(不是C shell),举的例子自然是Bourne shell的
语法。如果你用的是C shell的话,设定环境变数的语法会像下面这样:
% setenv FOO bar
要是用Bourne shell的话,我会这样子写:
$ FOO=bar; export FOO
如果提示符号显示的是井字符号#而不是钱字符号 $的话,很有可能这个命令是只
适用於root而已。当然啦,要是你试了这些□例,结果弄得你的系统发生灾变,
我可是一点责任也不会负的喔!祝好运!:-)
11/8/97译. 5/13/98修订
2. 东东在哪儿?
2.1 GCC-HOWTO在哪儿?
这份文件是Linux HOWTO系列之一,换句话说,你可以在所有存放Linux HOWTO文
件的网站上面找到她的芳踪,例如
[3]http://sunsite.unc.edu/pub/linux/docs/HOWTO/。HTML的版本(可能会是较
新的版本)可以从
[4]http://ftp.linux.org.uk/~barlow/howto/gcc-howto.html上面抓下来。
2.2 GCC相关的资料又在哪儿?
标准的gcc说明文件是随附在发行的原始码(source distribution)内(往下看就
有了!),里头有textinfo与.info两种档案。要是你的网路连接速率够快,或是
有一片cdrom,不然,有高度的耐心也成,你可以自己把它untar,然後再把相对
应的位元一一拷贝到/usr/info的目录底下。假如你的条件与上述的不符,不妨到
[5]tsx-11站上去参观参观。不过,我想,没有必要老是惦记著最新的版本吧!
libc的文件说明有两种来源。一种是GNU libc,以.info的格式储存,除了stdio
之外,其馀Linux libc的说明都相当的详尽精确。另一种可以在Linux的archive
[6]manpages上找到系统呼叫(system call)(第2节)与libc函数(function)
(第3节)的文件说明。
2.3 GCC
解答有二:
(a)你可以在 [7]ftp://tsx-11.mit.edu:/pub/linux/packages/GCC/的网站上找
到 正式的Linux GCC发行系统(distribution),而且是已经编译好的可执行档。
当我在写这份文件时,2.7.2(gcc-2.7.2.bin.tar.gz)是最新的版本。
(b)自由软体基金会(Free Software Foundation)所发布的GCC最新原始码可以
从网站 [8]GNU archives上取得。没有必要非得与上述的版本一致才行,不过这
个版本的确是目前最新的。Linux GCC的维护网友(maintainers)让你可以很轻松
的自行编译这个最新的版本。configure命令稿(script)会帮你自动设定好所有该
做的事情。建议你有空不妨到 [9]tsx-11看看,说不定会有修正的版本是你会想
要用的。
如果想要编写出一些有用的软体(不是我罗唆,还是有不少没啥用途的软体在网
路上四处流窜。),下面这一小节所谈的也是你需要的:
2.4 C程式馆与标头档
该选哪一套程式馆是取决於(i)你的系统是ELF的或是a.out的;(ii)你希望你的系
统变成哪一种?如果你是从libc 4升级到libc 5,那麽给你一个良心的建议,先
去看看ELF-HOWTO再说。你一定会问,在ELF文件的哪儿呢?嘿!嘿!不偏不倚,
就差不多跟这份文件相同的位置。网站 [10]tsx-11上面可以找到你想要的。
libc-5.2.18.bin.tar.gz
--- ELF共享程式馆(ELF shared library images),静态程式馆
(static libraries)与标头档(针对C语言与数学程式馆)。
libc-5.2.18.tar.gz
---libc-5.2.18.bin.tar.gz的原始码。这个档案你也需要,因为.bin.套
件(package)含有必需的标头档。如果此时你正犹豫不决,不晓得是老身
亲自下海,动手编译C程式库比较好;还是直接用人家编译好的二进位
档(binaries)就可以了。有这种困扰的人,来,看我的嘴形:用人家编译
好的二进位档不就解决了嘛!只有在你想要NYS或是shadow password的情
况下,才需要自己的手来推动摇篮。
libc-4.7.5.bin.tar.gz
--- 这个档案是a.out的共享程式库(shared library images)与静态程式
库,用途是为了与前述的libc 5套件共存共荣而设计的,不过除非你想要
继续使用a.out的程式或是继续发展a.out的程式,不然的话,是不需要它
的。
2.5 有关联的工具 (as, ld, ar, strings etc)
到目前为止,与之前所谈的都一样,从网站 [11]tsx-11上,就可以找到这些工具
程式。目前的版本是binutils-2.6.0.2.bin.tar.gz。
需要注意的是binutils只适用於ELF,而且目前libc的版本也都是属於ELF的;当
然啦,习惯a.out的人如果有个ELF的libc与a.out的libc联合起来一起使用,这对
他们来讲是再好不过的美事了。不可否认的,C程式馆的发展正以坚决的脚步迈
向ELF的格式,除非你真的有很好的理由,需要a.out的东东,不然啊,大家都会
鼓励你勇於突破,趁早加入锐不可挡的大潮流。
11/9/97译
3. GCC的安装与GCC的设定
3.1 GCC的版本
在shell的提示符号下键入gcc -v,萤幕上就会显示出你目前正在使用的GCC的版
本。同时这也是一个相当可靠的方法,可以确定你现在所用的是ELF或是a.out。
在我的系统上,执行gcc -v的结果是:
$ gcc -v
Reading specs from /usr/lib/gcc-lib/i486-box-linux/2.7.2/specs
gcc version 2.7.2
上面的讯息指出了几件重要的事情:
* i486 这是指明你现在正在用的gcc是为了486的微处理器而写的---你的电脑
可能是386或是586。这3种微处理器的晶片所编译而成的程式码,彼此间是可
以相容使用的。差别之处是486的程式码在某些地方有加上padding的功能,
所以可以在486上面跑得比较快。这对386的机器而言,执行程式的效能并不
会有什麽不良的影响,只不过真的会让程式码变得稍稍的大了一些。
* box 这可以说一点也不重要;不过也可能另有所指(像是slackware或者
是debian),或者根本什麽也不是(所以罗!完整的目录名称是i486-linux
)。假如你是实务派的佼佼者,亲自动手建立属於自己的gcc,那麽你可以在
建立的过程中设定这一项,以装点门面。就像我做的一样:-)。
* linux 其实这是指linuxelf或是linuxaout。这一项会令人引起不必要的困惑
,究竟是指哪一种会根据你所用的版本而异。
+ linux 意指ELF若版本序号是2.7.0.(或是更新的版本);否则的话,
就是a.out的了。
+ linuxaout 意指a.out的格式。当linux的定义从a.out更换到ELF时
,linuxaout就会顺水推舟,摇身一变,成了一个目标物。因此,你不
会看到任何版本新於2.7.0.的gcc有linuxaout的。
+ linuxelf 已经过时了。通常这是指2.6.3版的gcc,而且这个版本也可
以用来产生ELF的可执行档。要注意的是,gcc 2.6.3版在产生ELF程式
码时会有bugs,所以如果你目前用的恰好是这个版本,建议你赶快升级
。
* 2.7.2 版本的序号。
所以,总结起来,我有2.7.2版的gcc,可以产生ELF格式的程式码。就这麽简单,
惊讶吧!eh?
3.2 东东装好後都到哪儿去了?
如果安装gcc时没有仔细的看著萤幕,或者你是从一个完整的发行系统里把gcc单
独抓出来安装的话,那麽也许你会想知道到底这些东东装好後是住在整个档案系
统的那些地方。几个重点如下:
* /usr/lib/gcc-lib/target/version/ (与子目录)大部份的编译器就是住在
这个地方的。在这儿有可执行的程式,实际在做编译的工作;另外,还有一
些特定版本的程式库与标头档等也会储存在此。
* /usr/bin/gcc 指的是编译器的驱动程式---也就是你实际在命令列(command
line)上执行的程式。这个目录可供各种版本的gcc使用,只要你用不同的编
译器目录(如上所述)来安装就可以了。要知道内定的版本是那一个,
在shell提示符号下打gcc -v。要是想强迫执行某个版本,就换打gcc -V
version。例如:
# gcc -v
Reading specs from /usr/lib/gcc-lib/i486-box-linux/2.7.2/specs
gcc version 2.7.2
# gcc -V 2.6.3 -v
Reading specs from /usr/lib/gcc-lib/i486-box-linux/2.6.3/specs
gcc driver version 2.7.2 executing gcc version 2.6.3
* /usr/target/(bin|lib|include)/ 如果你装了数种的目标物件,例如a.out
与elf,或是某一种的交叉编译器(cross-compiler)等等,那些属於非主流目
标物件(non-native target(s))的程式库,binutils(as、ld等等)工具
与标头档等都可以在这儿找到。即使你只安装了一种gcc,还是可以在这儿找
到这些原本就是替它们准备的东东。如果不是在这儿,那麽就应该是
在/usr/(bin|lib|include)了。
* /lib/,/usr/lib 与其它的目录等都是主流系统(native-system)的程式馆
目录。许多的应用程式都会用到/lib/cpp,因此你也需要它---作法上,不是
从/usr/lib/gcc-lib/target/version/ 目录里拷贝,就是弄个符号连结
(symlink)指向那儿。 [译者注:所谓的native,是指目前你的系统是
以a.out或elf的格式为主,或者内定的gcc是哪一种版本等等。native的意思
是‘本土的’、‘本国的’与‘天生的’……等等;当你拿到一片CD-ROM重
头至尾将Linux安装完成,让Linux出生,成为你个人特色浓厚的作业平台後
,如果再加装一些不一样的目标物件,自然就有‘本土’与‘外省’( 无关
政治),‘本国’与‘外国’、‘天生’与‘人为’等等的区别,同时也含
有内定(default)的意思在。假若再附加上你个人的价值观判断和喜好,我
想用主流(native)与非主流(non-native)来翻译应该还算恰当。]
3.3 标头档ㄋㄟ?标头档ㄋㄟ?
假如把你自行安装在/usr/local/include目录底下的标头档排除在外的话
,Linux还有另外3种主要的标头档:
* /usr/include/与其子目录底下的标头档,大部份都是由H.J.Lu发展的libc套
件(libc binary package)所提供的。我会只说‘大部份’的原因,是因为你
可能有其它来源的标头档(像是curses与dbm程式库等等)摆在这儿;尤其是
,如果你现在用的是最新的libc发行系统的话(新版本不像旧版那样,已经
不再支援curses或dbm了。),那东东之多是人人为之咋舌的! [译者
注:libc binary package意指以二进位形式(machine code)储存之套件,并
非原始码(text),若要以中文全称译出,则成‘libc二进位档套件’,似
有聱牙之嫌,故略去binary,以libc套件通称。]
* 在核心原始码的发行系统内(kernel source distribution)
,/usr/include/linux 与 /usr/include/asm (里头有这些档案
: 与 )应该有符号连结(symbolic links)可以连
结至目录linux/include/linux 与 linux/include/asm。如果你有鸿鹄之志
的话,安装这些东东後,就不应该只是拿来编译核心(kernel)而已。 把原
始码解压缩(unpacking)後,可能你也会发现,需要在核心的目录
(kernel directory)底下做make config的动作。很多的档案都会依
赖的帮忙,可是这个档案却有可能因版本不同而不存在
。若干核心版本里,asm就只是它自己的一个符号连结,仅仅是在make
config时才建立出来而已。 [译者注:原文提及autoconf.h时是‘Many
files depend on ,which otherwise may not exist,*
’。此处之otherwise之词性应为形容词(adj),指‘另一情况’、‘另一种
’、‘不同的’之意,将原文形容词子句拆开来应为:(i) Many files
depend on . (ii) of other
condition may not exist. 与下一句互相比对,此处应同指在不同版本之情
况下。] 所以,当你在目录/usr/src/linux底下,解开核心的程式码时,就
照著下面指示的做吧!
$ cd /usr/src/linux
$ su
# make config
(回答接下来的问题。通常回答得正不正确并不重要,除非你打算继续□造核心。)
# cd /usr/include
# ln -s ../src/linux/include/linux .
# ln -s ../src/linux/include/asm .
* 诸如、、、 与之类
的档案,会随著不同的编译器版本而异,属於你‘个人的’档案,可以在
/usr/lib/gcc-lib/i486-box-linux/2.7.2/include/与其它相类似(相同)
的目录名称的地方找到。 11/11/97译 5/14/98修正
3.4 建立交叉编译器(Building cross compilers)
将Linux当作标的作业平台(target platform)
假设你已经拿到gcc的原始码,通常你只要依循INSTALL档的指示便可完成一切的
设定。 make後面再接configure --target=i486-linux --host=XXX on
platform XXX,就能帮你变把戏了。要注意的是,你会需要Linux还有核心的标头
档;同时也需要建立交叉组译器(cross assembler)与交叉连结器(cross
linker),来源是 [12]ftp://tsx-11.mit.edu/pub/linux/packages/GCC/。
Linux当成原始作业平台(source platform)而MSDOS作为标的作业平台
Ugh。很明显的,这个大概需要用到套件“emx”或是延伸套件“go”。请自行去
[13]ftp://sunsite.unc.edu/pub/Linux/devel/msdos看看。我并没有测试过这些
个东西,所以没有办法保证什麽。
4. 移植程式与编译程式
4.1 gcc自行定义的符号
只要执行gcc时,附加 -v这个参数,就能找出你所用的这版gcc,自动帮你定义了
什麽符号。例如,我的机器看起来会像这样:
$ echo main(){printf(""hello world
"");} | gcc -E -v -
Reading specs from /usr/lib/gcc-lib/i486-box-linux/2.7.2/specs
gcc version 2.7.2
/usr/lib/gcc-lib/i486-box-linux/2.7.2/cpp -lang-c -v -undef
-D__GNUC__=2 -D__GNUC_MINOR__=7 -D__ELF__ -Dunix -Di386 -Dlinux
-D__ELF__ -D__unix__ -D__i386__ -D__linux__ -D__unix -D__i386
-D__linux -Asystem(unix) -Asystem(posix) -Acpu(i386)
-Amachine(i386) -D__i486__ -
假若你正在写的程式码会用到一些Linux独有的特性,那麽把那些无法移植的程式
码,以条件式编译的前置命令封括起来,可是个不错的主意呢!如下所示∶
#ifdef __linux__
/* ... funky stuff ... */
#endif /* linux */
用__linux__就可以达成目的;看仔细一点,不是linux喔。尽管linux也有定义,
毕竟,这个仍然不是POSIX的标准。
4.2 线上求助说明
gcc编译器参数的说明文件是gcc info page(在Emacs内,按下C-h i,然後选
‘gcc’的选项)。要是弄不出来,不是卖你CD-ROM的人没把这个东东压给你,不
然就是你现在用的是旧版的。遇到这种情况,最好的方法是移动尊臀到archive
[14]ftp://prep.ai.mit.edu/pub/gnu或是它的mirrors站台,去把gcc的原始档案
抓回家,重新烹饪一番。
gcc manual page(gcc.1) 可以说是已经过时了,要是你吃饱了撑著没事干硬是
想看,它就会告诉你说别无聊了。
旗正飘飘
在命令列上执行gcc时,只要在它的屁股後面加上-On的选项,就能让gcc乖乖的替
你生出最佳编码的机器码。这里的n是一个可有可无的小整数,不同版本的gcc
,n的意义与其正确的功效都不一样,不过,典型的□围是从0(不要鸡婆,我不
要最佳编码。)变化到2(最佳编码要多一点。),再升级到3(最佳编码要再多
一点,多一点)。
gcc在其内部会将这些数字转译成一系列的-f与-m的选项。执行gcc时带上旗号-v
与-Q,你就能很清楚的看出每一种等级的-O是对应到那些选项。好比说,就-O2来
讲,我的gcc告诉会我说:
enabled: -fdefer-pop -fcse-follow-jumps -fcse-skip-blocks
-fexpensive-optimizations
-fthread-jumps -fpeephole -fforce-mem -ffunction-cse -finline
-fcaller-saves -fpcc-struct-return -frerun-cse-after-loop
-fcommon -fgnu-linker -m80387 -mhard-float -mno-soft-float
-mno-386 -m486 -mieee-fp -mfp-ret-in-387
要是你用的最佳编码等级高於你的编译器所能支援的(e.g. -O6),那麽它的效
果就跟你用你的编译器所能提供的最高等级的效果是一样的。说实在的,发行出
去的gcc程式码,用在编译时竟是如此处理这等问题,真的不是什麽好的构想。日
後若是有更进步的最佳编码方法具体整合到新的版本里,而你(或是你的users)
还是试著这样做的话,可能就会发现gcc会中断你的程式了。
从gcc 2.7.0升级到2.7.2的users应该注意一点,使用-O2时会有一个bug。更糟糕
的是,强度折减参数(strength reduction)居然没有用!要是你喜欢重新编
译gcc的话,是有那麽一个修正的版本可以更正这项错误;不然的话,一定要确定
每次编译时都有加上-fno-strength-reduce喔!
11/12/97译
有个性的微处理器
有一些-m的旗号十分有用处,但是却无法藉由各种等级的-O打开来使用。这之中
最重要的有是-m386和-m486这两种,用来告诉gcc该把正在编译的程式码视作专
为386或是486机器所写的。不论是用哪一种-m来编译程式码,都可以在彼此的机
器上执行,-m486编译出来的码会比较大,不过拿来在386的机器上跑也不会比较
慢就是了。
目前尚无-mpentium或是-m586的旗号。Linus建议我们可以用-m486
-malign-loops=2 -malign-jumps=2 -malign-functions=2来得到最佳编码的486
程式码,这样做正好就可以避免alignment(Pentium并不需要)有过大的gaps发
生。Michael Meissner说:
我的第六感告诉我,-mno-strength-reduce(嘿!要晓得我可不是在谈强度折
减参数的bug呀,那已经是另外一个争论的战场了。)一样也可以在x86的机器
上产生较快的程式码,这是因为x86的机器对暂存器有著不可磨灭的□渴在,
而且GCCs method of grouping registers into spill registers vs.
other registers doesnt help either。传统上,强度折减的结果会使得编
译器去利用加法暂存器以加法运算来取代乘法运算。事实上,我在怀
疑-fcaller-saves可能也只是个漏洞也说不定。
而我的第七感则再度的告诉我说,-fomit-frame-pointer可能会也可能不会有
任何的赚头。从这点来看,就是意谓著有另一个暂存器可以用来处理记忆体分
配的问题。另方面,若纯粹从x86的机器在转换它的指令集成为机器码的方法
上来看,便意谓著堆叠所用到的记忆体空间要比frame所用到的还要来得多;
换句话说,Icache对程式码而言并没有实质上的帮助,若是阁下用
了-fomit-frame-pointer的话,同时也是告诉编译器在每次呼叫函数之後,就
必须修正堆叠的指标;然而,就frame来讲,若呼叫的次数不多的话,则允许
堆叠暂时堆积起来。
有关这方面主题的最後一段话仍是来自於Linus:
要注意的是,如果你想要得到最佳状况的执行效能,可千万别相信我的话。无
论如何,一定要进行测试。gcc编译器还有许多的参数可用,其中可能就有一
种最特别的组合,可以给你最佳编码的结果。
11/14/97译 5/15/98修正
Internal compiler error: cc1 got fatal signal 11
Signal 11是指 SIGSEGV,或者 ‘segmentation violation’。通常这是指
说gcc对自己所用的指标感到困惑,而且还尝试著把资料写入不属於它的记忆体里
。所以,这可能是一个gcc的bug。 然而,大体而言,gcc是一支经过严密测试且
可靠度良好的软体佳作。它也用了大量复杂的资料结构与惊人的指标数量。简言
之,若是要评选本世纪最挑惕与最一丝不□的RAM测试程式,gcc绝对可以一摘后
冠。假如你无法重新复制这只bug---当你重新开始编译时,错误的讯息并没有一
直出现在同一个地方---那几乎可以确定,是你的硬体本身有问题(CPU,记忆体,主
机板或是快取记忆体).千万不要因为你的电脑可以通过开机程序的测试、或
是Windows可以跑得很顺、或者其它什麽的,就回过头来大肆宣传说这是gcc的一
个bug;你所做的这些测试动作,通常没有什麽实际上的价值,这是很合理的结论
。另外,也不要因为编译核心时,总是停留在‘make zImage’的阶段,就要大骂
这是gcc的bug---当然它会停在那儿啊!做‘make zImage’时,需要编译的档案
可能就超过200档案;我们正在研拟一个替代的方案。
如果你可以重覆产生这个bug,而且(最好是这样啦!)可以写一个短小的程式来
展示这只bug的话,你就可以把它做成bug报告,然後email给FSF,或者
是linux-gcc通信论坛。你可以去参考gcc的说明文件,看看有什麽详细的资讯,是
他们所需要的。
4.3 移植能力
据报,近日来许多正面的消息指出,若是有某件东东到现在都还没移植到Linux上
去,那麽可以肯定的是,它一定一点价值也没有。:-)
嗯!正经一点。一般而言,原始码只需要做一些局部的修改,就可以克服Linux
100%与POSIX相容的特质。如果你做了任何的修改,而将此部份传回给原作者,会
是很有建设性的举动。这样日後就只需要用到‘make’,就能得到一个可执行的
档案了。
BSD教徒 (有 bsd_ioctl、daemon 与 )
编译程式时,可以配合-I/usr/include/bsd与连结-lbsd的程式库。(例如:在你
的Makefile档内,把-I/usr/include/bsd加到CFLAGS那一行;把-lbsd加
到LDFLAGS那一行)。如果你真的那麽想要BSD型态的信号行为,也不需要再加
上-D__USE_BSD_SIGNAL了。那是因为当你用了-I/usr/include/bsd与含括了标头
档之後,make时就会自动加入了。
失落的封印(SIGBUS, SIGEMT, SIGIOT, SIGTRAP, SIGSYS etc)
Linux与POSIX是完全相容的。不过,有些信号并不是POSIX定义的---ISO/IEC
9945-1:1990 (IEEE Std 1003.1-1990), paragraph B.3.3.1.1 sez:
“在POSIX.1中省略了SIGBUS、SIGEMT、SIGIOT、SIGTRAP与SIGSYS信号,那是
因为它们的行为与实作的方式息息相关,而且也无法进行适当的分类。确认实
作方式後,便可以发送这些信号,可是必须以文件说明它们是在什麽样的环境
底下发送出来的,以及指出任何与它们的发展相关的限制。”
想要修正这个问题,最简单也是最笨的方法就是用SIGUNUSED重新定义这些信号。
正确的方法应该是以条件式的编译#ifdef来处理这些问题才对:
#ifdef SIGSYS
/* ... non-posix SIGSYS code here .... */
#endif
11/15/97译 5/22/98修正
K & R
gcc是一个与ANSI相容的编译器;奇怪的是,目前大多数的程式码都不符合ANSI所
定的标准。如果你热爱ANSI,喜欢用ANSI提供的标准来撰写C程式,似乎除了加
上-traditional的旗号之外,就没有其它什麽可以多谈的了。There is a
certain amount of finer-grained control over which varieties of brain
damage to emulate;请自行查阅gcc info page。
要注意的是,尽管你用了-traditional来改变语言的特性,它的效果也仅局限
於gcc所能够接受的□围。例如, -traditional会打开-fwritable-strings,使得
字串常数移至资料记忆体空间内(从程式码记忆体空间移出来,这个地方是不能任
意写入的)。这样做会让程式码的记忆体空间无形中增加的。
前置处理器的符号卯上函数原型宣告
最常见的问题是,如众所皆知,Linux中有许多常用的函数都定义成巨集存放在标
头档内,此时若有相似的函数原型宣告出现在程式码内,前置处理器会拒绝进行
语法分析的前置作业。常见的有atoi()与atol()。
sprintf()
在大部份的Unix系统上,sprintf(string, fmt, ...)传回的是string的指标,然
而,这方面Linux(遵循ANSI)传回的却是放入string内的字元数目.进行移植时
,尤其是针对SunOS,需有警觉的心。
fcntl 与相关的函数;FD_*家族的定义到底摆在哪里?
就在里头。 为了真正的原型宣告,当你用了fcntl,可能你也想含
括标头档进来。
一般而言,函数的manual page会在SYNOPSIS章节内列出需要的标头档。
select()的计时---程式执行时会处於忙碌-等待的状态
很久很久以前,,select()的计时参数只有唯读的性而已。即使到了最近
,manual pages仍然有下面这段的警告:
select()应该是藉由修正时间的数值(如果有的话),再传回自原始计时开始
後所剩馀的时间。未来的版本可能会使这项功能实现。因此,就目前而言,若
以为呼叫select()之後,计时指标仍然不会被修正过,可是一种非常不明智的
想法喔!
未来就在我们的眼前了!至少,在这儿你绝对可以看到。函数select()传回的,
是扣除等待尚未到达的资料所耗费的时间後,其剩馀的时间数值。如果在计时结
束时,都没有资料传送进来,计时引数便会设为0;如果接著还有任何
的select(),以同样的计时structure来呼叫,那麽select()便会立刻结束。
若要修正这项问题,只要每次呼叫select()前,都把计时数值放到计时
structure内,就没有问题了。把下面的程式码,
struct timeval timeout;
timeout.tv_sec = 1; timeout.tv_usec = 0;
while (some_condition)
select(n,readfds,writefds,exceptfds,&timeout);
改成,
struct timeval timeout;
while (some_condition) {
timeout.tv_sec = 1; timeout.tv_usec = 0;
select(n,readfds,writefds,exceptfds,&timeout);
}
这个问题,在有些版本的Mosaic里是相当著名的,只要一次的等待,Mosaic就挂
在那里了。Mosaic的萤幕右上角,是不是有个圆圆的、会旋转的地球动画。那颗
球转得愈快,就表示资料从网路上传送过来的速率愈慢!
产生中断的系统呼叫
特徵:
当一支程式以Ctrl-Z中止、然後再重新执行时□或者是其它可以产生Ctrl-C中断
信号的情况,如子程序的终结等□系统就会抱怨说""interrupted system call""或
是""write: unknown error"",或者诸如此类的讯息。
问题点:
POSIX的系统检查信号的次数,比起一些旧版的Unix是要多那麽一点。如果
是Linux,可能就会执行signal handlers了□
* 非同步地(计时器的滴答声)
* 系统呼叫的传回值
* 在下列系统呼叫的执行期间∶ select(), pause(), connect(),accept(),
read() on terminals, sockets, pipes or files in /proc, write() on
terminals, sockets, pipes or the line printer, open() on FIFOs,
PTYs or serial lines,ioctl() on terminals, fcntl() with command
F_SETLKW, wait4(), syslog(), any TCP or NFS operations.
就其它的作业系统而言,你需要的可能就是下面这些系统呼叫了: creat(),
close(), getmsg(), putmsg(), msgrcv(), msgsnd(), recv(), send(),
wait(), waitpid(), wait3(), tcdrain(), sigpause(), semop() to this
list.
在系统呼叫期间,若有一信号(那支程式本身应准备好handler因应了)产生
,handler就会被呼叫。当handler将控制权转移回系统呼叫时,它会侦测出它已
经产生中断,而且传回值会立刻设定成-1,而errno设定成EINTR。程式并没有想
到会发生这种事,所以就挂了。
有两种修正的方法可以选择:
(1) 对每个你自行安装的signal handler,都须在sigaction的旗号加
上SA_RESTART。例如,把下列的程式,
signal (sig_nr, my_signal_handler);
改成,
signal (sig_nr, my_signal_handler);
{ struct sigaction sa;
sigaction (sig_nr, (struct sigaction *)0, &sa);
#ifdef SA_RESTART
sa.sa_flags |= SA_RESTART;
#endif
#ifdef SA_INTERRUPT
sa.sa_flags &= ~ SA_INTERRUPT;
#endif
sigaction (sig_nr, &sa, (struct sigaction *)0);
}
要注意的是,当这部份的变更大量应用到系统呼叫之後,呼叫read()、write()
、ioctl()、 select()、 pause() 与 connect()时,你仍然得自行检查EINTR。
如下所示:
(2) 你自己得很明确地检查EINTR:
这里有两个针对read()与ioctl()的例子。
原始的程式片段,使用read():
int result;
while (len > 0) {
result = read(fd,buffer,len);
if (result < 0) break;
buffer += result; len -= result;
}
修改成,
int result;
while (len > 0) {
result = read(fd,buffer,len);
if (result < 0) { if (errno != EINTR) break; }
else { buffer += result; len -= result; }
}
原始的程式片段,使用ioctl():
int result;
result = ioctl(fd,cmd,addr);
修改成,
int result;
do { result = ioctl(fd,cmd,addr); }
while ((result == -1) && (errno == EINTR));
注意一点,有些版本的BSD Unix,其内定的行为是重新执行系统呼叫。若要让系
统呼叫中断,得使用 SV_INTERRUPT或SA_INTERRUPT旗号。
可以写入的字串
gcc对其users总怀抱著乐观的想法,相信当他们打算让某个字串当作常数来用
时---那它就真的只是字串常数而已。因此,这种字串常数会储存在程式码的记忆
体区段内。这块区域可以page到磁碟机的image上,避免耗掉swap的记忆体空间,
而且任何尝试写入的举动都会造成分页的错误(segmentation fault)。这可是一
种特色呢!
对老旧一点的程式而言,这可能会产生一个问题。例如,呼叫mktemp(),传递的
引数(arguments)是字串常数。 mktemp()会尝试著在*适当的位置*重新写入它的
引数。