当前位置:Linux教程 - Mysql - PostgreSQL 的昨天今天和明天

PostgreSQL 的昨天今天和明天

前言
今天,如果人们谈论起计算机操作系统,肯定有非常多的人会津津乐道自由软件操作系

Linux,毕竟,众人拾柴火焰高,如今没有任何人敢于忽视 Linux 这个自由软件操作系
统在我
们星球的存在,就连国内比较特殊的环境下,也不断地有各种各样的 Linux 秀出现让公
众,甚
至是那些对计算机知之甚少的群众都能意识到 Linux 的存在。但是,如果我们说起数据
库,可
能绝大多数人只会记得有 Oracle,IBM DB2,Informix,Sybase,MS SQL Server,以及
在互
联网广为使用的轻量级 Mysql,而提到 PostgreSQL 的名字,可能很多人都会皱起眉毛
:“这
是什么?”
“PostgreSQL 是一种特性非常齐全的自由软件的对象-关系性数据库管理系统
(ORDBMS),它的很多特性正是当今许多商业数据库的前身”
--摘自 PostgreSQL 手册。
为了让大家能够清楚的了解 PostgreSQL,请听我细细道来。
历史
出身名门
谈到 PostgreSQL,我们不得不谈 Berkeley,也就是中文中的“加州大学伯克利分校”
这所大
名鼎鼎的大学。老实说,伯克利(BSD)对计算机科学的贡献可谓巨大,在整个计算机科
学的发
展史上,几乎到处都有这所学校的研究人员和学生的足迹。只要稍微对计算机技术史有
些记忆
的人都会记得在 Unix 操作系统的发展里程碑上 BSD 这三个字的分量,然而也许正是由
于 BSD
在系统和网络领域里的光芒太耀眼,掩盖了 BSD 对计算机技术其他分支的贡献,而
PostgreSQL 正是其中之一。
创世纪——Ingres
追本溯源地讲,PostgreSQL 最早开始于 BSD 的 Ingres 项目,这个项目主要是研究关
系型数
据库技术,早在 1970 年 E.F. Codd 就提出了关系模型,从那以后,人类在计算机领域
的数据
管理就进入了一个新的时期。从此人们开始用抽象的关系语句来描述自己的数据,大大
提高了
人类对数据的抽象描述能力。而 Ingres 项目正是就此进行研究的,它始于 1977 年,
到 1985
年结束,而其研究成果后来被一家叫 Relational Technologies 的商业公司拿去做成了
商品软
件,后来这家公司又被 Computer Associates(CA)收购,不知道 CA 的 JASMINE里面
是否还
有当年 Ingres 的影子?
新项目——Postgres
然后,从1986年开始,BSD 的 Michael Stonebraker 教授领导了称为 Postgres 的“后

Ingres”项目,其主要目的是数据库管理系统的更高级研究,因此而产生了 PostgreSQ
L 的直
接前身,Postgres,而 PostgreSQL 的名字也是从 Postgres 项目继承过来的。这个项
目的成
果是非常巨大的,在现代数据库的许多方面都做出的大量的贡献,比如,面向对象的数
据库,
部分索引技术,规则,过程和数据库扩展等方面都走在了数据库管理系统的前列。而且

Stonebraker 教授还做出了一件造福全人类的事情,那就是把 Postgres 放在了 BSD 版
权的保
护下,在这个版权的范围里,任何人几乎可以做任何事情,包括增强它和商业化等。条
件只是
把 BSD 的版权声明包括在软件的源程序里。
Postgres 在 1989 年发布了第一个版本,因为是BSD版权,所以很快在各种研究机构和
一些公
众服务组织里广泛使用起来,由于 众多用户使 Postgres 的开发变得更多地是维护代码
和打补
丁,而日益背离了原先的数据库管理系统的研究的目标,到了1994年 Postgres 在版本
4.2 的
时候正式终止。而 Postgres 的许多成果则转化成一个商业公司 Illustra,后来 Illu
stra 被
Informix 收购。看到这里,想必大家应该对 Postgres 的影响有一些认识了吧。
炎黄子孙的贡献——Postgres95
Postgres 并没有因为 Postgres 项目的终止而停止发展,而是获得了一次新生:在199
4年,两
名伯克利的研究生在做研究生课题的时候,向 Postgres 里增加了现代的 SQL 语言的支
持。请
不要奇怪,SQL 的祖宗是 E.F. Codd 的关系模型,但是 SQL 作为语言,一直到1992年
才形成
真正的国际标准(还是草案),当时称为 SQL2,但是人们常称为 SQL92。而在那之前,
所以查
询语言都是由不同的数据库管理系统自己实现的,比如,在 Postgres 里原来是用叫 P
ostquel
的查询语言;这两位研究生是 Andrew Yu 和 Jolly Chen,看了名字,大家可能会想:
“很象
中国人的名字嘛”,没错,他们就是黑头发黄皮肤的炎黄子孙,不过很可惜的是他们并
没有在
中国的(包括台湾省的)xx大学取得这样的成就。这样,Postgres 迎来了1995年,大概
是受
xxxxxxx95 的命名方法的“启发”吧,他们俩把这个版本的 Postgres 命名为 Postgre
s95,并
且继续发布了几个版本,增强了一些特性。
国际化——PostgreSQL
到了 1996 年,Andrew Yu 和 Jolly Chen 相继离开 Postgres95 的开发队伍,(Andr
ew Yu
加入了 Informix,Jolly Chen 继续读书),而在一些自由软件黑客(注1)的发起下,

Postgres 项目又开始了新的历程,最先是由几位加拿大黑客发起,开始了 PostgreSQL
项目,
后来参与的人越来越多,逐渐成为了一个由近20个国家的近四十名黑客组成的团体共同
开发的
自由软件项目。PostgreSQL 重新把版本号放到了原先 Postgres 项目的顺序中去,从
6.0 开
始(Postgres 本身到4.2,Postgres95 算5.0)。经过五年多的协作开发,PostgreSQL
可以
说是目前世界上最先进,功能最强大的自由软件的数据库管理系统。
目前,PostgreSQL 的稳定版本到了 7.2,具有非常丰富的特性和商业级数据库管理系统
的质
量。而即将到来的 7.1 版本又将是一次飞跃,将向高质量大型数据库管理系统的方向又
迈进了
一步。
在这里,先让我告诉您怎么念 PostgreSQL (的确很绕口):Post-gres-Q-L,大概因为
大多自
由软件开发人员把 SQL 念做:S-Q-L,而不是 IBM 常说的(squel)。
特点
PostgreSQL 可以说是最富特色的自由数据库管理系统,甚至我们也可以说是最强大的自
由软件
数据库管理系统。事实上,PostgreSQL 的特性覆盖了 SQL-2/SQL-92 和 SQL-3/SQL-99
,首
先,它包括了可以说是目前世界上最丰富的数据类型的支持,其中有些数据类型可以说
连商业
数据库都不具备,比如 IP 类型和几何类型等;其次,PostgreSQL 是全功能的自由软件
数据
库,很长时间以来,PostgreSQL 是唯一支持事务、子查询、多版本并行控制系统、数据
完整性
检查等特性的唯一的一种自由软件的数据库管理系统。直到最近才有 Inprise 的 Inte
rBase
以及 SAP 等厂商将其原先专有软件开放为自由软件之后才打破了这个唯一。最后,Pos
tgreSQL
拥有一支非常活跃的开发队伍,目前的提交人员已经超过三十人,而且在许多黑客的努
力下,
PostgreSQL 的质量日益提高,也从另外一个侧面上增加了人们使用 PostgreSQL 的信心
,毕竟
数据库管理系统不能象桌面操作系统那样一天宕一次还让人觉得挺满意 :-P。
从技术角度来讲,PostgreSQL 采用的是比较经典的 C/S (client/server)结构,也就
是一个
客户端对应一个服务器端守护进程的模式,这个守护进程分析客户端来的查询请求,生
成规划
树,进行数据检索并最终把结果格式化输出后返回给客户端。为了便于客户端的程序的
编写,
由数据库服务器提供了统一的客户端 C 接口。而不同的客户端接口都是源自这个 C 接
口,比
如 ODBC,JDBC,Python,Perl ,Tcl,C/C++,ESQL 等,同时也要指出的是,Postgre
SQL 对
接口的支持也是非常丰富的,几乎支持所有类型的数据库客户端接口。这一点也可以说

PostgreSQL 一大优点。
说完优点,不能不说几句缺点,不能因为是自由软件而偏袒 PostgreSQL,从 Postgres
开始,
PostgreSQL 就经受了多次变化。
首先,早期的 PostgreSQL 继承了几乎所有 Ingres, Postgres, Postgres95 的问题:
过于学
院味,因为首先它的目的是数据库研究,因此不论在稳定性,性能还是使用方便方面,
长期以
来一直没有得到重视,直到 PostgreSQL 项目开始以后,情况才越来越好,目前,Post
greSQL
已经完全可以胜任任何中上规模范围内的应用范围的业务。目前有报道的生产数据库的
大小已
经有 TB 级的数据量,已经逼近 32 位计算的极限。不过学院味也给 PostgreSQL 带来
一个意
想不到的好处:大概因为各大学的软硬件环境差异太大的缘故,它是目前支持平台最多
的数据
库管理系统的一种,所支持的平台多达十几种,包括不同的系统,不同的硬件体系。至
今,它
仍然保持着支持平台最多的数据库管理系统的称号。
其次,PostgreSQL 的确还欠缺一些比较高端的数据库管理系统需要的特性,比如联机热
备份,
数据库集群,更优良的管理工具和更加自动化的系统优化功能等提高数据库性能的机制
等。
最后,PostgreSQL 拥有极其强大的扩展能力,你可以很容易地扩展数据类型,内部函数
,聚
集,操作符等等,而且,别忘了,你拥有所有的源程序,理论上你可以做任何你可以做
的事情。
总而言之,PostgreSQL的特性已经完全可以满足绝大部分用户的需要,而且其质量和特
性仍然
在日新月异地进步着,所以,我们有理由相信在不远的将来,PostgreSQL 肯定能够成为
一种优
秀的,自由的,商业数据库的替代产品。
人物
对 PostgreSQL 做出巨大贡献的人物太多了,我在这里只能摘其一二而为之,
首先是伯克利,作为一个学院,好象不应该进入人物的范畴,但是如果没有 BSD 的优良
的学术
环境,创造出这样优秀的科学技术成果是不可能的,只要想想我们的 5000 多所科研单
位就能
明白。(我是不是应该还要在这里感谢美国?:-P)。
然后是 Michael Stonebraker 教授,正是这位学究的开明才能让这样优秀的科技成果走
向了公
众,甚至到了“自由的对立面”的我们的手里,而且是所有的东西,不仅仅是一堆二进
制文
件。
接下来有我们的同胞,Andrew Yu 和 Jolly Chen,他们为 PostgreSQL 走向现代做出了
巨大的
贡献。
最后是现在正在辛勤耕耘的黑客们,这些黑客以他们执着的精神和高超的技术,为 Pos
tgreSQL
的日益完善做出了不可磨灭的贡献。黑客总共有数十人之多,我只好把核心成员挑出来
介绍一
下,而对于贡献了更多代码的其他重要黑客,只好暂且委屈他们一阵子了,如果有机会
,我还
会进一步介绍他们。
Tom Lane:一位卡耐基梅隆大学(CMU)的电子工程学 ph.D(博士),是 PostgreSQL
的非常
重要开发人员,其足迹遍部 PostgreSQL 的每一个角落,可以说对 PostgreSQL 的性能
和稳定
性以及特性的取舍有极其重要的贡献,在开始参加 PostgreSQL 项目之前,他已经有了
十余年
的自由软件开发经验,可以说是老牌的自由软件程序员;
Vadim Mikheev:一位来自俄国的黑客,其特点是专干大项目,比如 V6.3 里面的子查询
,V6.5
里面的多版本并行控制,以及 7.1 里面的预写式日志系统等,可以说是 PostgreSQL 的
开拓
者;
Jan Wieck:一位来自德国的黑客,有十余年的数据库开发经验,原先曾经为 SAP 等大
型软件
厂商工作,后来加入 PostgreSQL 的开发;他也是喜欢大项目,不过兴趣是用户端的特
性,比
如外键,一些过程语言比如 pl/pgsql 等,7.1 版本中的 CLOB(文本大对象)的部分也
是他的
作品。
Thmas Lockhart:一位毕业于加洲理工学院的美国黑客,主要负责文档和若干种数据类
型(尤
其是与时间相关的类型),SQL 语法的标准一致性,时间类型,以及完整性约束等。
Bruce Monjian:来自美国,是一些文档和项目协调,以及许多完整性约束和 SQL 语法
的标准
等,比如 OUTER JOIN,同时维护 TODO 列表和 FAQ。
Marc Fournier:加拿大黑客,主要的协调人,维护站点,邮件列表,以及发布版本等。

Peter Eisentraut:德国/瑞典黑客,主要负责文档编写、完善,认证和权限管理,制作
脚本和
一些管理配置接口的制定,以及客户端交互工具 psql 等,其作用日益突出,可以说在
7.2 版
本的开发过程中是不可或缺的人物。
另外还有大量来自欧洲,澳洲和亚洲(日本)等地的黑客。实际上,有越来越多的黑客
的作用
变得日益重要,在邮递列表中每天都有来自不同黑客的各种各样的补丁程序。所以,自
由软件
的特点就是,只要愿意,任何人都可以对它有足够的影响。也就是说,我们命运是真正
掌握在
自己手里的。
展望
就目前而言, PostgreSQL 的前景非常好,目前的稳定版本是 7.2,这个版本在 7.1 版
本的基
础上再次做了大量的改进和提高。
7.1 是继 6.5 之后的又一个巨大的变化,她首先引入了预写式日志的功能。这样,事务
就拥有
了完善的日志机制,可以提供更好的性能,以及还可以实现更优良的备份和灾难恢复的
能力
(比如联机热备份和宕机后的自动恢复)。其次是对文本类型的数据段的长度不再限制
,从而
很大程度上解决了 PostgreSQL 的大对象的问题。尤其在如今的 web 应用盛行的环境下
,这个
功能几乎立即将 PostgreSQL 摆到了可以与其他所有类型的数据库竞争的地位。而且在
SQL 标
准上又有进一步的提高,比如OUTER JOIN 的支持等等。
7.2 版本在 7.1 的基础上改进了原来的数据库定期清理工作中排它锁的过程,使数据库
维护不
再影响数据库的正常使用,同时增强了查询优化的智能,使数据库对索引的使用更加准
确;同
时还消除了每个安装节点的免维护事务次数的限制;国际化;以及还有大量其他方面的
增强。
在未来的 7.3 版本中,我们有望可以看到更加智能的数据库清理,更优化的不同种类的
索引类
型(比如散列/HASH索引),实时的数据库热备份功能,表空间和数据库大纲(Schema)
的支
持,更好的权限管理以及更多性能优化方面的增强内容。
后记
作为一种数据库管理系统,PostgreSQL 并不象 Linux 与某些商业操作系统相比那样,
得到迅
速广泛的承认,这一点是可以理解的,最近的 Tom Lan 有一段话说得实在:“首先,商
业数据
库系统不象某些商业操作系统那样实在太烂,相反,商业数据库系统的质量还是非常高
的,与
之相比,PostgreSQL 仍然有差距”但同时他也相信“我们已经达到商业级的数据库系统
的质
量,只不过不能说是最好的。”
的确,自由软件的发展具有跳跃性,因为开发者大多是利用空余时间进行开发,当开发
者云集
的时候,新的东西可能一下子就增加上去;而如果在自由软件运动的低潮时,因为缺少
开发
人员,所以可能会有一长段时间的沉寂,而后又会随着社会的发展而出现新的活动。也
就是一
种螺旋上升的曲线。
因而,我们在面对自由软件的时候,一定要有一点:要相信自己和依靠自己,因为自由
软件的
发展的确需要每一个爱好者充分发挥自己的聪明才智,同时,也只有自由软件给你提供
了这样
的机会——依靠自己的力量改变自己的命运。最后,也只有这样,自由软件之光才能真
正照耀
我们的世界。