一个必须存储或访问大量信息的应用程序可以从使用第三方数据库产品中受益匪浅。在对信息的访问必须在程序的多个实例上进行时更是如此。基于Web的应用(包括电子贸易)就是它的良好例证。
为什么使用独立数据库?
Web服务器必须使其处理脚本有办法来存储有关供其以后访问的状态信息。尽管有可能使用比较原始一些的方法--例如转储到文本文件或开发自制的迷你数据库--但只有成熟的数据库应用才能提供更为复杂的Web应用所需的所有服务。因为有一些免费获得的软件包可用于该目的,所以编写定制的特定于应用的数据库引擎并无太大好处。 另外,使用第三方数据库还使Web开发者不必投入到开发和维护数据库的任务中。
MySQL数据库
通过使用脚本语言和编译型系统语言(例如 C),将数据库集成到Linux应用就可能相当容易。可免费获得的MySQL(在GNU Public License下发行)数据库提供了一系列复杂的SQL功能,并易于集成到应用中。MySQL是快速、多线程的,并支持ANSI和ODBC SQL标准。加上第三方软件,MySQL就支持用于事务处理应用的事务安全的表。
注:什么是事务处理?
事务是需要以原子方式执行的对数据库所做的一系列更改。它们要么必须全部执行,要么一个都不执行。 例如,在Web上销售产品时所有必需的数据库更改组成一个事务。
数据库需要同时减去客户帐户余额和产品库存,否则失败并且一个操作都不执行。
无论服务器出于何种原因发生崩溃都不应该引起事务被部分执行。例如帐单多算、产品没有交付,或者库存不实等都有可能是部分完成的事务的结果。
支持事务处理的数据库可以将一组数据库代码封装在一个事务中,在事务执行期间的任何失败会让数据库回滚到事务开始之前的状态。
这是通过维护所有数据库操作的日志,以及其原始状态表的副本来实现的,在失败后下一次重新启动服务器时允许回滚操作。 这种时间和空间上的开销是事务安全数据库系统所必需的一种折衷。
单一MySQL服务器控制着一系列数据库,它们都可以通过服务器以类似方式来访问。 每个数据库实际上都是一组任意数量的表,概念与其它SQL数据库的用户类似。每个表都由带类型的数据列组成。 数据可以是整数、实数值、字符串或其它类型,包括原始二进制流。 表中的每一行都是存储在数据库中的一个记录。
MySQL被设计和构造成客户机/服务器。 服务器mysqld可以在能从因特网访问到的任何机器上运行(最好与Web服务器在同一台或最接近的一台机器上,以确保合理的响应时间)。MySQL客户机使用请求来与MySQL服务器联系,修改或查询服务器所拥有的数据库。 在支持数据库的Web应用程序中,数据库客户机是Web服务器或由Web服务器产生的CGI脚本。 这些客户机可以用高级脚本语言或低级系统语言编写,只要存在这种语言的数据库API即可。在Linux中,大多数脚本语言是以C 实现的,因为存在MySQL C API,所以要将MySQL支持添加到任何现有的脚本语言或工具应该很容易。绝大部分脚本语言已经完成了这一步。
MySQL API
MySQL API可用于各种语言,包括几乎所有编写网站后端所实际使用的语言。 使用这些API,我们可以构建由Web服务器控制的 MySQL客户机。
API(用于数据库访问)以基于连接的模式工作。客户机必须做的第一件事是打开与MySQL服务器的连接。 这包括适当地使用服务器认识的用户名和口令来对连接进行身份认证。建立了连接后,服务器选择要使用的特定数据库。 确定了初始化后,客户机应用程序(就我们来说是服务器方CGI脚本)就能自由地与数据库以两种方式中的一种进行交互:可以运行常规SQL命令,包括添加和删除表,以及向它们添加记录;也可以对返回结果的数据库运行查询。 查询生成一组与查询匹配的记录,然后,客户机可以逐一访问记录,直到查看完所有记录,或者客户机取消暂挂的记录检索。一旦脚本完成了对数据库的操作后,与服务器的连接就被关闭。
要构建集成数据库访问的网站,需要编写CGI脚本来根据数据库状态生成动态结果。Web服务器启动CGI脚本,然后将适当格式化的HTML输出到它们的标准输出流中。Web服务器捕捉到HTML后将它发送回客户机,如同请求是对静态HTML页面进行的那样。 在生成 HTML 的过程中,脚本可以修改数据库,也可以查询并将结果合并到它们的输出中。
作为简单解释上述过程的一个示例,下面的代码(以C和Tcl编写)查询一个包含某公司供销售的产品清单的数据库。 这绝没有使用两种语言MySQL API的所有特性,但提供了快速、简易扩展的示例,可以对数据库内容执行任何SQL命令。 在该例中,脚本显示了低于特定价格的所有产品。 在实践中,用户可能在Web浏览器中输入该价格,然后将它发给服务器。 我们省去了从环境变量中进行读取来确定 HTML 表单值的细节,因为它与不支持数据库的 CGI 脚本中执行的情况没有什么差别。 为清晰起见,我们假设事先设置了特定一些参数(例如要查询的价格)。
以下代码是使用免费获得的Tcl Generic Database Interface以Tcl实现的。这样一种接口的好处在于Tcl是解释型的,可以对代码进行迅速开发和快速修改。
Tcl示例
#This code prints out all products in the database # that are below a specified price (assumed to have been determined # beforehand, and stored in the variable targetPrice) # The output is in HTML table format, appropriate for CGI output #load the SQL shared object library. the Tcl interpreter could also #have been compiled with the library, making this line unnecessary load /home/aroetter/tcl-sql/sql.so #these are well defined beforehand, or they could #be passed into the script set DBNAME "clientWebSite"; set TBLNAME "products"; set DBHOST "backend.company.com" set DBUSER "mysqluser" set DBPASSWD "abigsecret" set targetPrice 200; #connect to the database set handle [sql connect $DBHOST $DBUSER $DBPASSWD] sql selectdb $handle $DBNAME ;# get test database #run a query using the specified sql code sql query $handle "select * from $TBLNAME where price $targetPrice" #print out html table header puts "table border=4>" puts "th>Product Id th width=200>Description th>Price (\$)" #output table rows - each fetchrow retrieves one result #from the sql query while {[set row [sql fetchrow $handle]] != ""} { set prodid [lindex $row 0] set descrip [lindex $row 1] set price [lindex $row 2] puts "tr>td>$prodid td align=center>$descrip td>$price" } puts "table>" #empty the query result buffer - should already be empty in this case sql endquery $handle #close the db connection - in practice this same connection #is used for multiple queries sql disconnect $handle
下面的代码是使用正式MySQL C++ API MySQL++以C++编写的等价脚本。该版本的优势在于它是编译型的,因此比解释语言更快。经常用在特定站点的数据库代码应该以C或C++编写,然后由脚本或直接由Web服务器访问,以改进整体运行时间。
C++示例
#include #include #include const char *DBNAME = "clientWebSite"; const char *DBTABLE = "products"; const char *DBHOST = "backend.company.com"; const char *DBUSER = "mysqluser"; const char *DBPASSWD = "abigsecret": int main() { try { //open the database connection and query Connection con(DBNAME, DBHOST, DBUSER, DBPASSWD); Query query = con.query(); //write valid sql code to the query object query "select * from " DBTABLE; //run the query and store the results Result res = query.store(); //write out the html table header cout "\n"; cout "Product Id Description" "Price ($)" endl; Result::iterator curResult; Row row; //iterate over each result and put it into an html table for (curResult = res.begin(); curResult != res.end(); curResult++) { row = *curResult; cout "" row[0] "" row[1] "" row[2] endl; } cout "" endl; } catch (BadQuery er) { // handle a bad query (usually caused by a sql syntax error) cerr "Error: " er.error endl; return -1; } catch (BadConversion er) { //handle conversion errors out of the database as well cerr "Error: Can't convert \"" er.data "\" to a \"" er.type_name "\"." endl; return -1; } return 0; }
安全性
在Web上创建以Web支持的应用有一些开发者需要考虑的问题。所有有关Web服务器上CGI程序的问题,例如Web服务器处理许可权和脚本方的输入检查,也仍然需要考虑。除此之外,维护数据库系统的安全性也很有必要。这涉及保护数据库服务器的许可权系统,以及使从数据库客户机到服务器的连接安全。
MySQL提供了深入的安全性系统,有人形容它是“高级但不标准”。MySQL允许根据用户名、客户机主机和要访问的数据库对客户机进行访问。要创建安全的系统,让所有用户使用强口令,不要给他们任何他们不是绝对需要的访问权。这包括表面上无害的特权,例如可以让用户查看所有正在运行的进程(包括更改其他用户口令的那些)的处理特权。最好的办法是以无特权的Unix用户运行服务器进程本身,这样如果一个数据库被泄露,也不至于击垮整个系统。 这与以用户nobody而非root用户运行httpd类似。 描述系统访问的表是作为单独的MySQL数据库存储的,可以由MySQL root用户更新。 请注意,MySQL服务器根据MySQL用户名授予特权,这些用户名与Unix用户名不同。不过,有一个MySQL root用户名,它对数据库有全部权限。 一旦服务器确定了连接客户机是谁,以及它们在尝试连接什么之后,就根据给定的一组权限来控制访问权。要防止访问表中主机名被DNS电子欺骗,可以输入所有主机的IP地址,或请求服务器将IP地址解析回原始主机名来使其他人截获DNS请求和回答更困难。
除了服务器访问表以外,与服务器的通信也必须很安全。从客户机登录到服务器上时,口令不以纯文本方式发送;不过所有后续 SQL 命令将以纯文本方式发送。为达到更高的安全性,使用ssh来设置端口转发。它将服务器和客户机之间的所有通信进行加密,防止有人在传输中观察它。来自客户机的数据发送到客户机本地机器中本地ssh服务器所侦听的端口上。它由本地ssh服务器使用,加密后发送给远程ssh服务器,由它进行解密并转发到MySQL服务器端口。
在实际中,最安全的方法是在 Web 服务器所在的机器上运行数据库服务器,并让由Web服务器产生的CGI脚本通过UNIX(本地)套接字与MySQL服务器进行通信。该设置可以让数据库管理员禁用所有与MySQL服务器的远程连接。如果Web和数据库服务器必须位于不同的机器上,加密它们之间的所有通信,或者将两台机器通过其自己专用的、物理上隔离的网络连接。只创建一个由Web服务器使用的用户帐户(除 root 用户外)以登录到数据库服务器。
由数据库驱动的网站是一些功能强大的工具,可以让开发者创建提供更新信息的动态站点,并让由客户机发起的更改在多个会话之间持续。后端数据库的使用对于管理电子贸易和其它应用的用户来说必不可少。通过使用可免费获得的软件,有可能建立由数据库驱动的站点,安全地将数据库连通性集成到站点现有的CGI体系结构中。
参考资料
您可以参阅本文在developerWorks全球站点上的英文原文.
有关最新新闻和文章,请访问MySQL主页。
在MySQL++上查找C++与MySQL的正式接口。
Tcl GDBI( Generic Database Interface)是用在本文中Tcl示例中的Tcl MySQL API。
详细了解用于加密 MySQL 客户机和服务器之间所有通信的Secure Shell (ssh)。它用在不可信网络(例如公共因特网任意部分)上进行的通信中。