虽然层次数据库已经可以很好地解决数据集中和共享的问题,但是其在数据独立性和抽象级别上依然有着欠缺。 还好,就在1970年,IBM研究员E.F.Codd提出了关系模型的概念,由此奠定了关系模型的理论基础。他所发表的论文“A Relational Model of Data for Large Shared Data Banks”也被认为是数据库系统历史上具备划时代意义的里程碑。在经过不断的发展和论证之后,最终使得更具备优势的关系型数据库成为了市场的主流。随后,在1974年,IBM公司的Ray Boyce和Don Chamberlin提出了SQL语言,它实现了数据库生命周期中的全部操作,为关系数据库奠定了另一块里程碑。
在1979年,IBM完成了第一个实现SQL的DBMS。在20世纪的80年代早期,IBM利用了RDBMS和SQL的第二阶段的技术,创建了新型的数据库产品,并将其命名为DB2,也就是拥有第二代技术的数据库产品。而在过去的岁月中,DB2已经从重要的大型机产品发展成为可在各种服务器平台上运行的产品。尤其是在System 390(即目前所称的System z)中,DB2已经成为分布式计算的核心。
尽管不断地有同时期厂商的数据库产品的竞争,但是DB2依然在高端企业应用市场受到了广泛的应用及好评。经过多年的发展和进步,在System z和安装了Linux系统的英特尔平台上,已经运行有近50万台的DB2数据服务器。 IBM DB2 9:首款混合型的数据服务器
随着信息化进程的发展和企业间、企业内部信息交换的需要,XML作为标准化的数据存储格式,其数据量正面临着巨大的增长。而事实上,每个行业都在实施着XML数据标准,新版的微软Office软件也将以XML格式存储文档。此外,正有越来越多的公司开始转向使用XML技术,以便在不同的系统和应用程序之间交换数据并适应快速变化的环境,从而帮助他们逐步实现SOA。结合了关系型数据库和层次型数据库二者特点的DB2 9(代号Viper)引入了另外一种可能-混合型数据库,该数据库可以非常好地支持XML数据,同时也对其他技术包括SQL、表格数据结构和各种DBMS特性的支持依然存在。
在此之前,文件系统可以应付简单的任务,但是在需要处理大量文档时它们就表现不佳。并发性、恢复、安全和可用性等问题变得难以管理。尽管商业关系数据库管理系统(DBMS)解决了这些问题,但是在其他方面有所欠缺。DBMS通常只是提供两种基本的数据库设计选项――将每个 XML 文档完整地存储为一个大型对象,或者将它“撕开”,分散存储在多个表的多个列中。这样不仅无法完整体现XML的层次结构,而且效率低下、不够灵活。
此外,纯粹的XML DBMS 在IT基础设施中引入了一种新型的环境,但是这样的环境还没有经过考验,其集成能力、所需要的人员技能以及未来的生命力也都不确定。因此,必须找寻可以高效共享、搜索和管理公司大量XML文档和消息的系统,以便帮助企业减少存储和使用XML数据所需要的时间及工作量,以期减少应用开发费用且提高业务灵活性。混合型数据库DB2 9正好适应了这样的需要。通过DB2 9,用户可以使用同一个数据库对象同时管理“传统的”SQL数据和XML文档,甚至,还可以编写一个查询同时搜索和处理这两种数据形式。
具有如此特点的DB2,是业界第一款也是惟一一款可以使用行业标准接口的关系数据来管理pureXML的数据库,它在三个领域具备了独到的创新:XML数据管理、数据压缩和SAP优化。其中,最重要的功能即XML数据管理,它使用了IBM的“pureXML”解决方案来管理以XML格式存储的数据。
这意味着DB2 9可以提供XML数据的“原生态”存储,而无需将数据转化成行列格式,更无需将其作为大型对象来存储。为实现这样的功能,IBM对DB2进行了扩展,使DB2 9包含了如下的新技术: [code] 新的存储技术,可以高效地管理 XML 文档中固有的层次结构。