从现在开始,我们将探讨如何通过将网络集成到存储I/O以改进这些技术。
网络存储包括了网络和I/O的精华,特别是灵活的网络寻址能力、远距离传输能力、I/O高效的原性能。尽管在开放系统服务器中使用的网络存储技术还很新,但几年以前该技术就已经出现在诸如IBM的ESCON和Digital和Computer Interconnect等大型机环境中了。
如第1章中所提到
,网络存储沿着两条主要技术的发展方向前进:SAN和NAS。网络连接存储(NAS)具有提供以太网络数据访问的传统。它的模型主要源于网络文件服务器的概念。NAS的产品,通常以与现有网络结构相容的应用包形式,提供集成服务。
存储区域网络(SAN)是一种新存储连接拓扑结构。它被设计用于代替现有的系统和存储系统之间的SCSI/O连接。SAN代表了一种将数据由数据处理系统传输到数据存储系统的新方法。
本章将分别讨论NAS和SAN,并解释它们在技术实现方面的区别。
一、自由的I/O
NAS和SAN之间的相同点之一在于系统和存储之间连接的外部特性。多年以来,PC服务器存储主要在服务系统内部实现,并作为整个服务器系统的一部分出售。1999年,外部服务器存储子系统开始普及,而且仍然主要作为服务器系统结构的一部分出售。在许多人的心目中,存储和服务器是不可分的。与这种思想伴随而来的是,人们认为存储器必须紧挨着服务器放置。因此,当想到要把存储器柜从它们的服务器挪开时,一些系统管理员就开始紧张了。但这恰恰是网络存储的优点:它可以将数据放置到那些能被最可靠地访问、并能被最有效地进行管理的存储器中。
本章是为那些有些惧怕求知、对网络存储说法不太舒服的人,以及那些对这些概念有些混淆的人而写的。如果您也是其中一员,那么现在您一定不会感到太孤单了。到1999年,存储网络还是一种新概念。它仍然等待着“杀手锏“的出现,以将它们并入市场的主流。
尽管存储网络的反对者们对已经存在的实现方法提出了质疑,但对于网络存储的概念他们却无话可说。所有新技术出现时都会遇到这种情况。原始的阴极射线并不代表电视显像管,但通过在屏幕上产生移动的亮点,它们成功地证明了显像管的原理。存储网络将成为下个时代网络和互联网计算中最重要的技术之一。因为它可以使用比服务器连接存储更有效的文式来管理和访问数据。
两种方法:SAN和NAS
正如在第1 章所讨论的,目前存储网络技术领域中的两个基本乐章是SAN和NAS。它们两者并不相互独立,也没有竞争相同的市场。这两种技术是相互补充和相互配合的。现在NAS系统能使用SAN技术--将来SAN也将被作为连接NAS产品的网络技术。下面将比较NAS和SAN技术,并讨论几个相关的主题。
SAN通常被认为是一种光纤路径网络,它通过使用被称为光纤路径技术(FCP)的串行SCSI I/O协议来传输I/O流量。NAS产品,则通常被理解为是具有自己的文件系统的专用文件服务器。表列出了两者之间的差别。
SAN和NAS的比较
SAN NAS
协议 FCP,串行SCSI NFS,CIFS网络 光纤路径 以太网源/目的 服务器/设备 客户机/服务器,服务器/服务器传输对象 设备块 文件存储设备连接 网络上的直接连接 服务器上的I/O总线路径嵌入的文件系统 否 是
1. SAN悖论
SAN一直被作为一种开放系统计算环境中数据可用性的解决方案来兜售。通过将某些I/O处理过程从系统转移到存储,可以获得更好的数据可用性。因此,存储管理功能可以独立于访问数据的服务器。这种方法有着明显的优点,例如,可以使用大型存储子系统为来多个服务器的数据提供接口管理控制。
然而,提供这种能力的存储子系统必须获得更多的信息,而不仅仅是目前系统中提供的块传输表。进行存储管理必须对整个数据实体的信息有清楚的认识,如对于文件就不仅仅是保存面向连接的块存储表。恢复文件的过程是一个很好的例子:用户简单地提供想恢复的文件名和文件版本,然后选中该文件,启动恢复过程并将文件恢复。他们在恢复一个文件时,并没有先找到所有需要恢复的文件的相关数据块,然后提交这些数据块列表来进行恢复。由此可见,如果SAN想提供有用的存储管理能力,则必须掌握数据库/文件系统的信息,而不仅仅是关于数据块的信息。这样SAN才能直接管理文件和数据库对象。
其中,如果SAN想提供预期的自治管理能力,则必须要求那些SAN中的智能组件提供关于数据/文件的处理功能。目前SAN中的智能组件可以支持块传输功能层的功能,并作为“超强虚拟设备”工作。但这并不意味着它们的智能足以极大简化存储和数据管理的过程。因此,需要将文件系统和数据库管理系统将逐渐演化,成为一种SAN可识别的分布式资源。无论从哪一方面发展,这两种技术都将逐渐相互融合,而不是相互分离。
记住下面的这些要点将会很有帮助:
·SAN和NAS不是对立的。
·SAN是一种网络,NAS产品则是一个专有文件服务器或一个智能文件访问设备。
·SAN包括面向块(SCSI)和面向文件(NAS)的存储产品。
·NAS产品能通过SAN连接到存储设备。
2.NAS中的“网络“
NAS和SAN具有很多相同的特征,因此容易产生混淆。鉴于概念的混淆会影响到市场的发展,NAS和SAN厂商都不希望混淆出现。因此,业界人土进行了许多关于它们的讨论以澄清这两个概念。
不幸的是,混淆是无法避免的。这里主要的问题似乎在于,这两个词的构成本身就易于混淆。从计算机市场业界是观点来看,并不奇怪他们热衷于使用三个字母的缩写(TLA)。如果让搞计算机市场的人给冰箱分类,他们一定会把冰箱称为RFD(冷冻食品设备)或者EIC(电子冰冻盒)。现在NAS和SAN都出现了。对于我们这些患有间歇性诵读困难的人而言,至少我们知道它们和存储、以及网络有关。这此词在发明时并没有太多考虑人们会如何使用它――它们被自由地用来描述很多种类的事物,从不同的产品到网络,到各种应用和技术。
部分混淆于对NAS产品预期运行环境定义。在其基本实现中,NAS仅简单地包含了在现存的以太网中集成一个专用存储服务器。对某些人而言,这种网络和存储数据传输没有任何关系。当然,NAS的厂商并不认为网络是否和存储相关连有什么关系。从他们的角度看,最重要的是他们的产品能否正常工作――当然是阶段性的正常工作。
一些SAN的支持者不同意前者的观点,他们认为NAS产品是与其他所有服务器和工作站一起接入到现有以太网中的。换而言之,他们不希望NAS这个词和专用存储网络有任何关系。从他们的观点来看,专用存储网络就是指SAN。
那么那些NAS厂商的反应就可想而知了。生产NAS产品的公司显然希望尽量多地出售其产品,无论采用什么方法。这样,一些NAS厂商将他们的NAS产品性能提高为不但可以用于现存的以太网,还可以用于可提高性能和管理能力的新的、独立的专用网络。
有一个观点认为更多的是顾客,而有是NAS厂商,会接受这种将限制该技术通用性的定义。这个观点有些令人难以理解。大多数以太网系统管理员乐于讲述他们在解决网络问题方面的成就,包括如何配置交换机和路由器以形成子网,从而将LAN通信分离成高优先级和低优先级的虚拟LAN。很难想象他们不会马上想到去同样处理NAS文件服务器。
二、NAS和SAN的差异
除了前面提到的方法,还有其他一些方法可以用来比较NAS和SAN。下面的章节将引入其他一些方法并讨论其优缺点。我们希望通过这种分析,能让读者对那些可能产生矛盾和混淆的命题有一个清楚的认识。
1. 文件系统处的分隔
图1说明了人们普遍接受的关于SAN之间的差异。该图的基本思路是选择文件系统作为分界以分隔两个区域。换而言之,文件访问是NAS的工作,而SAN的任务则是操作块设备。
图1并不代表一个综合了SAN和NAS的完整网络I/O系统,也不试图解释SAN和NAS两者之间的依赖关系。因为这两者之间是相互独立的。这里举出该图的目的在于形象地对两种技术之间实现的差异进行比较。
应用程序 文件系统 磁盘
NAS NAS
图 1 NAS和SAN实现的简单模型
这张草图能很快地说明对象,但是它不能很好地对两种技术进行实质性的描述。例如,对初学者而言,它没有很好地对数据库系统进行说明。当然,给这个模型添加数据库系统并不困难,只需要将图中的文件系统换成数据库系统即可。
该图的不足之处在于,它对不同组件的所处地位描述太模糊,特别是对位于中间的文件系统。
本书的第2章和第3章分别讨论了I/O路径中的硬件和软件组件。图2显示了正在访问一台服务器上文件的客户机的I/O路径。它说明有两个文件系统需要被考虑:客户机上文件系统和文件服务器上的文件系统。尽管客户机上的数据访问可能被重定向,从而绕过它的本地文件系统,但实际上仍然存在本地文件系统。图显示一个简单的系统,它没有被重定向,但也因此容易产生混淆。
2. NAS和SAN的软件模型
图2重新绘制了图1中的内容,只是这一次显示一系列更为复杂的软件组件。它包括左右两边的组件,并重新标记了中间的文件系统。
存储控制器
客户端重定向器 网络服务/系统 设备驱动器
NAS SAN
文件系统数据库
网络应用程序
图2 SAN和NAS的软件模型
图2中左显示了一个客户端重定向器,它主要用于发送请求的文件和数据。客户端重定向器是一个文件系统级的软件。它将网络文件和数据服务与本地资源合并起来,然后将它们提交给应用程序或用户。图1中的文件系统部分被标记为网络文件系统。它在原有文件系统的基础上增加了数据库和网络应用的功能。模型的右边为一个存储控制器的设备驱动器,它代替原来的磁盘驱动器。
注意SAN的位置在该驱动器的右边,而不是它和网络服务器之间。在这张图中假设该设备驱动器(例如HBA)位于主机I/O总线上。将来,这种连接控制器也许会通过网络连接到系统中。
3. NSA和SAN的硬件差异
尽管图2中的模型比图1中的更详细,但对于那些从系统硬件角度来考虑的读者来说,帮助也许不大。下面将从硬件组件成的角度来重新考虑两者之间的区别。图33给也了一个硬件视图,并把注意力集中于中间的网络服务系统内部。
图3左边是一个网络适配器,它用于连接网络服务系统和客户机系统,可位于连接各种类型通信的网络中。中间是一个服务器系统,它运行客户应用程序的请求,并将它们映射到真实或虚拟的存储设备中。图3的右边是一个主机I/O控制器,它将应用程序和用户请求传递到真实或虚拟的存储设备和子系统。
设备
服务器系统
SAN
NAS
到客户系统
网络接口卡 系统I/O总线 主机I/O控制器
图3 SAN和NAS的硬件模型
尽管图3中的情形在大多数情况下都适用,但这种实现仍然存在问题,即左边部分必须具有NIC功能,而右边部分必须同时具有HBA功能。在实际应用中解决该问题的方法将在下面进行讨论。
4. NAS和SAN的协议差异
关于接口适配器中多功能支持的讨论,会引发善于不同适配器设备驱动器所支持协议的讲座。图4对NAS和SAN的协议进行了分析。
图4左边是一个文件访问协议堆栈,建在TCP/IP的顶层。它包括一些支持文件或数据库访问的更高层协议的组合。该图的中间部分是一个操作系统。它的作用类似于图中两个堆栈之间的协议转换器。图右边显示了两个协议栈,它们被用于网络存储设备、网络子系统或服务器。其中一个堆栈是块访问协议,SCSI;另一个堆栈是文件访问协议栈,它和图中左边的栈功能相同,其区别在于右边的栈被用于传输存储I/O通信数据的专用存储网络。
1).一个适配器――两个协议
光纤路径被设计成为一种多协议技术。它可以支持SCSI协议和IP协议。尽管在1999年末,其预期的多协议特征还不能真正使用,但它们正处在开发过程中。其早期的测试已经开始,并希望到2000年能投入使用。这还意味着在一个服务器系统中,单个光纤路
径适配器可以作为NAS组件或SAN组件单独或同时使用。图5显示了一个多协议适配驱动器,它是为这种混合NIC/HBA产品专门设计的,能控制NAS和SAN的连接。NIC/HBA支持的两种协议交替访问网络,并轮流对其各自的请求做出应答。
数据库/文件
服务器 NFS
应用程序 CIFS
文件访问 TCP/IP
SAN 网络协议 以太网
NFS 应用程序 光纤路径
CIFS 文件访问 SAN
TCP/IP 网络协议 块访问 串行SCSI
以太网 路径协议 光纤路径
图4 SAN和NAS的协议模型
NIC功能
多元传输
TCP/IP
(NAS) TCP/IP传输 SCSI 3传输
SCSI (SAN)
(SAN)
多协议适配 HBA主机总线适配器功能
驱动器
图5 单个适配器中的多协议NAS和SAN连接
也有可能将SCSI-3映射到除了光纤路径以外网络中,如以太网和千兆以太网。这种映射允许它使用和光纤路径相同的方式进行访问。以太网已经支持多协议很多年,显然也能支持这种SCSI映射。这样,单个网瞳就能和光纤路径适配卡一样提供NAS或SAN两种功能。图6给出了一个可能的方案。其中,由一个100BaseT的四端口以太网适配卡分配其中两个网络端口进行TCP/IP网络通信,使用另外两个端口进行存储网络通信。注意该图中两种类型的网络通信是如何在独立的网络连接上进行传输的
TCP/IP网络数据传输(SAN)
100BaseT4端
口适配器
SCSI-3存储(路径)数据传输(SAN)
图6单个适配器中的多协议、多端口NAS和SAN
正如上文所述,支持IP协议的以太网网卡能在NAS和SAN中同时工作。尽管它们
并不被认为是典型的SAN连接,但一个由客户的系统通过专用存储网络连接到NAS存储服务器的IP通信符合SAN的基本要求。由于具有在各种不同层次工作的能力,两个不同的这种网能装在同一台服务器上,以同时提供SAN和NAS的功能。图7说明了这种结构。
2).深入讨论协议
大多数情况下,一个事务被认为是属于NAS还是SAN在实际应用中并不重要。但使
“每天”网络 存储网络
到工件站和其 服务器 到存储
他服务 系统
NAS SAN
主机I/O
总线
网络接口卡 网络接口卡
图7系统中隔离的IP NAS适配器
用正确的词汇来称呼这些通信系统中的思想、计划和结构,在进行交流时能节省很多时间,还可以减少不必要的混淆。和协议分析有助于描述数据网络的概念一样,清楚地描述存储网络地概念也能提高效率。作为一个网络中比较抽象的部分,协议可以用来进行与具体产品无关的系统分析。
通过块协议和文件协议访问存储数据
存储网络有它们自己的定义其功能和性能的协议集。1999年,存在两个主要的协议集:块访问协议集和网络文件协议集。事务处理协议代表了第三种协议。它还没有在存储网络圈中讨论过,但在创建新的网络存储技术和产品方面存在着巨大的潜力。
块访问协议以块的格式传输和接受数据。块协议几乎不传输任何善于数据内容的信息,面是携带关于被访问数据的信息。图8对此进行了说明。
“块“这个词被用于衡量数据的数量。它和存储设备的离散存储容量有关。块访问协议允许计算机、控制器和设备之间能进行快速大量的数据交换。
网络文件协议在它们各自的平台上使用不同的文件访问接口文件访问接口几乎没有任何关于存储设备或系统的信息。关于网络文件协议的一个普遍的看法是,它能为终端用户提供高层、易用的接口和应用程序,以访问网络上的数据。网络文件协议在文件内部以字节为单位对文件进行操作。图9说明了文件访问协议的要点。
5.存储网络中的多协议应用
图5-6和7说明了在存储网络中如何支持多个协议的功能。现在,我们来看多协议可能被使用范围。
1).使用IP通信扩展SAN功能
图5-6显示了一个具有多协议适配器的系统。该适配器可以用于NAS和SAN网络通信。和其他数据处理网络通信一样,NAS通信数据经常中相同的数据网上传输。它不需要为某个存储器所专有。当NAS为存储器所专有时,它本身就成为了SAN。
图10显示了一个扩展SAN。其中TCP/IP和SCSI-3类型的数据在网络上并行传输。
图10中的扩展SAN中有两个工作站、三个服务器和三个RAID系统。它们通过一个8端口交换机连接到一个光纤路径网络中。两个工作站和服务之间通过TCP/IP相互通信。每个服务器使用SCSI-3和自己的RAID子系统通信。两个工作站没有配置相应的SCSI-3协议,因此不能和RAID子系统直接建立会话。
3).SAN中的SNMP通信
如今大多数SAN产品使用SNMP来管理它们的活动,并对其错误进行报告。同时,这种管理以一咱“带外”的方式进行,即通过SAN以外的网络进行管理。然而,为了更好的管理SAN资源,“带内”或、SAN内的管理可能发展成为SAN中TCP/IP通信的主要管理应用方式。带内管理方式和SAN通信过程有着相同的性能特点,即它和网络通信有相同的速度,而不会比相应的数据传输慢。经比较,100Mb的带外以太网管理的SAN中事件的回应速度显得太慢。
图11中显示了一个具有带内SNMP管理的SAN。其中一个服务器和存储子系统通过
一光纤路径集线器连接,并使用SNMLP和网络管理控制台进行管理。
三、NAS和SAN的实现
本节介绍SAN和NAS的实现,并总结前面讨论过的关于SAN和NAS的概念。
最简单的NAS和SAN技术实现的版本是一个简单的、点对点的两节点网络。图12首先举出一个简单的数据网网络模型。其中,一个工作站访问NAS服务器上的某种类型的数据。
以太网集线吕器
NAS
服务器
客户机系统
图12数据网络模型
接下来是一个简单的点对点SAN。这个简单模型也是在1999年实际应用中最普遍使用的模型。图13对此进行了说明。
服务器系统 存储子系统
图13点对点SAN网络模型
为了对上面的例子进行扩展,可在SAN中使用哆个系统同时访问多个存储设备。其中所有的组成单元通过一个存储网络交换机或集线器进行连接。图14给出了一个由三个服务器通过一个存储网络交换机访问三个不同存储子系统的模型。
服务器1 子系统1
SAN交
服务器2 换机 子系统2 存储器
服务器3 子系统3
图14多存储子系统模型
图15说明,一个NAS服务器系统可以使它的存储设备通过任何合适的总线路径进行连接包括使用SAN存储网络。
以太网 SAN集
集线器 线器
客户机 NAS服
务器
NAS服务器
存储子系统
图15使用SAN的NAS服务器系统
在上面例子中,可以在以太网休线器和NAS服务器之间插入一个数据库服务器,从而得到图16的变化。
以太网集 数据库服 以太网交 SAN集
线器 务器 换机 线器
客户机 NAS服
务器
存储子系统
图16插入一数据库服务器的系统
图17说明了在一个大的网络环境中将不同存储网络相互连接到一起情况。
以太网 存储子系统
NAS服务
客户机
主机I/O控制器 SAN交换机
图17由SAN和NAS组件成的大型存储网络
四、术语SAN的使用
在本书的余下部分,SAN这个词通常用于指主要用于传输块访问协议的网络。尽管在描述这种网络是最好使用“专有”这个词,但为了适应不可避免的IP协议数据传输,实际应用中我们不这样用。虽然也可以使用“扩展SAN”来说明这咱情况,但让读者在每翻到新的一页都遇到新的名词显然是不合理的。
并不是说在本章中大量讨论的块访问协议网络是仅有的SAN实用类型。这 仅使用同一种例子的原因是显简洁――这样在讨论仅在光纤路径产品中实现的SAN时,就没有必要使用那些麻烦的特定术语,或考虑不计其数的可能情况。
“存储网络”这个词在本书中用于指主要用于处理存储I/O数据传输的网络。有时会提到某些协议,通常是为了描述一些主要用于存储I/O数据的传输,而不考虑它使用的协议、网络设备或其他变量。在不久的将来,肯定会出现许多相关协议。一个简单的事实是,将存储I/O的功能集成到网络的时代已经拉开序幕了。正如许多广泛使用的术的发展一样,存储技术的发展将会带来许多变化。和其他所有关于计算机和网络的事务一样,存储技术将面对的是永无休止的变革。读者不应当被现在遇到的各种新名词挡住了未来的视线。