快捷搜索:  汽车  科技

网络存储的应用:存储网络Day10存储网络的应用

网络存储的应用:存储网络Day10存储网络的应用图6.2 I / O路径中的存储网络。逻辑I / O路径为存储网络的传输技术的定义提供了第二个观点。图6.2说明了从磁盘到应用程序的逻辑I / O路径,并显示了可以使用I / O路径网络中的哪些点。根据位置使用不同的应用协议。无论如何,可以使用相同的传输协议和传输技术。如果我们大大简化开放系统互连(OSI)参考模型,那么我们可以将存储网络协议广泛地划分为三个相互构建的层:网络技术,传输协议和应用协议(图6.1)。传输技术在几个终端设备之间提供必要的物理连接。基于这些,传输协议便于通过底层网络在终端设备之间进行数据交换。最后,应用程序协议确定最终参与者通过传输协议交换哪种类型的数据。传输协议有助于通过网络交换数据。除了使用久经考验且无所不在的TCP协议之外,本书的第一部分还介绍了光纤通道和虚拟接口架构(VIA)。传输协议可以直接基于传输技术,例如,光纤通道上的虚拟接口,InfiniBand或

在本书的第一部分,我们介绍了存储网络的基本构建块,如磁盘子系统,文件系统,虚拟化和传输技术。在本书的第二部分,我们的目标是展示如何组合这些构建块以满足IT系统的要求,例如灵活性,容错性和可维护性。作为第二部分的前奏,本章讨论了独立于特定应用程序的基本要求。

首先,第6.1节对比了各种网络的特性,以强调存储网络的形状。 6.2节介绍了存储网络中用于多个服务器之间的设备共享和数据共享的各种可能性。本章的最后一部分涉及IT系统的两个基本要求:数据的可用性(容错,第6.3节)和适应性(第6.4节)。

在接下来的章节中,我们将讨论网络备份(第7章),归档(第8章),业务连续性(第9章)和存储网络管理(第10章和第11章)等主要主题。

6.1术语“存储网络”的定义

根据我们的经验,关于存储网络的各种传输技术的定义的模糊性一次又一次地出现。因此,本节从各种角度再次说明了网络和存储网络。它考虑了各种协议和传输技术的分层(第6.1.1节),再次讨论了I / O路径网络中的哪些点可以实现(第6.1.2节),它再次定义了术语LAN(局域网)网络),MAN(城域网),WAN(广域网)和SAN(存储区域网)(第6.1.3节)。

6.1.1传输技术和协议的分层

如果我们大大简化开放系统互连(OSI)参考模型,那么我们可以将存储网络协议广泛地划分为三个相互构建的层:网络技术,传输协议和应用协议(图6.1)。传输技术在几个终端设备之间提供必要的物理连接。基于这些,传输协议便于通过底层网络在终端设备之间进行数据交换。最后,应用程序协议确定最终参与者通过传输协议交换哪种类型的数据。

传输协议有助于通过网络交换数据。除了使用久经考验且无所不在的TCP协议之外,本书的第一部分还介绍了光纤通道和虚拟接口架构(VIA)。传输协议可以直接基于传输技术,例如,光纤通道上的虚拟接口,InfiniBand或以太网,或者它们可以使用替代传输协议作为介质。示例是基于IP的光纤通道(FCIP)和基于光纤的IP(IPFC)。光纤通道定义了传输技术(FC-0,FC-1,FC-2)和传输协议(FC-2,FC-3)以及各种应用协议(FC-4)这一事实引起了额外的混淆。 。

应用程序协议定义通过传输协议传输的数据类型。关于存储网络,我们区分面向块的应用程序协议和面向文件的应用程序协议。 SCSI是面向块的数据传输的所有面向块的应用程序协议的母体。所有其他面向块的应用程序协议(如FCP,iFCP和iSCSI)都源自SCSI协议。面向文件的应用程序协议传输文件或文件片段。本书中讨论的面向文件的应用程序协议的示例是NFS,CIFS,FTP,HTTP和DAFS。

6.1.2 I / O路径中的网络

逻辑I / O路径为存储网络的传输技术的定义提供了第二个观点。图6.2说明了从磁盘到应用程序的逻辑I / O路径,并显示了可以使用I / O路径网络中的哪些点。根据位置使用不同的应用协议。无论如何,可以使用相同的传输协议和传输技术。

图6.2 I / O路径中的存储网络。

网络存储的应用:存储网络Day10存储网络的应用(1)

在卷管理器下面,使用了面向块的应用程序协议。 根据技术,这些是SCSI和SCSI分支,例如FCP,iFCP,iSCSI和FCoE。 如今,面向块的存储网络主要位于计算机和存储系统之间。 但是,在大型磁盘子系统中,SCSI电缆也越来越多地被网络传输技术所取代(图6.3)。

在卷管理器和文件系统上方,使用面向文件的应用程序协议。 在这里,我们找到了应用程序协议,如NFS,CIFS,HTTP,FTP和DAFS。 在第4章中,讨论了面向文件的应用程序协议的三个不同应用领域:传统文件共享,高速LAN文件共享和万维网。 在文件系统中实现网络的共享磁盘文件系统也应作为特例提及。

图6.3存储网络可以隐藏在磁盘子系统中。

网络存储的应用:存储网络Day10存储网络的应用(2)

6.1.3数据网络,语音网络和存储网络

今天,我们可以区分三种不同类型的通信网络:数据网络,语音网络和存储网络。术语“语音网络”指的是无所不在的电话网络。数据网络描述了20世纪90年代开发的用于交换应用数据的网络。数据网络根据范围细分为LAN,MAN和WAN。存储网络在第一章中定义为除现有LAN之外安装的网络,主要用于计算机和存储设备之间的数据交换。

在对存储网络的介绍中,存储网络通常称为SAN,并与传统LAN(具有低地理扩展的数据网络的术语)进行比较。光纤通道技术通常被用作整个存储网络类别的代表。这显然是因为光纤通道目前是存储网络的主导技术。有两个原因使我们比较LAN和SAN:首先,LAN和光纤通道SAN目前具有大致相同的地理范围。其次,除容量瓶颈外,目前必须为LAN和SAN安装单独的网络,因为底层传输技术(以太网或光纤通道)不兼容。

我们认为,三种网络类别 - 存储网络,数据网络和语音网络 - 很可能在未来融合,TCP / IP或至少以太网是所有三种网络类型共同使用的传输协议。我们在3.5.2和3.7.1节讨论了以太网上存储网络的经济优势。我们将其视为IP语音传输(IP语音,VoIP)的经济优势的指示,越来越多信誉良好的网络制造商正在提供VoIP设备。

6.2存储共享

在本书的第一部分中,您多次听说存储网络的一个优点是多个服务器可以通过存储网络共享存储资源。在这种情况下,存储资源意味着存储设备(如磁盘子系统和磁带库)以及存储在其上的数据。本节讨论基于磁盘存储池(第6.2.1节),动态磁带库共享(第6.2.2节)和数据共享(第6.2.3节)的示例的存储设备共享和数据共享的各种变体。

6.2.1磁盘存储池

磁盘存储池描述了多个服务器共享磁盘子系统容量的可能性。在以服务器为中心的IT架构中,每个服务器都拥有自己的存储:图6.4显示了三个具有自己存储的服务器。服务器2需要更多存储空间,但服务器1和3中的可用空间无法分配给服务器2.因此,即使其他服务器上有可用的存储容量,也必须为服务器2购买更多存储空间。

在以服务器为中心的IT架构中,可以更灵活地分配存储网络中可用的存储容量。图6.5显示了与图6.4相同的三台服务器。两个图中安装了相同的存储容量。但是,在图6.5中,只存在一个存储系统,它由多个服务器共享(磁盘存储池)。在这种安排中,可以通过重新配置磁盘子系统为服务器2分配额外的存储容量,而无需改变硬件或甚至购买新的磁盘子系统。

图6.4不灵活:以服务器为中心的系统中的存储分配。服务器2无法使用服务器1和3的空闲存储空间。

网络存储的应用:存储网络Day10存储网络的应用(3)

图6.5更好:以存储为中心的IT系统中的存储池。 可以为所有服务器分配空闲存储容量。

网络存储的应用:存储网络Day10存储网络的应用(4)

在第5.2.2节(“存储网络的实现相关限制”)中,我们讨论了在许多情况下,来自不同制造商的多个存储设备的存储池有限。主要原因是各种磁盘子系统的设备驱动程序不兼容。在第5章的进一步过程中,我们展示了存储网络中的虚拟化如何有助于克服这些不兼容性,此外,还可以进一步提高存储池的效率。

6.2.2动态磁带库共享

磁带库(如磁盘子系统)可以在多个服务器之间共享。在磁带库共享中,我们区分磁带库的静态分区和动态磁带库共享。在静态分区中,磁带库被分解为几个虚拟磁带库;每个服务器都分配了自己的虚拟磁带库(图6.6)。磁带库中的每个磁带驱动器和每个磁带都明确地分配了一个虚拟磁带库;所有虚拟磁带库共享介质更换器,用于将磁带盒移回,以及插槽和磁带驱动器之间。与磁带库共享相比,将磁带和磁带驱动器分配到某个虚拟磁带库的重新配置是昂贵的。

磁带库共享提供了更大的灵活性(图6.7)。在这种方法中,各种服务器动态协商哪些服务器使用哪些磁带驱动器和磁带。为此,一个服务器充当库主服务器,所有其他服务器充当库客户机。库主控制器协调对磁带库的磁带和磁带驱动器的访问。如果库客户端希望将数据写入新磁带,那么它首先会从库主控器请求一个免费磁带。库主机从可用磁带存储区(临时池)中选择磁带并将其放在空闲驱动器中。然后它在其数据库中记下这个磁带现在正被库客户端使用,它通知库客户端磁带所在的驱动器。最后,库客户端可以通过存储网络将数据直接写入磁带。

图6.6磁带库的分区将磁带库静态分解为多个虚拟磁带库。每个服务器都分配有自己的虚拟磁带库。服务器仅共享介质更换器以移动磁带。

图6.7磁带库共享:库客户端通知库主站它想要写入空闲磁带(1)。库主机将免费磁带放在空闲驱动器(2)中,并将相应的信息发送回库客户机(3)。然后,库客户端直接通过存储网络(4)写入。

网络存储的应用:存储网络Day10存储网络的应用(5)

与其中每个磁带和每个磁带驱动器静态分配给某个服务器的磁带库的传统分区相比,磁带库共享的优点是磁带和驱动器是动态分配的。根据要求,有时一台服务器,有时另一台服务器可以使用磁带或磁带机。

这要求所有服务器根据相同的规则访问磁带库。磁带库共享目前是存储网络上网络备份的重要组成部分(第7.8.6节)。但是今天,不同的应用程序 - 无论是在同一服务器上还是在不同的服务器上 - 都不能参与网络备份系统的磁带库共享,因为没有通用的同步协议。但是,一些带有内置库管理器的磁带库支持动态磁带库共享,但这要求应用程序集成相应库管理器的专有API。从长远来看,这些专有API需要标准化,以降低跨异构应用程序和异构磁带库边界的库共享成本。 IEEE 1244可移动介质管理标准(第11.5节)确切地指定了用于磁带库共享的这种接口。

6.2.3数据共享

与前面讨论的设备共享(磁盘存储池,磁带库分区和磁带库共享)相比,其中多个服务器在块级共享存储设备,数据共享是由多个应用程序使用的公共数据集。在数据共享中,我们区分数据复制和实时数据共享。

在数据复制中,顾名思义,数据被复制。这意味着保留了几个版本的数据,这基本上是一件坏事:每个数据副本都需要存储空间,必须注意确保在适当的时间根据应用程序的要求复制不同的版本。特别是在维护各种版本的数据集时会出现错误,因此后续应用程序会重复使用错误的数据。

尽管存在这些缺点,但在生产环境中使用数据复制。原因可能是:

生成测试数据

生产数据的副本有助于测试新版本的应用程序和操作系统以及测试新硬件。在1.3节中,我们使用服务器升​​级的示例来说明如何使用磁盘子系统中的即时副本生成用于测试新硬件的测试数据。这里的重点是应用程序暂时中止,以保证复制数据的一致性。作为即时副本的替代方案,还可以使用文件系统中的快照生成测试数据。

数据保护(备份)

数据保护的目的是在不同位置保持最新的数据副本,作为防范硬件丢失或操作错误的预防措施。数据保护是存储网络领域的重要应用。因此,它在第7章中单独处理。

Archiving

归档的目标是冻结当前版本的数据,以便以后可以进一步使用。许多年或几十年可以在归档和数据的进一步使用之间传递。由于信息的数字存储的增加,数字存档变得越来越重要。因此,我们在第8章单独论述。

数据复制

数据复制是复制数据的名称,用于访问地理位置相距较远的计算机上的数据。数据复制的目标是加速数据访问并节省网络容量。有许多应用程序可以自动复制数据。在万维网中,数据在两点复制:首先,每个Web浏览器缓存本地数据,以加速对单个用户频繁调用的页面的访问。其次,许多Internet服务提供商(ISP)安装了所谓的代理服务器。这会缓存许多用户访问的网页内容。数据复制的其他示例包括FTP服务器(FTP镜像),安德鲁文件系统(AFS)中的复制文件集或分布式计算环境(DCE)的分布式文件系统(DFS)的镜像,以及邮件数据库的复制。

转换为更有效的数据格式

通常需要将数据转换为不同的数据格式,因为某些计算在新格式中更便宜。在袖珍计算器对数经常用于计算之前的几天,因为例如,对数的加法产生与原点空间中的乘法相同的结果,仅更简单。出于同样的原因,在现代IT系统中,数据被转换为不同的数据格式。例如,在数据挖掘中,来自各种源的数据在数据库中汇集在一起​​并转换成数据格式,其中对数据集中的规则性的搜索更简单。

转换不兼容的数据格式

复制数据的另一个原因是不兼容数据格式的转换。一个典型的例子是,最初彼此独立开发的应用程序随着时间的推移而被整合在一起。

实时数据共享代表了数据复制的替代方案。在实时数据共享中,所有应用程序都在单个数据集上工作。实时数据共享可节省存储空间,避免了与多个数据版本管理相关的成本和错误,所有应用程序都可以处理最新的数据集。由于上述数据复制的原因,通过实时数据共享替换不兼容数据集的转换尤为重要。

应用程序和数据的逻辑分离在实现中继续。通常,文件系统和数据库形式的应用程序和数据安装在不同的计算机上。这种物理分离有助于整个系统的适应性,从而有助于可维护性。图6.8显示了几个应用于单个数据集的应用程序,其中应用程序和数据彼此独立地进行管理。这具有以下优点:可以引入新的应用程序而不必更改现有的应用程序。

但是,在图6.8所示的配置中,应用程序可能会产生如此多的负载,导致单个数据服务器成为瓶颈,并且负载必须在多个数据服务器之间进行分配。在没有数据复制的情况下,有两种方法可以解决这个瓶颈:首先,可以通过将数据集拆分到多个数据服务器来对数据集进行分区(图6.9)。如果这还不够,那么可以为同一数据集建立几条并行访问路径(图6.10)。并行数据库和共享磁盘文件系统(如4.3.1节中介绍的通用并行文件系统(GPFS))提供了必要的功能。

图6.8实时数据共享导致应用程序和数据分离:多个应用程序在同一数据集上工作。

网络存储的应用:存储网络Day10存储网络的应用(6)

图6.9通过分区数据集对数据服务器进行静态负载平衡。

图6.10并行数据库和共享磁盘文件系统对数据服务器的动态负载平衡。

网络存储的应用:存储网络Day10存储网络的应用(7)

猜您喜欢: