搜索

樊华:IBM数字图书馆动态存储基础架构

gecimao 发表于 2019-05-12 21:17 | 查看: | 回复:

  12月1日消息,由教育部科技发展中心主办,《中国教育网络》杂志承办的“2009(第四届)教育信息存储大会暨数据管理与虚拟化应用研讨会(杭州站)”在浙江大学举行。2009教育信息存储大会(杭州站)分论坛之·“数字图书馆发展模式探讨”。

  樊华:各位领导,各位专家,各位老师大家早上好,我叫樊华是来自于上海的一家公司,这边浙江大学实际上我来过几次,也是一些项目的交流,然后今天是感谢中国教育网络开这样一个会让大家跟我们分享一下IBM在数字图书馆这一块的已经架构,这一块的一些经验和解决方案,那么大家如果有问题的话可以随时提出来,我们来相互的交流,那么今天我带来了一个话题数字图书馆动态架构,那么讲的就是IBM的一个统一的存储分析。

  那么我的内容安排可能就这么几块,一个就是说分析数字图书馆的一些特点和对基础架构这一块的挑战,那么IBM的存储Ncurise的解决方案如何来解决或者说面临哪一些挑战,来为数字图书馆的建设提供更加多的一些价值,那么最后一个总结。

  那么这幅数实际上讲的就是我们国内数字图书馆发展的一个经历,这个经历可能是比较早期的,近期的可能大家都比较了解,实际上我这里面要提出来的一点就是说我们在1996年的时候,我们在国内数字图书馆的概念或者说这样一个方案就已经提出来了,其中是IBM公司跟清华大学的图书馆连锁在北京的62届的国际图联大会上就展示了这样数字图书馆的解决方案,所以说从解决方案的提出来讲IBM在一块应该是相对比较领先的,那么讲数字图书馆主要的优点大家也是非常清楚,一个就是说我们信息存储空间比较小,不像我们图书也好,另外因为我们IT的设备如果把图书信息数字化之后实际上我们比较采用一些设备和解决方案帮它做一些东西,然后信息数字化之后我们可以通过网络,通过内网也好可以非常方便的来检阅、查询,那么也可以非常方便的提供共享。那么另外一个好的地方就是说包括一些视频或者录音这些多媒体的资料都可以由图书馆来进行管理提供访问。

  那么数字图书馆据我所知像浙江大学建立非常成功的数字图书馆,规模也非常大,所以说我们这个数字图书馆的建设过程实际上都会面临一些业务特点和基础战略的一些要求。首先一个就是说信息是海量的,那么信息是海量的来源于因为我们这些图书的信息也好,多媒体的信息也好它叫非结构化信息,非结构化信息跟结构化信息有非常大的差别就是在于它每一场记录或者每一份资料它所占用的存储的空间是比较大的,我们以前讲结构化信息实际上就是一些数据库,一条记录的话可能只占有几K这样一种信息量,但是如果说是一张图片的话,我们不管是少到PPF或者一张图片都至少要几十K,如果清晰度高一点可能要几百K,这样的话这个信息量就非常大。尤其是我们图书的信息,我们学校的图书馆积累了多少年的这些信息,如果都把它数字化的话,这个信息量是海量的,所以说它还在不断的高速增长,那么这样的话当这个信息变成海量之后,那么你要对这个信息进行一个可靠性的保护和容灾这样一些操作或者备份相对来讲比较困难,还有一个我们的信息类型是比较多样化的,不单单是图书的信息,还有一些各种多媒体的信息包括文档、图片,那么要把这些我们称之为非结构化信息实际上是一个资源,是图书的资源,那么怎么样可以提供给学生也好,或者提供给老师也好非常方便的能查到这些他想要的信息呢?一定会有相应的数据库的管理。

  所以说这里面的信息如果简单分的话可以分为两大类,一个就是非结构化的信息,另外一个就是结构化的信息,这两种信息在一个数字图书馆里面都是需要的,那么信息的价值如果说我们把信息从这种物理转化当然可以提供分享、查阅非常的方便,但是带来另外一个问题有是我们需要转化的过程是投入相对比较大的,另外一个我们数字信息传输来看更容易造成信息的数字或者一些倒用,那么这样的话也需要我们对这个信息需要做到更好的保护。还有就是说它的访问也是更加便捷了,然后我们实际上图书馆的信息还是需要做长期保存的,那么长期保存的话有一些资料可能需要保证它的信息的连续性,就是说它一开始创建之后可能你要说几十年之内都要能够访问,但是你有没有手段保存在我磁盘上几十年的时间段这个信息是没有被串改过的,或者没有一些删除之类的写,有没有保护的手段,这些都对我们基础架构带来了一些要求。

  那么从IBM来讲我们认为就是说数字图书馆这样的建设的一个基础架构的目标实际上希望提供一种随需应变的信息服务,如果说把一个应用分为几个层面的话,实际上我们最上面的一层实际上是指的业务一些应用,一些共享的访问,那么中间这一层可能是中间的数据库或者一些业务平台,那么最下面是偏硬件的,这些信息的基础架构,那么实际上就需要说我们下面的基础架构需要能够提供一种向业务的架构,就是我希望这种基础架构必须要比较灵活,拓展比较容易,用非常完备的保护的手段来支撑我们数字图书馆的一个发展。

  那么我们讲IBM的N系列存储的方案对于数字图书馆的建设,相对于其他的信息架构来讲可能它提供了一些更多的价值来帮助我们建设这样一个数字的图书馆,我们讲大学的数字图书馆可能跟其他的一些业务不一样,这里面简单的列了一些,个就是说用的可能是校内内部为主,那么未来也不排除说我们提供一些校外的访问或者外部的访问,进行收费的一些服务等等。

  那么应用的平台应该是比较多样的,数据量应该是非常巨大。然后也有一定的数据的长期保存还有保证数字原始性的这样的需求,还有我们对性价比要求是比较高的。所以说我们投资回报一直是追求比较高的。这个特点实际上前面已经介绍过了这里就不多说了,那么这个是IBM的数字图书馆基础架构的一个简单的图,我们可以看到前面这些可能是一些业务的平台和一些服务器,那么服务器的话它访问信息有两种方式,一种就是通过实践的方式,因为我们信息类型是两类,一个是结构化信息就是数据库的,那么还有一类就是文件的资源共享,那么这两类信息的访问实际上我们通常是有一些不同要求的,对于数据库的检索这样一些访问我们希望它的性能是非常高,那么相应非常迅速,这个非常高非常迅速主要是针对哪一类的呢?叫做随机投选,他们随机投选这一块对存储的要求来讲一般来讲我们会比较建议说用一种光纤的介入,使得它的相应是最快的,它的流量可能并不是很大,但是它要求的是相应最快,并且能够支持大量的并发的一些访问请求,可以快速的检索到你信息,那么这个信息制订的信息资源实际上我们通常是以文件的方式保存的,那么这个文件方式保存我们讲这样的一些文件我们希望就是说这个文件保存有这样一个特点,就是说它希望它是一个共享的,比如说我可能从这台计算机可以访问到,从另外一台计算机也能够很方便的访问到。所以这就带来了我基础架构这一块有两种不同的架构,一种就是说是光纤接入这样一种数据库的访问,另外一种介入就是IP共享的这样一种访问,针对我们数字图书馆的两类不同的信息设的这两类的信息的需求。

  那么对IBM来讲这个N系列有一个非常大的特点,它是一个统一的平台,它即支持光纤的接入,又能支持这种IP的共享的接入,那么它在同一个存储之内,等于说我们建一个速度不是很快,如果说用传统的存储可能需要2类存储才能够为我们这个数字图书馆搭建一个负载比较均衡的,可以针对不同特性优化的这样一个平台,但是如果用了N的话只有一个设备就可以了,这个可以为我们的投资回报带来比较大的一个方便。

  然后再这个架构当中实际上我们讲我们这个信息基础存储的搭建起来之后带来的后续的一些管理上的问题,就是说这些信息一旦数字化之后我们需要得到把它可靠的一个被访保护,或者说我们需要考虑它的容灾,那么如果说用N系列的话,它可以很方便的向二级存储来进行一个备份的保护以及它的容灾后续会有介绍,那么这些数据都是这样的方式来进行这样一个容灾的,因为我们图书馆的信息是海量的,如果用传统的方式我们做一份备份可能会带来几千或者是2个星期做这样的一个备份,那么我们就需要一种什么呢?就需要一种增量的备用方式来保证说我们的信息虽然是海量的,但是我们的备份保护是有效的,可以在短时间内就能对它信息进行及时的保护。那么这个就是说N系列一个非常好的特点,那我们后面的话简单的几个比较有特点的这样一个针对N系列这样统一的存储架构,信息图书馆非常有特点的来进行一个介绍。

  特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。

  由中国互联网协会主办的2018(第十七届)中国互联网大会将于2018年7月10日-12日在北京国....

  吴建平院士CCTV-1开讲:中国互联网的新时代。1月27日晚十点半档,中国工程院院士,...

  本次大会旨在落实国家关于发展下一代互联网的战略部署,充分利用高校在互联网研究上的先发优势...

本文链接:http://hem-larm.com/dongtaicunchuguanli/449.html
随机为您推荐歌词
推荐文章

联系我们 | 关于我们 | 网友投稿 | 版权声明 | 广告服务 | 站点统计 | 网站地图

版权声明:本站资源均来自互联网,如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

Copyright @ 2012-2013 织梦猫 版权所有  Powered by Dedecms 5.7
渝ICP备10013703号  

回顶部