海量数据存储方案-资讯-B.P商业伙伴-数字生态综合服务平台

首页 > 焦点要闻 > 海量数据存储方案

海量数据存储方案

2014-06-18 15:08　　来源：商业伙伴　　

基本信息

面向行业

政府金融制造业教育交通物流医疗

应用领域

海量数据的理想存储方案随着信息化建设的不断深入，企业级的信息管理平台已经完成了从信息化建设到数据积累的职能转变，在一些信息化起步较早、系统建设较规范的行业，如通信、金融、大型生产制造等领域，海量数据的存储、分析需求的迫切性日益明显。以移动通信运营商为例，随着移动业务和用户规模的不断扩大，每天都产生海量的业务、计费以及网管数据，然而庞大的数据量使得传统的数据库存储已经无法满足存储和分析需求。主要面临的问题包括： 1、数据库容量有限：关系型数据库并不是为海量数据而设计，设计之初并没有考虑到数据量能够庞大到PB级。为了继续支撑系统，不得不进行服务器升级和扩容，成本高昂，难以接受。 2、并行取数困难：除了分区表可以并行取数外，其它情况都要对数据进行检索才能将数据分块，并行读数效果不明显，甚至增加了数据检索的消耗。虽然可以通过索引来提升性能，但实际业务证明，数据库索引作用有限。 3、针对J2EE应用来说，JDBC的访问效率太低，由于java的对象机制，读取的数据都需要序列化，导致读数速度很慢。 4、数据库并发访问数太多，会导致I/O瓶颈和数据库的计算负担太重两个问题，甚至出现内存溢出崩溃等现象，但数据库扩容成本太高。理想的解决方案是把大数据存储到分布式文件系统中： 1、只要增加机器和硬盘，则容量不限，理论上数据可以无限扩大； 2、并行取数容易，由于文件可以根据字节数来访问，可以直接定位从第n字节开始读取，到第m字节读取结束，不存在检索划分数据块的问题； 3、不存在IO瓶颈。由于分布式文件系统是把数据存储到不同机器上，并行/并发读数时，分别从不同的机器读数，有效规避了IO瓶颈问题； 4、用java读数时，虽然同样存在序列化的问题，但是避开了JDBC，避免了JDBC带来的性能问题； 5、数据计算可以使用单独的计算引擎，计算引擎可部署于廉价的PC上，可以以很低的成本较为容易的实现并行，增加并行节点成本比数据库扩容成本低很多。当前比较流行的分布式文件系统包括：Lustre、HDFS、MogileFS、FastDFS、NFS等。 Lustre是由SUN公司开发、在linux下运行的以C/C++开发的集群并行文件系统，采用分布式的锁管理机制来实现并发控制，元数据和文件数据的通讯链路分开。虽然在性能、可用性和扩展性上有一些优点，但其缺点也同样明显：需要特殊设备的支持，而且分布式的元数据服务器管理还没有实现。 MogileFS是一个开源的分布式文件系统，主要特点包括：应用层组件、无单点故障、自动文件复制、具有比RAID更好的可靠性、无需RAID nigukefs支持等，缺点包括：用Perl编写，有依赖模块的问题，安装过程中需要其他库和模块的支持，对于不懂perl的人，安装和使用很困难。MogileFS不支持对一个文件内部的随机或顺序读写，不支持视频拖动，因此只适合做一部分应用，如图片服务、静态HTML服务等。另外，MogileFS过度依赖数据库，包括它的高可用性也需要靠数据库的HA实现，官方文档也比较缺乏，没有详细的使用说明。 FastDFS是一个专用的文件系统，和MogileFS比较类似，需要使用专门的API来访问，不是通用的文件系统，不能mount成path的形式使用。只使用于一些特定的应用领域，比如网站存储图片、视频文件等。

NFS。优点是:Linux直接在内核予以支持，使用方便,发展多年，比较成熟。缺点：可扩展性差，难以应用于大量存储节点和客户端的集群式（cluster）系统；文件服务器的定位（location）对客户端不透明，维护困难；缓存管理机制采用定期刷新机制，可能会产生文件不一致；不支持数据复制、负载均衡等分布式文件系统的高级特性，很容易出现系统的性能瓶颈；另外，NFS服务器的更换需要系统暂停服务，对于异地服务的支持能力不够。总的来说，NFS太老了，对于追求海量数据吞吐量、存在成千上万个客户端和存储节点的互联网应用来说有点力不从心。 HDFS是Hadoop的文件系统，其目的是向应用数据提供高吞吐量访问的分布式文件系统，是GFS的开源实现。其最大的优点包括：无需替换现有系统，而是利用该分布式文件系统增强现有系统的处理能力。一方面，HDFS可以从已有系统上接手海量数据的处理，使已有系统可以专注于其设计目的，如实时交易数据处理、交互式商业智能，这些海量数据处理包括但不限于同步数据吞吐、处理、交换大规模数据等。另一方面，HDFS可以从任意多的数据源吞入任何类型的数据，来自多个数据源的数据可以按任何需要的方式合并或聚合，从而实现任意单一系统无法实现的深度分析。 HDFS不处理索引和关系，所以在HDFS中存储数据时不用考虑将来如何分析这些数据。在和数据库交互方面，HDFS支持JDBC，而大部分数据库都支持数据的批量导入/导出。所以无论哪种情况，将整个数据库中的数据经常性的或者以增量的方式导入到HDFS中很容易实现。大多数时候，HDFS可以被设计为存储海量数据以及按需要向任意系统传递数据，数据可以经常性地从关系型数据库系统导入到HDFS中，经过这样的调整，关系型数据库可以专门用来处理交互式任务，而复杂的分析工作就可以按离线的方式交由HDFS来完成，对实施系统没有任何影响。综上所述，海量数据比较理想的存储方案是分布式文件系统，而分布式文件系统中，HDFS是比较理想的一款。

　0个人觉得赞

相关文章
标签：
海量数据存储方案

卡地亚与猎豹：风格视野 ——卡地亚连续六年参展中国国际进口博览会2025/11/6

SAP 赋能开发者，引领商业 AI 革新2025/11/5

6.9元起的茶瀑布，如何成功牵手毛不易？2025/11/1

Akamai与NVIDIA强强联手，以Inference Cloud开启AI智能新纪元2025/10/31

CNCC2025专题论坛发布“AI+X落地热力图”，Token驱动成为规模化应用核心密码2025/10/30

多维无界，观测有道! Bonree ONE 2025秋季版全球发布！2025/10/29

热点推荐SAP大数据生态圈高层圆桌会议

北京圣邦天麒科技有限公司

规模：50-200人

网站： http://www.sinptech.com

北京圣邦天麒科技有限公司成立于2005年，注册资金3050万，自有资产4800万，现有员工230余人。十余年来一直潜心专注服务教育及政府行业用户，以不断创新的思...

展开

北京圣邦天麒科技有限公司成立于2005年，注册资金3050万，自有资产4800万，现有员工230余人。十余年来一直潜心专注服务教育及政府行业用户，以不断创新的思想在教育和政府领域持续拓展。以知名品牌教育行业总代理为依托，为全面建设智慧校园提供包括系统集成、软硬件定制在内的整体解决方案。并把软件研发作为公司的核心发展战略目标，先后分别成立了“圣邦研究院、华人研究院、同步研究院”。随着研发投入持续增加，多项自主研发技术和产品获得国家专利。凭借专业技术水平和国家专利优势，公司已圆满完成一系列创新型教学项目。着眼未来，公司将着力于以教育科技和教育资源的开发与应用为主导，注重对新兴教育理念的探索，全面打造立体化交互式“智慧校园”。力争成为一家卓越的、推动对民族教育事业繁荣昌盛有贡献的企业。公司在“团队打天下、管理定江山”的企业持续建设中，以创新为灵魂，以服务为宗旨，以用户为中心，充分理解需求，全面满足需求，以优质品牌和专业服务赢得信任和肯定。公司在“同心走得更近、同德走得更远”的发展理念下，坚持“学习发展、创造价值”的核心价值观，凝聚了一大批高素质经营管理与科研人才。领先的技术、创造性的研发和高精尖人才，为公司发展注入了生生不息的原动力。公司拥有系统集成三级资质、国家高新、双软认证、ISO9001、中关村高新企业、音视频二级、AAA信用等级等证书。公司管理人员中有多人拥有信息系统项目管理师、中高级系统集成项目管理工程师、PMP证书。多人获得工信部、建设部等相关专项设计、施工和管理认证。凭借公司雄厚的技术实力，可为用户提供顶层规划、软件开发、方案设计、系统集成、售前咨询、售后支持、网络互联、技术培训等多种服务为一体，以卓越的信誉和品牌树立行业典范。随着信息技术的高速发展，数字化时代的来临和新媒体的广泛应用，公司不断开拓、深化和完善智能校园建设方案，尤其是站在“互联网+”的前沿下。将全面整合跨领域的技术、跨行业的应用，让“智慧协同、应用舒服”这一理念真正落地走进用户工作和生活中去。圣邦天麒以做“负责任的企业”为立足之本，充分尊重和信任员工的文化企业，倡导“民主和科学”的管理方式，注重团队协作型技术企业，以“技术来源于需求，服务贡献给用户”的发展宗旨，为教育信息化建设这一伟大而神圣的事业贡献绵薄之力而奋斗不息!公司资质北京政府采购定点单位中央政府采购定点单位区县政府采购定点单位国家高新技术企业证书中关村高新技术企业证书计算机软件著作权登记证书软件企业认定证书、软件产品登记证书计算机信息系统集成企业叁级资质证书安防工程企业资质证书叁级 ISO9001：2008质量管理体系认证证书ISO14001：2004环境管理体系认证证书 AAA级重合同守信用企业认定证书AAA级重质量守信用单位认定证书 AAA信用等级证书音视频资质壹级证书公司组织机构公司主营业务公司主营业务：软件产品销售、系统集成、大型运维。主要服务对象：教育以及政府行业用户需求。公司以：“学习发展，创造价值”的发展理念吸纳社会专业技术人才50余名，其中80%以上员工具有学士学位。在工程师中有多人拥有CCIE、Cisco、华为、Nortel、CCNP 、Avaya、JNCIS 、IBM、JNCIA、Sun、RCCP、 Microsoft、Cabletron、NOVELL等公司的各种资格证书。多人获得信产部、建设部等相关专项设计、施工和管理认证。凭借公司雄厚的技术实力，可为用户提供从产品销售推广、方案设计、售前咨询、系统集成、网络互联、售后支持、软件开发、培训等多种服务。圣邦天麒一直致力于教育信息化建设，并把软件研发作为公司的核心发展战略目标。智慧校园的建设，创新产品，自主研发才是核心竞争力！公司拥有雄厚的科研实力，积累了丰富的市场资源，凝聚了一大批高素质经营管理人才。经过八年的不断创新和锐意进取，圣邦天麒已发展成为集科研、开发、制造、应用、服务于一体的大型综合性高科技企业。领先的技术、创造性的开发是公司发展的原动力。针对教育领域各类用户的实际需求，圣邦天麒在采用业界最先进技术基础上，推出基于自有设备为核心的大型智慧校园信息化系统。目前，公司拥有完整自主知识产权的系统产品包括：机房预约管理系统、心理预约管理系统、心理测评系统、教学管理测评系统，论文管理系统。规范的企业标准，成熟的软件模型，稳定的产品性能通过了中央电化教育馆、国家软件评测中心、国家广电质监中心等权威机构鉴定。过硬的产品质量是公司制胜的法宝，服务至上的理念是公司发展强大的后盾。圣邦天麒是中央国家机关政府采购协议供应商、中共中央直属机关政府采购协议供应商、北京市政府采购定点供应商，也是北京多所高校和多个区县政府的定点供应商和服务商。公司注重与教育集成领域的知名企业建立战略合作伙伴关系，先后有华为、HP、联想、SUN、锐取、IBM、Juniper、H3C、思科、锐捷、等著名IT设备厂商在教育行业的核心合作伙伴并为教育行业的广大用户提供IT解决方案服务。圣邦天麒以做“负责任的企业”为立足之本，充分尊重和信任员工的文化企业，倡导“民主和科学”的管理方式，注重团队协作型技术企业，以“技术来源于需求，服务贡献给客户”的发展宗旨为教育信息化建设贡献绵薄之力而奋斗不息。企业文化公司愿景教育行业自主研发知名品牌核心业务软硬件自主研发，教育系统集成核心价值观学习发展，创造价值

收起

粉丝1

关联信息

海量数据存储方案

基本信息

相关文章

北京圣邦天麒科技有限公司