巨杉王涛:立足新一代分布式数据库 打造企业大数据发展新引擎

[摘要]  创新改变中国,创新改变世界。创新已经上升到了国家战略,科技创新正成为掌控全球科技竞争先机的利器。  在技术创新领域,国内的一家
  创新改变中国,创新改变世界。创新已经上升到了国家战略,科技创新正成为掌控全球科技竞争先机的利器。

在技术创新领域,国内的一家分布式数据库企业屡次登上各种创新企业的排行榜。他们在2016年,成为首家入选硅谷“大数据生态象限图”的中国厂商,同时在2015、2016年连续获得硅谷最具影响力创新商业媒体《红鲱鱼》的“全球创新企业100强”之后,又连续两年入选美国知名科技媒体《快公司》评选的“中国50大创新公司”榜单。更重要的是,他们的产品已经得到包括民生银行、广发银行、中国移动在内的几百家大型企业用户的规模使用和好评。

这家企业就是SequoiaDB巨杉数据库,它推出了业界广被看好的分布式数据库产品SequoiaDB巨杉数据库。巨杉创新成果能得到业界普遍认可,被广大企业级用户所接受被,背后的原因到底是什么?

巨杉数据库联合创始人,CTO王涛在接受中国软件网记者采访时,道出了其中秘密。2016年,在全球发展大环境下,身处转型期的中国经济,既需要以大数据为代表的新兴经济的推动,也需要用互联网、大数据技术改造和提升传统产业,正像李克强总理所说,二者的融合发展,将打造出中国经济发展的“双引擎”。而巨杉打造的新一代分布式数据库产品SequoiaDB巨杉数据库,既能为企业应用提供高效可靠的分布式数据库架构,又能通过丰富的行业经验,使企业级大数据应用快速落地和见效。

立足企业需求,发展新一代分布式数据库

巨杉数据库创始人王涛曾在IBM DB2北美实验室工作多年,对传统关系型数据库有一个非常清晰的认知,既了解其特性,又能感悟到其不足。

因此他意识到了旧技术在大数据时代的的缺陷和不足,同时也看到了企业市场对于新一代分布式数据库的巨大需求。之后便率领的团队开发出了新一代分布式数据库——SequoiaDB巨杉数据库。

这款产品具有两项超乎想象的优势:第一,完全分布式的架构,对于数据量和数据处理性能上可以实现近乎无限的扩展。第二,使用非结构化的存储,既支持传统的关系数据模型,又可以支持其他灵活类型的数据存储,包括非结构化数据等。企业传统数据库应用依然可以在其上运行;第三,支持标准SQL作为其主要的接口,同时还提供了多种企业级解决方案。

巨杉数据库完全是巨杉团队编写的,因此毫无疑问,巨杉数据库是自主研发并拥有完全自主知识产权的产品,没有基于任何其他外部的开源数据库源代码。巨杉SequoiaDB支持标准SQL、事务操作、高并发、分布式、可扩展与双引擎存储等特性,并已经作为商业化的数据库产品开源。

适应新需求,数据库市场格局悄悄发生变革

此前,国内数据库市场是以传统的关系型数据库为主,而在传统关系型数据库市场,国外的几家企业的产品包括Oracle、DB2等一直占据主流。

近些年,随着国内软件技术的不断提高,很多新兴数据基础架构软件厂商崛起,在新的大数据应用领域开始占据主动。目前市场上也涌现出了很多国产数据库厂商。

王涛说,很高兴地看到,包括巨杉在内的新型分布式数据库企业都在进行良性的差异化竞争,客户在选择数据库产品时也会考虑这些差异点。“我们主要定位于‘新型分布式数据库’这个垂直领域,目前国内完全自主研发并且能够在企业级中进行成熟应用的企业其实不多,主要以海外开源架构产品的本地化为主,因此,拥有完全自主知识产权的巨杉分布式数据库具有很大优势的。”

坚持技术创新,更重视应用创新

作为一款分布式NewSQL数据库,SequoiaDB 在技术上实现了很多创新,如支持标准SQL、事务操作、高并发、分布式、可扩展与双引擎存储等方面。SequoiaDB 还通过深度集成最新的Spark 内存计算框架,实现了批处理分析、流处理等贴近应用的功能。

市场更看重是巨杉在企业级市场商业化应用的创新。此前,NoSQL/NewSQL数据库领域主要以互联网、移动开发应用场景为主,而巨杉在公司发展的5年多的时间里,通过深耕企业级市场,发掘出了NewSQL数据库的企业级应用场景,如对历史数据的全量在线应用,非结构化数据应用、企业内容管理以及海量数据数据湖等。

数据全量在线就是企业级应用一个典型的例子。在这一场景中,巨杉的NewSQL数据库替代了传统的数据架构中的ODS(贴源层),作为全量历史数据的存储层。一方面为DW数据仓库部分进行了"瘦身",另一方面也能实现对海量的历史数据的实时操作,包括实时查询和高性能读写等。

除了历史全量数据以外,在记录/文件"双引擎"的部分,巨杉数据库的块存储引擎还能处理海量的非结构化数据的存储,包括图像、音视频等数据的存储,成为传统企业内容管理(ECM)的有力替代。

让企业的大数据快速落地

王涛认为,从业务场景上来看,企业目前的大数据业务目前主要分为分析类和交互类,巨杉数据库大的发展方向是以实时交互类为主。在交互类领域,NewSQL将是Hadoop体系架构的有力补充,也是目前企业级大数据应用中落地和见效最快的部分,如近线数据管理和查询、非结构化数据和影像数据管理、用户画像、数据湖平台等场景,都非常适合用巨杉数据库这样的新一代分布式数据库。

目前,巨杉数据库更专注于企业级的数据库技术,帮助企业大数据快速落地,而这些新的特性也在市场上得到了众多客户的认可。巨杉的客户包括金融、电信、政府等多个行业,这些领域无论是对海量数据的存储能力,还是响应速度、稳定性等方面的要求都很高,其中绝大多数企业以前采用的都是国外的产品。

这些客户采用巨杉数据库说明几个问题,一方面,这些规模应用的案例说明,巨杉产品的功能是完全可以替代海外产品;另一方面,因为每个行业都有或大或小的差异,巨杉并非只是为客户提供一套产品或者解决方案。除此之外,巨杉相对于国外品牌而言,能提供基于原厂的服务和技术支持。

王涛说,SequoiaDB巨杉数据库是一款完全自主研发,没有基于任何其他外部的开源数据库源代码的分布式NewSQL数据库产品。除此之外,巨杉数据库作为一款企业级的成熟商业化产品,仍选择将自己的数据库进行开源。这既符合国家和企业对于“国产化”“自主可控”的要求,同时也是增强用户对巨杉的认可度以及展现巨杉的技术研发团队信心的一个重要举措。




版权声明:

凡本网注明”来源:中国软件网(http://www.soft6.com)”的所有作品,版权均属于中国软件网或昆仑海比(北京)信息技术有限公司,未经本网书面授权,不得转载、摘编或以其它方式使用上述作品。

任何行业、传播媒体转载、摘编中国软件网(http://www.soft6.com)刊登、发布的产品信息及新闻文章,必须按有关规定向本网站载明的相应著作权人支付报酬并在其网站上注明真实作者和真实出处,且转载、摘编不得超过本网站刊登、转载该信息的范围;未经本网站的明确书面许可,任何人不得复制或在非本网站所属的服务器上做镜像。

本网书面授权使用作品的,应在授权范围内使用,并按双方协议注明作品来源。违反上述声明者,昆仑海比(北京)信息技术有限公司将追究其相关法律责任。