CDEC2020 搜索 导航菜单

天天都在数据驱动,你以为数据是天上掉下来的?

[摘要]急剧攀升的数据规模和数据释放的巨大价值,让所有人都对数据萌生敬意。

0

阿里巴巴总参谋长曾鸣为智能商业赋予了三个基石:活数据、算法和产品。从这里就可以看出来,数据是排在第一位的,并且算法和产品都是在为数据服务。如果简单的理解一下,可以认为智能商业时代,一个最重要的范式就是数据驱动。

对于圈内人或者媒体人来说,数据驱动这个词已经听的耳朵生茧了。大到沃尔玛、亚马逊、谷歌这样的巨头企业,小到浪潮董事长口中那个想找他用大数据确定拉面馆选址的小伙子,都在搞数据驱动。

急剧攀升的数据规模和数据释放的巨大价值,让所有人都对数据萌生敬意。

1

高度聚焦数据的Informatica,试图帮助企业实现数据驱动的生意。“如果放在10年前Informatica刚进入的中国的时候,大家会觉得我们just so so”Informatica亚太和日本区资深副总裁Murray Sargant说道。


Informatica亚太和日本区资深副总裁Murray Sargant

显然,我是同意这句话的。2007年的时候,国内的企业还走在信息化的路上,不停地买服务器,买数据库,在各个部门搭建业务应用,因为企业运转经营的核心是业务流程。在当时,或许很多人不会怀疑这些动作的正确性,但是一个隐患也悄然埋下了:各个系统之间的信息孤岛,让存储在本地数据库中的数据无法有效流转,更加不能很好的利用起来。

所以现在,很多企业迷茫了:我该怎么实现数据驱动?数据都被行业的寡头给垄断了,我的数据在哪里?

在这样的背景下,Murray Sargant可以很有底气地说这样一句话:属于Informatica的时代真的是到来了。

有些期待,在大家心里还是一个提供数据集成服务的厂商,可以有信心在今天说出这样一句话,即使Informatica可以连续很多年保持在Gartner的领导者象限里。

这种期待主要来自于Informatica的蜕变。今年5月,Informatica更换了公司logo,其定位也从ETL工具转变成为了一家企业云数据管理综合解决方案的提供商。

2

且不说1993年Informatica刚成立的时候,就是2007年刚进中国时,也只不过是一家做数据集成还不错的公司。彼时,Informatica最擅长的事情就是把客户存在不同数据库中的数据,集成在同一个标准化数据平台上,以便进行数据分析。

就凭借这一项能力,当时Informatica就在中国相当吃香,并迅速积累了上千家企业客户。上文说过,在当时中国粗放式IT建设的背景下,数据孤岛现象十分严重。虽说当年还没有谁提正式提出过数据驱动的概念,但是必要的数据分析,依然备受重视。

而在2009年阿里云正式成立之后,大量的提供云服务的公司逐渐活跃在国内市场,云计算带来的无可比拟的计算能力,让很多公司开始往云上迁移,把原来存在Oracle中的数据,往云数据库中丢。这时候,云计算带来的交互能力,让数据变“活”了,同时也产生了更大量的数据。以至于后来的移动互联网、物联网等技术的出现,更是打开了数据的桎梏。自此,数据量的爆发,一发不可收拾。

看到了数据带来的巨大价值,尤其是在马云发表了关于DT时代的演讲后,越来越多的公司想要知道如何利用潜藏在数据库中的数据,如何实现数据驱动。但是,很多时候企业没有搞明白一点,他们的最终目的不是要利用数据,而是要挣钱。要挣钱,就要让数据和业务紧密地连接在一起。

想到这儿,你再回头看Informatica在2016年发布的智能数据湖,你会觉得这个产品是如此的切合时宜。这款产品用IT工具取代了数据工程师的数据查找、集成等管理服务,由此拉动了业务部门对于数据的处理能力。

3

这还不够!

中国的互联网、移动互联网发展到今天,形成了大量以社交为核心的交互网络,包括大家常用的微博、微信、百度贴吧、知乎等等。要知道,这些社交网络上的数据多到无法想象。

对于一家初创企业来说,在缺乏企业内部运转数据的支持下,这些来自社交网络的数据几乎可以撑起半边天。

所以,在Informatica推出客户数据管理以及产品数据管理两个维度的数据管理产品线之后,有了第三个维度——去管理那些存在社交网络中的非结构化数据。

我很喜欢Murray Sargant的这样一句话,我们不仅要关心本地的数据库,还要关注存在Hadoop等开源系统的数据;不仅要关注云中的数据,还要关注在云外的数据;不仅要关心结构化数据,还要关心非结构化的数据。

Informatica会把这些数据放在一起,用同一种视角为客户提供统一的数据管理、数据质量、云集成等数据服务,最终形成现在的EIC产品或者说统一数据目录。

到了这一步,你会发现Informatica的价值仍然专注在数据本身,而不去触及更深入的那一层,这也正是Informatica可怕的专注所在。

包括现在Informatica非常喜闻乐见的AI。

上文中提到的智能数据胡这样一个产品,就是AI技术的结晶。显而易见的是,Informatica所倡导的AI技术更加专注于数据本身,用机器化的能力取代人力去管理上百万甚至是上千万行的数据,。

4

现在,如果再把数据在哪里这个问题提出来,似乎就有点low了,但是并不妨碍这是一个足以让无数代人持续去研究的一个话题。

纵观我们对数据认知的过程,我想借用Murray Sargant对于数据的比喻并稍微引申一下:当我们还处于手工记账的年代时,我们的注意力就在我们的身边,就在地球上,看到什么就用纸和笔记录下来;当企业逐渐走上信息化的道路,并且有了各种各样的应用和数据库,我们的注意力开始延伸太阳系或者银河系,我们希望做好数据集成,就像我们会研究卫星、行星、恒星甚至河内星系之间的关系;而当社交网络出现后,大量的非结构化数据在不断生成与流转,我们逐渐发现了大量的河外星系,并且是那么的灿烂。

别忘记了,现在这个阶段,物联网仍然是方兴未艾。很难想象在未来,在那个属于物联网、车联网等等万物互联的时代,数据是一个怎样的规模,河外星系、甚至是宇宙的外面是一个怎样的风景。

5

那个时候,或许大数据的概念会逐渐淡化,没人会再次提起。但是,数据已经融入每一个角落,大家不在意却散发着无与伦比的价值。

或许,数据还真的是天上掉下来的!

然而可以肯定的是,Informatica仍然是那个专注于数据本身,帮助企业做数字化转型的支持者。

毫无疑问,在中国这样一个移动互联网、电子商务、社交网络以及物联网发展速度远远领先的地盘,Informatica有足够多可以表演的舞台。




版权声明:

凡本网注明”来源:中国软件网(http://www.soft6.com)”的所有作品,版权均属于中国软件网或昆仑海比(北京)信息技术有限公司,未经本网书面授权,不得转载、摘编或以其它方式使用上述作品。

任何行业、传播媒体转载、摘编中国软件网(http://www.soft6.com)刊登、发布的产品信息及新闻文章,必须按有关规定向本网站载明的相应著作权人支付报酬并在其网站上注明真实作者和真实出处,且转载、摘编不得超过本网站刊登、转载该信息的范围;未经本网站的明确书面许可,任何人不得复制或在非本网站所属的服务器上做镜像。

本网书面授权使用作品的,应在授权范围内使用,并按双方协议注明作品来源。违反上述声明者,昆仑海比(北京)信息技术有限公司将追究其相关法律责任。
微信公众号 微信公众号