当前位置:首页 > 云计算 >

明略数据葛利鹏:用好大数据 走好制造强国之路

发布时间:2016-04-28 16:55:59 来源:中国软件网 作者:
[摘要]第九届中国软件渠道大会暨2016中国软件生态大会北京站于2016年4月28日在中关村软件园国际会议中心召开!下午举行的大数据分论坛与上午一样火爆,吸引众多的企业和观众。明略数据综合事业部行业专家葛利鹏在会议上做了主题为开启大数据关联挖掘的新时代,展示了大数据在国家电网等关键行业领域的应用。
第九届中国软件渠道大会暨2016中国软件生态大会北京站于2016年4月28日在中关村软件园国际会议中心召开!下午举行的大数据分论坛与上午一样火爆,吸引众多的企业和观众。明略数据综合事业部高级经理葛利鹏在会议上做了主题为“开启大数据关联挖掘的新时代”,展示了大数据在国家电网等关键行业领域的应用。

明略数据综合事业部行业专家 葛利鹏

如下是明略数据葛利鹏演讲实录:

首先分享一组数字,32.7%、1:9和每分钟15万/分钟代表什么意思。随着我国经济的发展,制造业在我国经济中扮演了非常重要的角色,虽然我国经济进入了新常态,据2015年统计报告显示,制造业仍然占据了全国所有行业的固定资产投资中32.7%的比重,可见制造业起到了至关重要的作用。

同时制造业同我们的生活各个方面都密切相关,我们的衣食住行都依赖于此,就拿我们的出行经常乘坐的高铁来说,中国的高铁在十年内得到了迅速的发展,这也是依赖于自主创新的原则,现在高铁已经成为我国高端制造业的一张名片,纵观我们高铁生命周期,我们就可以发现一节列车整个资金的10%的资金是花费在购置上。90%的资金后期的维护和保养上,这也是1:9的来历。现在铁总关心的一个问题是什么? 怎么样在降本增效的前提下,能够保障高铁顺利的运行和安全。现在,由于机车自身故障造成的停运所造成的损失每分钟可高达15万,一小时将会带来900万的损失。可想而知,铁总对于快速的故障诊断和高效的故障预测的需求是多么的急迫!

怎样才能够及时地发现问题、解决问题呢?

随着第四次产业革命的到来。各个工业强国都在推出自己的产业政策,来快速提升本国的制造业发展水平。德国有工业4.0,美国工业互联网。我们中国的制造业也具备中国自身的特点,我们的工业体系非常庞大,2010年就已超过美国,成为了世界上第一制造业大国。但是我们中国也存在一些弱点,例如我们的产业结构不是很合理,自主创新能力不强等,针对于此,我们中国政府适时提出了中国制造2025年的产业政策,这政策主要是以数据为纽带,以数据分析为驱动力,推动传统的制造业想服务型制造业转变。具体到设备制造领域,我们可以看到大数据主要用到三个方面:1、统计分析、2、故障诊断、3故障的预测。

在统计分析,我们主要是利用分布式存储、计算技术,对于海量传感器数据进行采集和管理,可以进行状态监测和全生命周期的统计分析,对于故障诊断来说,主要是对局部组件的微小问题进行诊断,及时采取措施,避免设备停运现象的发生。其实对于故障预测来说对我们也是一个非常大的挑战。我们公司大数据科学家也投入了主要的资金和精力在这方面,也就是研究如何通过建模,来真正实现对故障的一个预测。主要是推动故障预测由之前的人工化、抽样化,向智能化全面化的方向来转变。也就是由之前的通过专家来进行判断,转变为依靠技术通过数据挖掘手段来进行故障预测。

从现在的故障处理上我们可以看到有三种不同的方式,有事后维修、有定期维修还有预测性的维修等等。我们现在大多数家庭都有车,我们的车每跑7000多公里,我们要进行定期的维修,同样一种故障现状,在不同的生命周期维修方式也不一样。就是说你的车处于磨合期,或处于损耗期,你应该采取不同的措施。过去由于技术手段的缺乏,我们并不能够进行准确的判断,所以说我们会用到大数据的技术。大数据的技术在这方面主要的特点是什么?

我们提到了两点,第一点快速,第二点高效。快速主要是利用大数据的并行计算和流处理技术,使得我们能够第一时间发现故障在哪里,及时地采取措施。高效主要是利用我们大数据并行计算的数据模型。能够将一些看似微小,但是实际上在故障发生重要作用的状态数据,放到我们整个模型里面来进行统一的考虑。这样会造成非常高效的运算和非常准确的预测,能够真正达到预测的一个效果。

我们的客户到底在哪里?

通过实践我们发现,实际上同国计民生相关的行业更应该使用大数据的技术,这些行业有几个特点,第一点是他们的单个设备非常昂贵,一旦发生了损失,由于不能够进行预测,将造成很大的经济损失。第二这些行业有较好的传感和传输条件。像我们的高铁一样,一个高铁列车会有1200多个传感器,在转向架上就有两百多个包括温度、速度等等。所以说这些传感器在高铁运行中会产生大量的数据,这给我们提供了一个很好的数据基础。有了数据的基础我们还要把它传回来,以便于我们采集和分析。在高铁上就用了移动网络进行数据的回传,就给大数据落地提供了一个很好条件。也就是使我们能够真正做到故障的预测。

明略数据提供什么样的解决方案

上面谈到了大数据的特点和客户,下面我们看一下,我们明略数据提供什么样的解决方案给到客户。首先我们提供了完整的架构,主要分为四部分,数据源,数据采集和存储,数据挖掘和数据应用。最下面是数据源部分。在数据源这部分,传感器数据,包括一些历史数据都是属于结构化的数据。日志数据和视频数据都属于非结构化数据,大数据平台主要完成数据的采集和存储任务,再往上我们会对数据进行诊断模型的建立和故障预测模型的建立,来完成相应的诊断和预测的工作。

我们明略公司能够提供全套的产品,不仅提供明略的大数据平台MDP,我们还有相关的诊断和预测的数据建模平台dataInisght以及可视化工具 Discovery。

这样,结合我们全套的产品就会给客户提供非常完美的解决方案,也就是从数据的采集,到数据的分析挖掘,到数据的可视化展现一整套的解决方案。

在大数据应用中,数据是基础,但是真正实现数据价值,发现有价值数据的方法,只有通过数据建模来实现。传统来说有两种比较好的方法。第一是特征分析,在特征分析里面主要通过几个步骤来实现,首先我们通过故障的标注、观察数据,进行特征的提取。特征提取后,我们会观察数据是否具备降本或者筛选的特点进行相关的处理,然后我们会进行模型的训练。在这例子里面我们是用了SVM的模型,通过训练,我们会把超平面得出来,这就是我们将要用的一个模型,如果是通过模型的评估,一切都通过的情况下,也就意味着这个超平面是在将来实际中使用的一个模型。

我们还会用到深入学习的模型,这也是前一段我们人机大战中比较火的AlphaGo用的数据模型。在我们使用时候,是基于大量的特征数据经过多次迭代得出我们真实的使用模型,由于这模型需要进行大量的浮点预算,所以我们使用了GPU的进行数据的处理,我们在很多典型案例中,已经在使用了GPU。Nivida很早就推出了GPU的并行算法架构,但是在当时,被认为有些超前,现在,很多的涉及神经网络和深度学习的算法都使用了GPU, 最近Nivida也推出了tesla,号称一块显卡上包含了8个GPU,处理能力相当于250台传统的通用服务器,我们明略数据也在紧密追踪技术的最新进展。

我们认为基于对技术的深入理解,我们才能构架出很好的大数据平台,同时只有深入的理解客户的业务,也才能够更好地提出解决方案,解决方案其实是围绕客户的业务,就是说只有深入的了解客户的业务,我们解决方案才能更好的完成项目实践。

案例分享

下面我们会有两个比较典型的实践,一个是轨道交通,另外一个是我们的电网。

这企业可能是我们国内最重要的交通企业,主要问题是业务场景非常的复杂,同时建模工具缺乏,导致它不能根据故障及时的模型构建,也就不能够进行这种预测性的评估,同时由于这种高铁列车逐渐的自动化、智能化程度的提高。它的数据种类数据量也非常大,也会造成采集和查询包括分析都很困难。

基于客户的痛点,我们提出了全套的解决方案,包括我们大数据平台MDP,数据挖掘系统dataInsight,同时我们根据客户的需求,将我们的展示工具和我们的挖掘平台进行很好的客户化改进。这能够使得我们的挖掘结果及时的能够反应到客户的界面上。客户通过可视化界面,就能够看到整车的运行状态。整车关键部件的运行状态,一旦部件发生问题,同时能够看到故障的概率,故障的原因还有故障造成的结果,这样就能根据故障的特点及时的采取维修的措施,从而极短的降低了停车时间并缩小了经济损失。

下面是我们在国家电网的案例,电网设备包括一次设备和二次设备,一次设备主要包含发电机、传输线路、主变压器等高电压、大电流的设备,二次设备主要包含控制、四遥和仪表测量等低电压小电流的设备。这些设备每天会产生大量的数据,现在客户遇到的问题是这些数据不能够及时地采集和存储。导致在查询的时候,时间甚至长达10分钟,所以这是客户所不能忍受的。第二是建模工具非常缺乏,不能够做到对于故障做预测性的判断。所以说它也不能够对于一些产品进行及时地诊断。

根据客户的痛点,我们把整套的解决方案提供给客户,包括我们的大数据平台、数据挖掘产品和展示工具。这样就能够给客户起到全程的展示,快速的查询。同时我们解决了困扰客户的问题。具体来说,客户设备由家族性缺陷的问题,我们的方法是在一系列的产品中,通过产品的故障建模,从而推断这一批次的产品将会发生故障的概率,这样就能把这信息给到维修,能够及时采取有关的措施,保障电网的正常运行。通过全景的展示每一个结点包括发电机组是否有故障,这样就能够提供一个非常直观的全景视图,从而了解每个关键节点的运行状况。

大数据实施或者应用过程中的经验

最后我想和大家一起分享一下我们的大数据应用经验,一就是在大数据实施过程中,我们认为数据、技术和业务都是非常重要的,在整个项目实施过程中,我们发现数据和技术是围绕着业务展开的,业务既是驱动力也是数据和技术的价值点的最终体现。

所以说驱动解决方案是我们的业务,只有真正的体现了业务价值,提供的解决方案才是有价值的。

第二相信我们中国的技术力量,在我们轨道交通的实际案例里面,我们的技术团队和客户的技术团队互相激励。甚至在讨论一个技术问题的时候,我们能够一起争论到凌晨,是客户认真的态度、敬业的态度激励了我们的团队。同时我们的数据科学家提供驻场服务,通过驻场服务才能真正的了解业务的特点,将来的业务发展趋势,客户对于业务的真正需求是什么,通过数据建模才能够实现业务的价值,现在通过我们的不断追求,项目运行非常好,所以说通过这些案例,我们应该相信我们中国的技术力量。

由于时间有限我们只是举了明略在制造业的案例,其实我们明略数据还有很多的实际案例,包括在金融,公安,税务,政府我们业都有很多的案例。

【返回首页】