数据会传到企业之后,有一些企业采用了将数据保存在公司内网,软硬防火墙、权限、口令、加密各种手段全上,这是很稳妥的办法。若果要使用数据库,那就另开一个存储区域,设置过滤条件,建立数据库镜像,防止直接操作不当崩溃。
本文我们要讨论的不是数据库,而是一个问题。
大数据分析。
这个名字不是随便叫的,就好像有个网站不能称之为云一个道理。直接举个例子来说明吧。
某个现场不大,100多个信息点,每隔十秒回传一条消息,一分钟6条,一个小时6*60条,一天6*60*24条,合计14400条信息,每条信息占据2K字节,则占据28800000字节,不到3M,也就是一首歌的大小。两天,28800条数据。
工业化的许多数据,如温度、压力、流量、PH值等,往往变化是比较缓慢的。从数据库中读出数据填充到EXCEL表里,看两眼会觉得这是粘贴考虑了数万行,发觉不出变化来,以小的时间尺度去查看变化曲线,就是一条直线。
首先根据预定义的通信协议,将数据字段填充到监控变量,同时以时间变量为基准,建立起数据序列。
对于数据进行初步的筛选和预处理:判断数据的有效性,那些明显一场的数据如超出极大值和极小值的数据,不知所云的数据,这往往是由于现场传感器故障、通信干扰等原因造成的,需要剔除或根据上下时间段补值;长时间无变化的数据删减等等。
经过预处理的数据后,数据条数从2万多条锐减至只有不足百条。
根据业务专家的一件,对于这十几条数据做了简单的诸如相关性的计算之后,得出了几条结论。业务专家非常惊讶,仅仅这几十条数据得出的结论,清晰的反映了该单元的最优化工作条件,和实验室条件下的结论如出一辙。而根据此结论编写的操作指导书和运维报告,另用户大为满意,专门增加了预算。
上述过程,是一个浓缩了的大数据分析的过程。通过该过程,我想说明几个结论:其一,数据中蕴含着财富,价值无法估量;其二,企业,要高度重视这些数据的价值,这是企业提高生产率的核心价值所在;其三,企业,要做好数据的保密;其四,本文使用简短的篇幅举例,是为了说明如下结论:在数据时代,对于企业的挑战不仅仅来自同维度的同行,更有可能来自更高维度的其它。
所以,有一个问题,数据就是金钱。我们把金钱存到银行去,银行用这些钱去放贷,去投资,进而获利,抽出一部分返给储户作为利息。企业将数据存储到云端,怎么还收费吗,以后会倒过来吗?
文章评论(0条评论)
登录后参与讨论