人工智能时代数据分析课程:昆仑数据创始人陆薇
人工智能时代数据分析课程:昆仑数据创始人陆薇爱分析认为,定制化的业务模式虽然不能改变,但选择在单个行业纵深的战略打法值得肯定。由于工业业务的个性化特点,现阶段工业大数据公司一般会锁定细分领域提供定制化的业务模式,但底层平台产品具有较高的通用性,在跨领域之间也具有很强的参考意义。昆仑数据成立于2014年底,由陆薇带队的原IBM大数据团队创立,一直深耕工业大数据领域,是该领域的翘楚。相比于互联网大数据,工业大数据有非常强的目标性,需求十分明确,以产品全生命周期管理为例,一个设备的智能运维通常需要若干个小型的模型,完成不同的功能。互联网大数据则相对中心化,围绕着一个主题应用场景做更丰富的功能开发和更深的应用挖掘。昆仑数据创始人陆薇解释说,互联网大数据类似一个巨大的星球,工业大数据则更像一条星系,由数个小星球汇聚而成。
在大数据行业应用中,工业领域除了传统制造业巨头,涉足的创业公司不多,是相对冷门的方向。究其原因,其一,对工业业务理解是巨大门槛;其二,工业应用定制化程度高,一个细分问题对应一个算法模型,繁杂程度可见一斑。但总体来看,工业市场空间巨大,数据分析需求强烈,全球化趋势明显,爱分析认为工业领域是大数据行业应用的优质赛道之一。
昆仑数据凭借技术实力较早入场工业大数据,在能源、电子制造等领域取得快速发展。昆仑数据获客的打法简单明快,项目落地切实高效,获得多个行业标杆企业认可并达成战略合作,倾力推动中国工业智慧升级。
指导 | 凯文
撰写 | 关蕾
昆仑数据成立于2014年底,由陆薇带队的原IBM大数据团队创立,一直深耕工业大数据领域,是该领域的翘楚。
相比于互联网大数据,工业大数据有非常强的目标性,需求十分明确,以产品全生命周期管理为例,一个设备的智能运维通常需要若干个小型的模型,完成不同的功能。互联网大数据则相对中心化,围绕着一个主题应用场景做更丰富的功能开发和更深的应用挖掘。
昆仑数据创始人陆薇解释说,互联网大数据类似一个巨大的星球,工业大数据则更像一条星系,由数个小星球汇聚而成。
由于工业业务的个性化特点,现阶段工业大数据公司一般会锁定细分领域提供定制化的业务模式,但底层平台产品具有较高的通用性,在跨领域之间也具有很强的参考意义。
爱分析认为,定制化的业务模式虽然不能改变,但选择在单个行业纵深的战略打法值得肯定。
从工业大数据产业链上判断,传统大数据和工业自动化产业,以IBM、Microsoft、GE、SIEMENS等为代表的巨头公司利用先发、资源、技术等优势,将在产业链上占据重要环节,大量新兴初创公司凭借开源技术,结合个别细分领域的业务认知力,或将成为细分领域的重要支撑力量。
国内市场中,昆仑数据是较早介入工业大数据领域的创业公司之一,并与金风科技、中石油、台达电子等工业龙头企业建立了战略合作关系。
传统工业巨头似乎格外关注本行业内技术创新型公司,国外工业物联网公司路径也不谋而合,其中新锐公司Uptake的快速成长与机械大亨Caterpillar关系密切,Caterpillar是其种子客户,二者不仅长期保持合作,更是参与了Uptake两轮融资。
与传统巨头战略合作,创业公司在技术、资源等方面收益颇丰。
目前,中国工业企业对大数据理解很多还停留在概念层面,仍需大量教育市场工作。昆仑数据采取的打法是先帮企业用户做痛点诊断,通过基于业务以及数据的双重诊断报告帮助企业梳理需求;再选择其中有代表性的问题做试点方案,再次明确方案的可行性、为用户测算投资回报、为其提供科学决策的数据价值依据;最终延伸至规模部署阶段,做企业系统性的大数据平台建设和全面部署。
昆仑数据在创立之初就明确选择了工业领域。陆薇毕业于清华大学,计算机系博士,是IBM中国区培养的第10位全球技术高管、杰出工程师。她带领团队研发物联网领域产品,主旨在实现设备数据的商业价值,是初具成果的工业大数据业务雏形。
近日,爱分析专访了昆仑数据创始人兼CEO陆薇,精选部分与读者分享。
实行客户落地三段论,聚焦工业四大痛点需求
爱分析:与其它类型大数据相比,工业大数据需要对业务的深刻理解,昆仑数据为何选择工业方向切入?
陆薇:创立昆仑数据之前,我在IBM研究院管理大数据研发。2009年,我带领团队参加IBM全球重大研发计划,专注物联网方向,把物联网设备数据收集到云端,做存储、分析,产生价值,解决问题,与现在选择的领域一脉相承。
做项目的过程中,我们看到物联网市场逐步兴起,万物互联是必然趋势。而且,这项技术有独特性和领先性,通过反复验证,市场需求反馈强烈。
随后,项目进入IBM公司战略层面。受制于当时的公司体制,产品并不能以最符合市场需求的形式呈现,注定在市场竞争中出现严重后果,于是我们决定出来自己做。
爱分析:从2014年12月成立至今,是否尝试过别的方向?
陆薇:我们一直专注在工业领域,在技术思路和产品上做过一些适度调整,一直在更迭演进。
爱分析:目前的打法是什么?
陆薇:对很多工业企业来说,第一个问题是回答大数据到底能为其带来什么价值,其次是如何跟企业业务结合,给予行之有效的实施路径。
我们为客户解决问题实行三段论。
第一步,给业务做诊断。如果企业想引用大数据,但又不知如何下手,我们会进场做业务诊断,系统地梳理业务形态,找到痛点,确定可以用大数据解决的问题。通常,诊断需要一天,诊断报告需要一周。
第二步,做试点。诊断之后,客户确认这个问题很重要,且数据完备度好,我们会做方案试点。
第三步,做部署。通常,对试点效果认可度高的行业标杆公司,会走到全面部署实施的阶段。
爱分析:做试点是一个比较偏重的模式,是否占用过多人力成本?
陆薇:工业领域特点决定了这个商业模式,只有这样,才能真正帮助企业迅捷地实现数据价值落地。刚开始有点慢,我们目前标准是,十周完成一个试点。随着案例、模型逐渐增多,以后会越做越快。
爱分析:做试点会有哪些收获?
陆薇:做完试点,有几件事就明确了:一,技术可行性,问题能否通过数据解决;二,投入产出,比如通过我们的模型可以提高多少产量,多少折现价值;三,明确解决这个问题,和哪些因素相关。
下一步,企业可以根据算出来的可行性、价值、投入产出,做科学决策,我们也可以做价值定价。
爱分析:如何进行价值定价?
陆薇:我们的理念是数据价值大于数据平台价值。我们不是单纯卖一个平台产品,而是解决了实际问题,有额外的价值产出。
工业企业很直接,两三年内能收回投资的,就愿意投入实施。
爱分许:如果试点完了,也没有梳理出需求,会有哪些维度去判断投入产出的问题?
陆薇:试点之前,为了保证试点效果,双方要确立共同的目标。包括共同认可问题的重要程度、共同同意的分析方法、共同配合的团队、共同同意的时间表等。一定是客户得重视,得配合,才能提高成功率。
爱分析:从平台切入应用,通常为客户解决哪些实际问题?
陆薇:通常工业大数据有四大类应用:提质、增效、降耗、控险。控险一般在高危行业,比如化工。
爱分析:这四类应用从数据分析方法或算法模型上有通用性吗?
陆薇:方法上有通用性,但模型是个性和共性的结合。
第一,工业大数据一定是个性化的,每个应用领域都不同。即使同款产品,使用不同的设备生产,获取的数据也不同。第二,底下平台产品是有共性的,比如传感器数据可以算一种数据类型。第三,有些不同行业也可以相互参考,比如生物制药和化工。
以后会越做越快,找相近的问题,在既有的模型上,用新环境下的数据重新做训练。
两个产品一个服务,“点-线-面”拓展战略
爱分析:对外产品以什么样的方式输出?
陆薇:我们有两个平台产品,一个叫K2Sigma,是昆仑数据自己运营的公有云服务,支持数据应用的诊断和试点阶段;另一个叫KMX,支持规模部署阶段,支持公有云和私有云两种部署方式。
此外,我们还提供数据科学服务,我们的数据科学家可以深入企业一线与业务专家一起解决问题。未来,我们还将在一些复制性强的应用领域提供应用产品。
爱分析:会去帮企业做底层的数据治理吗?
陆薇:不会一开始做全面的数据治理,企业数据治理项目非常耗时。
我们推荐小步快跑,快速实现。先找到业务切入点,再围绕切入点把东西做出来。但我们有一个架构原则,保证以后在增加和扩容时,不至于要推翻重来。采取渐进的方式,从一个需求点出发,上下打穿,逐渐扩充。
爱分析:做模型验证时候主要用的哪些数据?
陆薇:机器数据、业务数据,以及一些第三方数据,包括天气、地理等数据。
爱分析:常用的第三方数据源如何获得?
陆薇:一些是企业采购的数据源,一些是公共数据源。目前以企业数据为主,未来计划在平台上提供更多的公共数据服务。
爱分析:这样看来,也不完全对标Uptake。
陆薇:对,Uptake做PHM(故障预测与健康管理)多一些,我们不限于这个。
爱分析:重点关注的是哪些细分行业?
陆薇:我们做的最多的是能源,像风电、石油,能源企业数据完备度比较高。其次是精密制造,比如电子,关注质量、产量的应用。
爱分析:昆仑数据在细分领域、场景应用上,提供多元化的解决方案,而并不是选择聚焦在一个细分领域,或一个解决方向上,是如何考虑的?
陆薇:我们最早的出发点是做一个通用的工业大数据平台,后来发现只有这个平台不能直接解决客户问题,一定要这个平台上面有能解答业务问题的分析应用。在选择分析应用时发现,不同企业又有各自独特的关注点,随着对行业与用户需求的更深入理解与价值挖掘,应用也能逐步自成体系。
2C是做爆款应用,一个公司做一个应用,可以比较专注,像打造一个巨大的星球。但2B里面,工业有很多门类,每个门类有不同场景,像打造一个星系,由若干小星球汇聚而成。当然,我们只会选择有限的几个高价值星球聚焦。
爱分析:您认为昆仑数据的技术壁垒产生在哪些地方?
陆薇:首先,我们的平台产品针对工业数据的特点有一系列的专有技术,例如带工业语义的查询、数据版本和完整性管理等等。此外,这个领域,经验积累很重要。我们积累一部分在数据模型,一部分在对工业领域的理解,比如对生产工艺流程的理解,也会变成模型的一部分。积累逐渐增多,就会形成很大的壁垒。
爱分析:下一步公司整体战略是什么?
陆薇:一方面是继续按照三步走的方式走下去,不断打磨产品,提升效率,把产品做好。
另一方面,商业上按照点线面拓展。由工业龙头企业切入其上下游,大数据跨越企业的边界,支持整个产业链。不仅解决单个企业内部的问题,会帮企业搭建一个服务上下游产业链的数据平台,让数据在产业链上流动起来,把数据的价值无限放大。
主要成本在研发, 四类人才协作共赢
爱分析:销售模式以直销为主还是渠道为主?
陆薇:我们目前是直销加上合作伙伴。
爱分析:通常客单价是什么量级?服务的客户量有多少?
陆薇:客单价取决于阶段,试点项目一般几十至百万上下,部署看规模,几百万到上千万不等。
爱分析:客户量与销售额的增加与人员扩张有直接关系吗?
陆薇:不太直接。在公司初期,产品刚刚研发出来的时候,效率不是那么高,后来随着产品的稳定,随着项目的增多,效率越来越高。人均产出会稳步增长,因此人员增长和销售额增长的关系不是线性的,比如业务翻一倍,不需要人翻一倍。
爱分析:整体团队规模有多少人?是怎样的结构?
陆薇:目前80多人,包括60人研发。
爱分析:这个领域对人才的要求有哪些特点?
陆薇:我们需要四类人。
第一,懂行业的业务分析师,能够用行业的语言与客户交互,了解实际问题,并变成数学问题。
第二,数据科学家,根据数据和数学问题,做算法和建模。
第三,数据工程师,负责数据整理、清洗,包括写小程序。
第四,应用开发工程师,在部署时把算法开发成能用的系统,做产品化封装,有时也通过合作伙伴或应用集成商。很多时候,我们做的应用会变成客户某个系统的一个外脑。
例如,MES系统是企业做制造执行的管理系统,我们会从其中读取数据,给它加外脑,帮它做智能判断、决策、预测,但结果要返回给它,再控制机器。
新工业革命全球化,探索场景是挑战
爱分析:您认为,工业大数据和互联网大数据有哪些区别呢?
陆薇:第一,数据类型不同,消费互联网大多是人产生的数据,如文本、图片、视频、社交行为,是半结构化、无结构数据。工业领域大多是机器数据、设备工况、周边环境、人机交互等数据。
第二,这两类数据上的分析应用也不尽相同。一个的典型应用是推荐、信用分析等,另一个做频谱分析、故障预测等应用,这是两个截然不同的领域,需要用完全不同的技术。
爱分析:除了能源领域,您看到还有哪些领域信息化程度比较高?
陆薇:流程制造业的信息化程度较高,像冶金、化工,自动化程度高,数据比较全。离散制造业高精尖一点的,信息化程度也很好。
爱分析:跟金风科技是如何合作的?
陆薇:我们目前在帮助金风建设集团的数字化转型平台。在全面建设之前,我们先做了三个试点项目来验证数据的价值,一个是对风优化,实现发电效率提升,做完之后验证,平均一台风机每年可以多发电一万多元,金风有两万多台风机,全面部署后一年就可以增收两个多亿,数据的价值赫然出现。
另一个是大部件故障预警,比如传动装置齿形带有时会断裂,断了之后叶片不受控,严重会毁塔,我们通过大数据分析做到提前90个小时预警,扫塔概率降低30%。
还做了叶片结冰检测,我们通过数据分析判断单个风机的结冰状况和程度,制定准确的运行方案,用数据做决策。
爱分析:大数据和人工智能在行业应用中是分不开的,昆仑数据用到哪些AI技术?
陆薇:举个例子,生物制药中提升产出药品的效价,需要从药品发酵罐的历史控制数据中挖掘出和效价的关联模型。药品发酵罐的性能会随着时间推移发生变化,今天工作很好的模型,可能明天就不好用了。所以需要根据持续进来的数据进行模型的自学习、自训练、自优化,这就是人工智能技术在工业里面的典型应用。
我们认为人工智能技术本身不神秘,像现在流行的人工智能算法,包括深度学习都开源了。
首先,技术本身不是问题,挑战在于找到合适的场景,使其产生很大的作用。第二,需要持续的数据喂算法,让算法越做越好,海量的数据远比算法重要。
爱分析:工业大数据在国内处于什么阶段?
陆薇:我觉得刚刚兴起,到大范围应用还需要过程,正好适合创业公司和市场共成长。
大数据属于信息技术,新技术的蔓延过程一定是先从第四产业开始,以互联网技术为主的产业;再到第三产业服务业,比如金融、电信、零售等,信息化技术高,IT应用多;然后再到第二产业;最后才到第一产业,农业。我觉得不仅仅是大数据,任何一个IT技术,被采纳都是这样的过程。
大数据最早从互联网上起来;再到金融,像Fintech;这一两年开始,到工业界;国外也是一样的,也处于早期。
爱分析:未来几年这个行业的发展趋势,您怎么判断?
陆薇:我觉得在至少未来5到10年,空间足够大。
首先,工业4.0,新工业革命是全球性趋势。在这个阶段,各个国家都在做升级,是产业发展的必然。另外,中国制造业发展遇到很大的挑战,有很强的市场需求。
关注爱分析订阅号(ifenxicom),回复“ 昆仑数据 ”即可获得完整版报告。