鹰眼逻辑评人工智能(明略数据吴明辉)
鹰眼逻辑评人工智能(明略数据吴明辉)今天时间点,算法能达到的精度准度都是没办法满足应用需求,这是人工智能面临的一个很大的问题,所以前一段时间有一篇文章非常火就是张院士讲,人工智能虽然取得了一些进展但是有非常大的局限性,就是大家基本上都在讨论深度学习,而深度学习本身的算法是不可解释、不可理解。而深度学习包括早期的统计学习在具体的场景里面应用的时候,它有很多的前提条件,它为很多事情所约束。我自己在读人工智能专业的时候,我学的这专业还是人工智能实验室具体细分的专业叫模式识别图像处理,或者叫生物特征识别。那个时候人脸识别还不是特别火,当时我在实验室做的课题掌纹识别、指纹识别、指静脉识别,我是在北大计算机系人工智能实验室,是全球第一个高校利用这项识别技术进行考勤,以前北大每一个学生要求每一个礼拜要在学校校园里面跑操,在北大的燕园里面每一个礼拜跑两圈,在北大的四五体育场有一个打卡机,你要拿着你的学生证打一个卡,我们以前宿舍同学都很简单,
2018年11月27日-28日,第六届WISE大会——“WISE 2018新经济之王”在北京国贸会议中心召开。在这个不断变化、充满焦虑和不安、却又英雄辈出的时代,我们一起见证着新经济之王的诞生。什么是新经济?我们自己定义的新经济就是由信息技术革命带来的数字经济。这个领域里有许多正在高速成长的,了不起的新经济公司,他们对之前的商业做出了革命性的探索跟改变,更深刻地改变着我们的生活。
人工智能被认为是互联网的下一个风口,但质疑声也颇多。 近日,一辆贴有董明珠海报的公交车违章被智能交通系统认定为董明珠违章,也让人开始怀疑是人工智能还是“人工智障”。
11月27日,面向AI的大数据公司明略数据董事长吴明辉在36氪WISE峰会上表示,人工智能的局限就在于他无法处理不透明的数据,比如AI下围棋,对手的每一步它能看到,就能做出相应的回应;但让AI去玩游戏,它就很难玩得好,对手的动作就是不透明的数据。吴明辉表示,突破人工智能的局限就要将机器的认知和感知结合起来。
吴明辉举例称,目前公安系统抓捕嫌疑人很大程度上就靠面部识别,但是人工智能的面部识别错误率较高,但借助民警的侦察思维,先将嫌疑人的范围进一步缩小,再进行面部识别,成功率就高很多,目前要培养的就是AI的认知思维。
演讲全文如下:
各位来宾大家上午好,非常荣幸今天和大家一起分享一下我们的一点体会,可能很多的朋友都知道,我们最开始启动是把大数据和人工智能技术引入到安防,因为我自己是学人工智能科班毕业,但是那时候在学校里面读人工智能的专业并不是特别火的方向,自从阿尔法狗出来,反而下围棋下好了之后很多产业界里面包括媒体、投资圈等等几乎所有的朋友都把关注的目光放在人工智能上,但是回过头看,我们明略自己在公共安全领域确实已经取得了很多的进展,自从我们部署第一套系统在某一个地市的公安局系统之后,基本上凡是明略客户都会不断的得各种各样的奖,我们有一个客户对我说,基本上我能在当警察事业的奖都拿到了。
但是回过头来看绝大多数的AI公司今天好像也都只在安防领域取得了巨大的进展,大家都在讲人工智能要改变世界,我们要助力新经济的发展,但是并不是能够很轻易找到公共安全领域以外的应用,这一直是我反思的问题,也希望跟大家去探讨。
我自己在读人工智能专业的时候,我学的这专业还是人工智能实验室具体细分的专业叫模式识别图像处理,或者叫生物特征识别。那个时候人脸识别还不是特别火,当时我在实验室做的课题掌纹识别、指纹识别、指静脉识别,我是在北大计算机系人工智能实验室,是全球第一个高校利用这项识别技术进行考勤,以前北大每一个学生要求每一个礼拜要在学校校园里面跑操,在北大的燕园里面每一个礼拜跑两圈,在北大的四五体育场有一个打卡机,你要拿着你的学生证打一个卡,我们以前宿舍同学都很简单,我们有六个同学,就有一个同学拿着六张卡打一下就好了。但是后来自从实验室把我们这一套系统变成了指静脉打卡,所以学生同学都在说我们的实验室的技术杜绝了代打卡。所以这是最早的人工智能的应用。
今天时间点,算法能达到的精度准度都是没办法满足应用需求,这是人工智能面临的一个很大的问题,所以前一段时间有一篇文章非常火就是张院士讲,人工智能虽然取得了一些进展但是有非常大的局限性,就是大家基本上都在讨论深度学习,而深度学习本身的算法是不可解释、不可理解。而深度学习包括早期的统计学习在具体的场景里面应用的时候,它有很多的前提条件,它为很多事情所约束。
就像大家看到用深度学习的算法下围棋的下的很好,因为围棋所有的信息公开透明,可以看到竞争对手跟你下围棋所有的步骤,当然你不知道他怎么想,但是至少围棋怎么下是看得见的,但是如果去用人工智能玩游戏,比如说打魔兽争霸,到今天都没有做的特别好,原因很简单你的竞争对手在做什么你不知道,信息不透明,因此很难把最终效果做出来,这是我们绝大多数行业里面今天人工智能商业化应用没有更好的取得进展一个最重要的原因。在安防里面很简单,可能我们现在只是比对一下看看抓获的是不是犯罪嫌疑人。但是此外更多的场景里面AI还是一个很局限性的单一的技术,在局限性的环境里面是解决不了这样那样的商业问题。而我们明略数据一直是在思考如何去帮助我们的行业客户解决那些核心的业务问题。
所以单一技术的发展,它发展的再复杂也会有一定局限。我们很多很多的行业里面都有人非常热衷于刷分,我要第一名,我要分比你再高,我以前读研究生带着同学去参加比赛,因为我们这支队伍参加完这项比赛就取消了,因为这比赛项目达到了目标,但是真正要在实际应用场景中看,这个分数最高指标百分之百都不能解决这问题。
我给大家举一个例子,比如说我们的背景上这样一个照片,这是真实公安要破案的场景,这犯罪嫌疑人有反侦察的经验,他把遮阳板遮起来。其实这个车牌号拍下来开到一半把车扔掉,所以这个人花了半年多才抓着。所以公安场景我们遇到的真正场景都是这样的场景。大家以为我们今天的人脸识别的算法很好用,但是你在全国十几亿人口的大户里面,你挑出会有几千个人跟你长的像,我们每一个人人脸放到全国人库比对一下你会发现有很多人跟你像,所以单纯的图像识别算法是解决不了这问题,而我们真实破案的场景,这是我们另外一个案例,一个小区里面很多电梯的控制面板都被偷走卖掉了,因为控制系统也很贵。
那真正我们用人脸识别根本就识别不出来它是谁,我们后来是通过其他的维度的数据来一起进行研判,我们通过公安的逻辑推理得出结论,应该做这行为的人应该是电梯行业从业人员否则都不知道。整个附近潜在几千人,但是几千人里面如何把作案嫌疑人找到,又是通过这几个人行为异常进行判断来找出来,它背后基于更多维度的数据它是能够把我们的其他维度的数据跟人脸识别的视频数据各种各样的多维度的数据融合在一起,最后结合起来产生的效果。
所以我们在今年的下半年在市场上推出了我们一个非常新一代的AI系统明智系统2.0,我们这个系统就是把这问题解决掉,把感知和认知打通,把我们的深入学习算法为代表的这一些音频、视频识别的数据跟其他的维度数据融合在一起,中间通过重要的维度就是,用符号把数据连接在一起。
大家都知道其实很多很多的案件它由可能不同的110接警,不同的警察接待,而这一些数据之前散落在不同的案件笔录系统里面,我们通过人工智能自然语言的处理技术是可以把不同的案件笔录里面的关键信息也找出来联系到一起,最后把不同的情报员汇聚到一个案件上,这是一个非常非常重要的技术。
而更多的情报线索来自于什么呢?来自于原来公安系统各种多源异构的数据库,比如说户口薄等等这一些数据在原有的各种各样的系统里面,我们需要把这一些系统关键的信息以符号的方式提取出来,最后融合到前面的视频、音频、文本的这一些数据,只有这一些数据融合到一起,才有可能真正的解决复杂的问题。
就像张院士讲的,今天的数据算法很多情况下局限于数据不够,很多情况是小数据没有大数据,而在这一种情况下我们需要使用人类原有的知识系统。而我们明略是可以解决这样一个系统的研发设计,而且这一些积累的过程其实是给各行各业构建知识系统,这不仅仅在公安行业,在所有的行业都可以应用这方法。
当我们所有用好之后,多源异构数据是通过一个统一的符号体系,不只是音频、视频文本等等,存到多源异构的数据库里面,最后形成一个符合我们下一代方向的人机交互系统中,在这样的人机交互系统里面我们可以直接通过人类的自然语言向系统发问,我们可以问“这个人是谁”,我们甚至可以问更复杂,“他在哪里,他跟谁在一起”。甚至我们也可以通过这一套系统来去问“他准备去哪”,我们可以通过各种各样的信息进行问,“为什么”,这些信息已经通过明略系统将所有的多源异构的数据进行结构化。
我们在很多的领域里面并不只是通过深度学习去分析。我觉得这个人是坏人,但是你必须要解释清楚这个人坏人,这背后是有逻辑,包括明略在工业领域,当我们发现一个火车坏了它的哪一个零部件坏了什么原因我们是要解释清楚、分析清楚,这都是今天为什么人工智能在这一些领域里面没有很好落地的原因。所以明略系统2.0就是致力于要打造这样一个环境,我们希望能够去探索新一代人工智能的技术,把感知技术和认知技术连接起来才真正形成的大脑。
这是明略数据首席科学家吴信东教授和我本人写过的一篇文章,前两天在全球IEEE ICDM大数据&AI大会上发布了我们叫HAO智能模型,我们提出,AI落地创造价值,唯有从大数据开始,凝练大知识,协同HI(人类智能)、AI(人工智能)和OI(组织智能)三者合一的HAO智能,以人机同行、行业服务为抓手,将明略数据的大AI思想落地到行业应用场景中。大智慧始于大数据,凝结大知识,带来更便利的人机交互,最后才能形成一个完整的闭环,以解决复杂问题。我们需要多种AI技术进行多链路的打通,而这一套模型打通了感知、认知把最先进的技术连接到一起。我们也不需要百分之百的语音识别的算法,可能70%就够了,但是通过多维数据的打通,感知和认知的打通最终形成一个完整的商业应用,最后起到了一个最好的效果。