大模型百模大战(百模大战交通)
大模型百模大战(百模大战交通)模型,是人对客观事物关系结构和规律的抽象,比如用数学符号刻画、自然语言刻画、机器语言刻画,甚至印章、实体模具等都可以称为是模型。在计算机科学和机器学习领域中,模型是指一种数学模型或算法模型,可以用来描述一个系统或者一个数据集。在理解通用大模型以及行业大模型,需要先厘清几个和模型有关的概念。大模型数量快速增长的同时,各细分行业领域也开始畅想基于大模型的应用。百度董事长李彦宏在中关村论坛上表示:“未来,所有的应用都将基于大模型来开发,每一个行业都应该有属于自己的大模型,大模型会深度融合到实体经济当中去。”如今,大模型的战场已经从通用大模型转向了垂直领域的行业大模型。一、什么是大模型
2023年上半年什么最火?ChatGPT必定榜上有名。
ChatGPT在全球范围内的迅速爆红,引发了业界对于生成式AI应用的关注,热度一路“狂飙”。各路玩家围绕“AI大模型”发布了一系列产品,国内也正在上演一场关于“大模型”的战争。
2023上半年,以百度、华为、阿里、腾讯为代表的互联网企业和以商汤科技、昆仑万维、科大讯飞为代表的科技公司先后公布大模型进展;以搜狗创始人王小川、美团联合创始人王慧文等为代表的初创企业以及中科院自动化研究所、复旦大学、清华大学等科研院所也相继投身大模型赛道。
《中国人工智能大模型地图研究报告》数据显示,目前全国10亿级参数规模以上大模型已发布79个,“百模大战”一触即发。
大模型数量快速增长的同时,各细分行业领域也开始畅想基于大模型的应用。百度董事长李彦宏在中关村论坛上表示:“未来,所有的应用都将基于大模型来开发,每一个行业都应该有属于自己的大模型,大模型会深度融合到实体经济当中去。”
如今,大模型的战场已经从通用大模型转向了垂直领域的行业大模型。
一、什么是大模型
在理解通用大模型以及行业大模型,需要先厘清几个和模型有关的概念。
模型,是人对客观事物关系结构和规律的抽象,比如用数学符号刻画、自然语言刻画、机器语言刻画,甚至印章、实体模具等都可以称为是模型。在计算机科学和机器学习领域中,模型是指一种数学模型或算法模型,可以用来描述一个系统或者一个数据集。
商汤科技智能交通产品线总经理郭海锋在赛文年会中介绍道,大模型是指模型参数过亿,模型训练计算量大、周期长、结构复杂的深度学习模型,这些模型可以通过训练大量数据来实现更准确的预测和更高的性能。通用大模型是对当前大模型的统称,特点是巨参数、大算力、无标注、自监督,将AI的开发应用从“小作坊”带入了“大工业”。
行业大模型则是基于通用大模型,结合行业Know-how对大模型进行“定向调优”(Fine-Tuning ),同时结合场景数据与行业领域知识进行“专教”,形成专属行业领域大模型,即从“通才”晋升为“专才"。
由于训练通用大模型的技术要求高、成本大、门槛高,因此当前很多行业开始基于自身情况,采取与通用大模型企业合作的方式,训练适合自己行业的垂类大模型。
在过去的几个月,各大AI科技企业纷纷公布在交通 大模型方向的解决方案和应用场景探索进展。
二、交通行业大模型
基于行业需求,各家企业发布的交通大模型有何特点及差异,赛文交通网整理了目前交通行业内的一些大模型信息,供大家参考。
百度:文心大模型
3月16日,百度举办“百度文心一言新闻发布会”,正式发布旗下预训练生成式大语言模型产品——文心一言。文心一言的发布引起了行业的广泛关注,百度也成为了国内第一家发布类ChatGPT大模型的企业。
在交通行业领域,百度首个定义大模型与交通结合的应用场景。
3月,百度基于文心大模型在高速公路领域发布了数字人简璐璐;随后发布了基于交通大模型的全域信控缓堵解决方案,积极跟进交通行业大模型应用,打响了交通大模型应用的第一枪。
依托文心大模型的能力,百度通过在智能交通领域打造交通大模型,构建交通感知、决策、认知、预测的完整能力,重构已有解决方案和产品,可全面升级G端(交通管理)/B端(交通运输)/C端(出行服务)的交通场景应用和用户体验。
商汤:商汤日日新SenseNova
4月10日,商汤科技SenseTime举办技术交流日活动,发布了“日日新SenseNova”大模型体系,该体系可提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力,同时结合决策智能大模型,为AGI实现提供重要起点。
5月,商汤在赛文年会上首次全面介绍了对交通 大模型应用场景的理解,基于商汤日日新SenseNova大模型体系对交通产品体系进行探索和落地应用,认为“入口”、“AI助手”、“知识库”是大模型在交通管理领域应用的三大表现形式。
阿里云:通义千问
在商汤科技发布“日日新SenseNova”大模型的第二天,2023年阿里云峰会在北京召开,峰会上发布了AI大模型“通义千问”。阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇在会上表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面升级改造。
6月1日,阿里云宣布聚焦音视频的AI新品“通义听悟”上线,成为国内首个开放公测的大模型应用产品。
阿里云智能交通物流行业总经理张磊在赛文年会上表示:“阿里云具备研发生成大模型的关键要素,愿携手客户与伙伴共同探索大模型在交通物流行业的智能化应用。”
宇视科技:梧桐
4月26日,2023阿里云合作伙伴大会上,千方科技作为“千问伙伴计划”首批唯一交通领域合作伙伴受邀参会,表示将与阿里云携手推动大模型在交通行业落地应用,探索智慧交通更优解。
次月,千方科技旗下宇视科技发布宇视行业大模型“梧桐”,并展示产品端第一阶段的落地成果。这是继加入“千问伙伴计划”,宣布携手阿里云共创交通大模型后,千方科技拥抱AIGC技术的又一重要落地。
腾讯:混元大模型
2022年4月,腾讯首次披露了混元AI大模型研发进展。
6月19日下午,腾讯云召开发布会,首次正式公布行业大模型研发进展,并公布了面向 B 端客户的腾讯云 MaaS(Model-as-a-service,模型即服务)服务解决方案。
华为:盘古大模型
4月8日,华为云人工智能领域首席科学家田奇院士,在人工智能大模型技术高峰论坛中分享了华为云盘古大模型的进展和应用,但对于目前的应用进展仅一语带过,并未透露太多。同时,华为官方也并未透露过多有关盘古大模型的相关进展情况。
鹏城实验室、海信网络科技:鹏程·大圣视觉大模型
青岛海信网络科技股份有限公司智慧交通事业本部总经理王雯雯在赛文交通网举办的“交通大模型实践应用探索在线研讨会”中表示:海信从2018年与鹏城实验室展开合作,持续探索视觉模型在交通行业中的深度应用。
鹏程-大圣系列大模型是鹏城实验室视觉智能研究所基于鹏城云脑Ⅱ训练打造,其中3亿、10亿参数的视觉大模型性能已达到国际领先水平,3亿参数视觉大模型相关代码已在全球最大的代码托管平台Github上开源开放。在此基础上,海信将丰富的交通场景数据与大模型融合,持续提升视觉感知的场景泛化能力。
中科院:紫东太初
6月16日,在人工智能框架生态峰会2023上,中国科学院自动化研究所联合武汉人工智能研究院正式发布“紫东太初”全模态大模型。
据了解,“紫东太初”全模态大模型是在千亿参数多模态大模型“紫东太初”1.0基础上升级打造的2.0版本,在语音、图像和文本三模态的基础上,加入视频、传感信号、3D点云等模态数据,研究突破了认知增强的多模态关联等关键技术,具备全模态理解能力、生成能力和关联能力,面向数字经济时代加速通用人工智能的实现。具备三维场景导航、信号理解、多模态对话等方面的全新功能,在交通违规图像研读等领域开始了一系列引领性、示范性应用。
此外,赛文交通网获悉,佳都科技、闪马智能、卓视智通、海信网络科技等智能交通科技企业也纷纷表示将积极探索行业大模型应用。
三、交通大模型的应用场景
大模型有协同和交互的本质,以及系统协同、信息共享、内容自动生成等特征,使其能够提升交通管理的效率和便捷性,如语音交互、知识库调用交互,各类助手、数字人、信息协同、系统联动、内容整合、报告生成、资源(指令下发)调配等,在智慧交管、智慧高速、智慧交运等领域都有所应用。
商汤科技智能交通产品线总经理郭海锋表示:大模型可以通过算力×数据×算法的深度整合能力,结合交管日常业务,在定性和定量两个维度进行拓宽和深化。
定性方面,大模型统一交管内勤OA业务&入口,而非应用链接层面的统一;成为内勤OA业务办公的AI助手;内勤模型知识涌现可使大模型成为交管内勤业务专属“知识库”。
定量方面,大模型可有机统一交通信号控制、交通状态分析等应用系统的入口,成为交管指挥调度AI助手,通过交通系统运行知识涌现,成为城市交通系统的“知识库”。
通过将定性 定量进行结合,可打通交管内勤业务和外勤业务,秒级将交通系统数理知识和运行数据转化为内勤文档,内勤业务指令转化为交通系统运行管控指令。基于“商汤日日新SenseNova”大模型体系,商汤率先开展AI大模型在交管领域的探索,赋能SenseTraffic商汤睿途系列产品实现“质和智”的跃升。
百度发布的基于交通大模型的全域信控缓堵解决方案是百度在芯片、框架、大模型、应用场景等全栈布局下的一个典型现象级应用。
该方案底层包括实时感知、机器视觉、交通预测、问题诊断、策略推荐、配时优化、个性化提示等交通大模型,能够提供全域感知、全域优化、全域协同和全域服务四大能力,实现信控优化的代际提升,可实现超千规模路口的全域拥堵治理。
图片来源:Apollo智能驾驶公众号
近日,百度地图升级到18.5.0版本,结合文心交通大模型beta版能力,全面提升车位级导航、车道级导航、隧道导航、红绿灯倒计时、实时公交地铁等产品体验。据了解,文心交通大模型Beta版是面向实时交通场景的大模型,可实现对实时交通数据的刻画、感知、预测和调度,从而为用户提供更加精准、高效、安全的导航服务。
在高速公路领域,百度联合河北高速集团发布了基于交通大模型的数字人简璐璐。作为高速行业专家、业务助手、出行伴侣和形象大使,“简璐璐”服务于路网监测、应急指挥、养护管理、公众出行全环节,可以结合用户问题,提供全新对话式交互,实时给出精准答复,让设施更简约、流程更简化、沟通更简单、服务更简洁。
传统的高速业务系统主要是页面型展示,指标和报表都相对固化,展示内容单一,难以支持全局评估。在这种情况下,百度打造基于数字人的全新交互体验,以全新的自然语言完成交互,通过数字人的联动系统和数字化的监控大屏,实现全新的业务交互。
数字人在NLP(自然语言处理)和NLU(自然语言理解)的基础上定义了路网运行监测,应急救援管理,包括协同服务管理、仿真决策和大屏等62项指令集。通过指令集实现极简交互、高效的协同,实现跨系统、跨功能、跨API、跨数据的打通,有效提升业务效率。
四、结语
当大模型的风吹到交通行业,交通大模型成为了“肉眼可见”的风口。
训练行业大模型需要多少数据?5座城市?10座城市?1年的数据?5年的数据?即便一个小数据集训练出来的大模型 交通产品,也可以在市场上变现,增强竞争力。由于市场上还没有相应的产品,也没有质量和模型效果评价,用户很容易被第一批产品的效果定义。
如今,各大涉交通业务的互联网公司高度重视大模型行业应用,将其纳入年度KPI考核。概念普及之后,能否真正落地,并在应用层面实现质的突破才是成功的关键所在。
随着各大企业陆续推出大模型产品,一些衍生问题也随之而来:大模型的基础是各系统之间的打通与信息共享,背后依靠的是海量数据与算法、算力的支持,在大语言模型与交通领域融合的过程中,需要使用行业内部数据和政务交通数据,如何保证这些敏感数据的安全?交通行业里的信息共享一直是短板,最终大模型的应用可能受制于数据的不共享、系统的不打通,而非大模型技术本身的发展。
就目前来看,市场对于大模型的消化接受仍需要相当长的一段时间。大模型背后存在的数据安全等问题,也需要行业共同探讨应对之策。
行业大模型竞速赛,谁能抢占先机,满足用户需求,切实解决行业痛点难题,谁就能在未来可能存在的市场机会中领先一步。
交通大模型未来将给行业带来怎样的惊喜?让我们拭目以待。
参考资料:
1.郭海锋:商汤睿途交通大模型产品体系
2.徐赫:智能交通市场年会带来的观察与思考
3.李琴:百度加速交通大模型场景融合与落地
4.张磊:阿里云数字交通创新实践
5.吴柯维:AI大模型技术在智慧高速领域的应用探讨及展望分析
部分内容来自Apollo智能驾驶、腾讯云、宇视科技、中国科学院自动化研究所公众号