首页 > 文章中心 > 正文

大数据技术在智能公交系统应用

大数据技术在智能公交系统应用

【摘要】文章对目前国内智能公交系统的发展状况做了回顾,结合某公交企业信息化建设的实例,提出了智能公交系统应以数据驱动为核心,采用大数据的思想、体系和技术构建,并对其中的一些关键环节技术做了阐述。

【关键词】公共交通;智能公交系统;大数据;元数据;数据挖掘

1智能公交系统的发展概况

随着社会和经济的快速发展,交通管理部门、公共交通运营企业和出行乘坐者对公交智能化提出了更高要求,智能公交已成为智慧城市的重要组成部分。国务院于2019年9月颁布了《交通强国建设纲要》,交通运输部也相应出台了《数字交通发展规划纲要》、《智慧交通让出行更便捷行动方案(2017-2020年)》、《推动综合交通运输大数据发展行动纲要(2020-2025年)》等系列配套政策,这些措施极大推动了智能公交系统的发展,尤其沿海经济发达地区得到了政府和社会的高度重视,经过多年建设,已经初步形成了智能化程度较高的智能公交系统。行内比较认同的智能公交系统定义是指基于定位技术、无线网络通信技术、GIS、AI技术、大数据技术等,实现公交车辆运营调度的智能化、公交车辆运行的信息化和可视化,实现面向乘客的个性化信息服务,并通过信息管理系统和连接各停车场站的智能终端信息网络,实现对域内公交车辆的统一指挥和调度,提供公交车辆的定位、线路跟踪、电子站牌信息、公交线路的调配和服务能力,确保人力、运力资源的动态优化配置,降低公交运营成本,提升调度应变能力和服务水平。智能公交系统一般由数据采集层、基础设施层、数据层、中间支撑层和应用层五部分组成。其中,数据采集层包括各种前端的数据采集设备;基础设施层包括服务器、存储设备、网络设备等设备;数据层包括实时运行数据、外来数据等;中间支撑层包括GIS平台、Webservice、数据分析中间件等服务组件;应用层按使用对象可以分为公交公司经营管理与监控应用、政府管理部门管控决策应用和公众出行信息服务三大类应用。

2智能公交系统大数据建设的基本思路

交通运输部2019年下发了《推进综合交通运输大数据发展行动纲要(2020-2025年)》(以下简称《纲要》)文件,文件对交通运输行业的大数据建设给出了明确方向,提出了“统筹推进、加强采集、充分汇聚、综合应用”的指导思想,并提出了完善标准规范、强化数据采集等具体任务[1]。本文结合广东某市公交集团信息化建设实例具体介绍大数据建设的实践经验。该公司是一家大型的国有市内公交特许经营企业,成立于2007年,下设21个部室、4个分公司、64个车队、9个修理厂、310条线路、4961台公交车辆、1.4万余名员工。2020年年载客里程2.83亿公里、年客运量2.99亿人次、日均客运量82万人次。经过十多年的信息化建设,已经建成3大基础IT环境、3类车载智能设备、13个软件应用系统,近200个业务功能模块,涵盖了ERP、OA办公、智能调度等方面。3大基础环境包括中心机房、调度中心、客服中心。公交车辆上部署安装了车载调度终端、车辆主动安全智能防控设备、车载视频客流采集仪等车载智能设备。以上工作为利用大数据技术改造和升级企业的智能公交系统打下了良好基础,但企业在数据管理和应用方面仍暴露出不少问题,具体表现为缺少顶层数据管理的整体规划和统筹,缺乏统一标准,数据源多样化,兼容性和互通性差,部分数据更新维护责任不清晰,数据不完整或格式不一致,甚至出现数据失真,各应用模块和业务部门难以实现数据交换和贯通,数据共享不足,信息分散,许多数据需要手工和重复维护,自动化采集程度不高,无法支撑全流程和全业务线的管理。在数据的使用方面,工具手段落后,缺少个性化、直观化、交互式的分析工具,无法及时反映现场变化走势,无法精准透析基层问题,尤其是缺少统一的大数据分析应用平台,缺少智能的数据挖掘和研判能力。该企业为了更好地应对内外环境的压力和挑战,提出了数字驱动的信息化战略,按照《XX公司2021~2023三年信息化建设规划》部署,其最终目标是搭建以数据为核心的信息化架构(见图1),全面提升企业管理水平、效益和乘客、员工的满意度。大数据技术无疑是实现上述目标的首选。大数据技术是一整套完整的思想和解决方案。针对该企业的现状和发展愿景,大数据建设应该包括几个基本任务:①数据管理体系的建立;②数据治理;③数据仓库的设计及建设;④数据创新应用体系建设。

3数据管理体系的建立

该企业每天经营产生的数据体量是庞大的,而且类型多样,有文本、数据、音视频等。仅举部分经营数据为例(见表1),每天新产生的数据就达数G之多,而且这些数据被上百个应用模块使用和处理。按照《DAMA数据管理知识体系指南》的指导思想和该企业实际,数据管理体系既是一套完整的数据管理技术标准,也是贯穿企业数据整个生命周期全流程的管理制度,由六部分组成:①数据模型;②数据流程管理;③数据管理组织、制度;④数据质量管理标准;⑤数据安全管理标准;⑥数据交换标准。数据模型是数据管理的核心部分,数据模型体系包括:编码规则、分类结构和信息模型体系。数据模型设计应按照先进性、可靠性、一致性和通用性进行设计,借鉴业内成熟的企业数据标准体系,构建企业自身独有的数据模型体系,保证数据模型的相对稳定,并支持数据模型的扩展和优化,确保企业信息资源的可持续利用。

4数据治理和数据仓库的设计、建设

数据仓库是大数据技术的落脚点,按照W.H.In‐mon在《BuildingtheDataWarehouse》中的说法,数据仓库是面向主题的、集成的、随时间变化的、非易失性的数据集合,用于支持管理层的决策过程。数据仓库技术体系结构见图2[2]。数据预处理是数据挖掘(知识发现)过程的一个重要步骤。数据的预处理包括数据清洗、数据集成、数据转换和数据规约。其中,对存量数据的清洗工作难度最大,需要认真策划和精心组织,存量数据一般都会存在数据质量问题(数据不一致、不完整、不合规、数据冗余等),需要通过人工和自动的方式进行改造,包括对问题数据的补充和调整,冗余数据的查重和映射,涉及的技术方法包括数据分箱平滑法、聚类方法、回归方法等。数据仓库的设计和实施阶段包括8个部分:开发概念模型、开发逻辑模型、设计物理体系结构、设计数据库和元数据、确定抽取数据源、开发中间件、数据装载和数据仓库测试。其中,数据仓库的数据库是整个数据仓库环境的核心,是数据存放之处,提供对海量数据的支持和快速检索技术,数据仓库的数据可以按照不同的主题分成不同的数据集市。

5数据创新应用体系建设

建立在数据仓库基础上的大数据平台,可以提供OLAP、BI和数据挖掘等系列应用,该企业在大数据平台上按照业务主题逐步建设了一系列应用。①营运主题,包括可视化的综合检测分析、公交时空客流分析等;②技术主题,包括物资采购通、车辆医疗卡等;③服务主题,包括预到站时间、出行需求分析系统等;④人力主题,包括人力优化分析、人力资源画像等;⑤行政主题,包括采购分析、采购分析算法等;⑥场站主题,包括场站基本信息管理、场站夜间停场管理等。

参考文献

[1]交通运输部.《推进综合交通运输大数据发展行动纲要(2020-2025年)[EB/OL].

[2]古斌.数据仓库与数据挖掘实务[M].北京:北京邮电大学出版社,2014.

作者:何东  马晓辉 刘国印 单位:深圳市信诺兴技术有限公司