新浪汽车讯 8月12日,TCC生态圈的‘AutoAPP’第8站活动在京举行。本期活动以《大数据驱动的产品和营销》为主题,与会的T圈嘉宾从大‘数据的内涵和外延’,以及‘如何对这些大数据进行挖掘和利用’两个宏观层面进行了探讨。以下为会议讨论实录。
董振宁
高德软件有限公司副总裁董振宁:刚才华筝研究有点用户行为,今天我讲“汽车大数据在交通领域的应用”,我们为什么做偏宏观的应用?对于大数据来讲首先必须有海量的数据,基于海量数据对个体进行洞察和分析,所以对于交通出行领域,在整个中国是互联网基本入口之一,所以交通出行聚合大量的用户行为。
今天我所讲基于大量的交通数据,如何解决交通问题。可以看一下,中国交通问题目前现状。整个中国由于进入汽车时代,伴随而来一个很大的问题就是交通问题,目前在中国超过50个城市都面临不同程度的拥堵,而且越大城市拥堵越严重,对于交通问题有三个层面:第一层面对个人的影响,我们如何帮助用户来进行出行,节省用户出行时间,帮助他更快到达目的地,需要交通工具提供躲避拥堵决策。有一个应用的场景,假如在你下班的时候,多数用户在七点下班,如果你七点三十分回去,你的道路旅行时间可以节省20分钟,很多用户选择七点半下班。
除了交通对用户影响以外,还有对社会的影响,由于交通问题带来很多问题,环境污染问题、包括民众不满问题、老百姓幸福感的问题,我从北苑如果到东三环,如果早高峰需要一个小时,正常可能二三十分钟到了,交通问题给我们带来很大的不便利。
另外对于政府治理方面,要解决交通问题,以前政府更多采用建智能交通系统,我们花很多钱建红绿灯、摄象头,通过这个规范我们行为,但是目前很多系统都是投入大、产出低,北京、上海投入几十个亿进行这种智能交通的建设,武汉投入十几个亿,目前产生影响不大。对于我们而言,是否通过大数据和互联网模式改变我们出行和交通现状,其实是摆在我们面前的课题。我可以简单介绍一下高德交通大数据,我们怎么把大数据给它采集起来?首先你要如果做大数据研究,首先解决第一关就是数据采集,我们解决模式的问题。所有互联网变革都是模式上的变革,最早做交通信息采集的时候,通过全国各地采集出租车,各地出租车公司谈判买他们数据,一个城市一个城市收集这些数据,后来我们发现这么做没有用,而且数据成本非常高,根本解决不了我们的问题。后来怎么做?用互联网众包的模式,利用移动互联网手机或者汽车传感数据,来进行用户数据动起来。
也就是当你们在东三环用高德地图的时候,你所看到信息是前面走过人传递的信息,他采集的信息给你,你当时把当前的信息采集好再递送给后面人,所以我们当时在北京做应用的时候,从10万、20万一点点积累,到三年已经超过3亿。像北京实时在线超过几万,北京来自互联网用户10万,来自车载更多,每时每刻在北京有10万用户共享他的信息。通过共享的机制,我们彻底把全国各城市交通信息用新的模式收集出来,靠模式的变革,不但交通信息质量全国最顶尖,关键交通覆盖率最顶尖。目前差不多覆盖150个交通拥堵城市,百度只有30个,我们交通信息来自于互联网、车载,但是我们数据是海量的数据,每天超过四五亿数据,每个月处理数据几百亿,我们通过这种模式解决溯源的问题。
下面谈数据处理基础能力问题,刚才华筝讲的关于用户行为的研究,其实归根到底是阿里提供一个强大的数据处理能力,因为我们有了数据处理能力平台,我们才有能力对用户数据进行各种各样研究。我给大家举一个例子,对于交通大数据,每天需要储存的数据可以超过GB,百亿条以上,我们在做交通报告、数据洞察分析的时候需要处理三个月、六个月甚至一年,这些数据量都是PB,正因为基于阿里云平台做相关数据处理,我做全国数据报告,以前需要好几个月,但是现在基于阿里云CABI做交通报告计算的时候只需要十分钟,就能把全国PB级数据处理完,由于阿里海量的系统帮助我们获取数据处理。大家如果进行海量大数据,首先第一个考虑是否有足够的基础能力帮助你处理。
有了数据、有了处理能力,怎么利用这些数据?其实是摆在我们面前的课题,对于交通大数据的应用其实分成两种,一种面向个人,满足用户出行、路况预测、用户和用户之间的交通信息,当有更多数据之后,而且我们数据来自于用户、来自于社会,其实我们把这些数据提供给社会、服务给我们政府、服务给我们社会组织,所以早期的时候我们开放,不光开放我们数据,而且开放我们数据处理。不仅仅对微观用户提供服务,也开始给宏观用户提供数据分析和应用,开始做交通大数据决策分析,对于整个城市交通拥堵成因进行分析,对异常道路进行数据挖掘,这些数据挖掘直接导致交通管理当中紧急调度,包括我们每一个交通管理部门数据进行相关决策的时候,我给他相关的数据支持,告诉他你所做事情是好还是坏,改变他们靠经验、靠拍脑门解决相关问题。
大雁市他决策来自于市长,大力发展公共交通,设立公交专用道对城市拥堵,解决还是加重?通过我们分析相反,公交专用道不饱和,大量车只能走社会道路,他拿到数据发现可能有问题,他就做出调整,这就是数据应用的案例。
走避路,这里边有一个图片,蓝线表示我们日常道路的情况,红线表现拥堵的情况。即使最拥堵占比也没有超过20%,大部分道路还是畅通的,客观来讲躲避拥堵可以拥堵分流,这样把道路路网分摊更加均衡,提升路网功能。通过大数据有效发现不同城市不同道路利用率差异,再通过调节道路利用率差异,提升道路供应能力。大数据最关键的本体是信息采集的成本。你刚才看阿里妈妈做拥堵行为研究,来自于淘宝、天猫数据,看我们交通大数据来自于几千万车主,对于我们高德成本非常低的模式,因为它有足够的规模,它的成本是传统数据采集成本几十分之一,举例北京交管局花四五亿覆盖数据采集,我们每秒有10万在地面相关的采集,我成本比它低很多。
当我们发现不同道路拥堵程度不一样的时候,我们给用户做出相关的选择,这是真实的案例。用户从首发大厦到国际中心,如果按常规的路径和走外围四环,我们差的时间30%,通过对用户道路大数据状态,通过进行合理调度,每年为用户节省350万小时,介绍尾气排放超过1亿。另外大数据改变我们出行的习惯,实际就是错峰的分析,每到十一、五一发行出行的指南,也是跟央视媒体合作。举例京藏高速,每到周末这些高速拥堵程度超过20米,拥堵时间超过2—3个小时,如果我走大广高速走旁边的高速节省70%,走八达岭高速如果选择走六环可以节省60分钟以上,通过跟政府媒体合作,把数据决策发布社会,实际改变我们每个人出行方式和习惯。
同时我们也跟媒体进行合作,比如来做城市堵点排行、必堵点排行,供他们发布。还有面向社会交通的拥堵评价,就是交通报告,交通报告是中国第一个能对不同城市拥堵情况进行综合排名,在中国影响力我不知道,但是在行业影响力非常大的。三点发交通报告,四点所在城市市长就会得到交通报告的内容,一般四点零十分当地主管交通的师长嗯之给我打电话,为什么我们进入前十名?理由是什么,所有政府对交通报告发布非常关注。
那么我现在给大家看一季度交通报告,一季度交通报告出行延时接近1.5倍,我们早晨上班可能需要一个小时,但是12点钟同样路可以需要30分钟,我们拥堵延时就是两倍,通过相对客观系数评价不同城市的拥堵情况,很多市民知道自己城市堵,但是不知道堵到什么?武汉市民觉得自己很堵,可能是堵城,但是一看数据一般前十名开外。相反很多北方城市经常上榜的城市,由于交通管理和道路的问题,今年二季度发现大量南方城市拥堵水平增长15—20%,而且大量南方城市像深圳、广东,从原来十几名迅速上升,原因我们做深度挖掘,最近滴滴顺风车对交通拥堵造成很大的影响。比如广州,有大量广州之外像佛山来广州拉,实时能增加将近10万汽车,如果我路上长时间增加十几万辆车,只要增加10%,就像最后一根稻草,对城市造成很大的压力。像这些研究在交通报告给大家公布。
去年9月份北京用户出行数据,每到标红点就是最堵的时候,最堵限4、9号那天,到9月初,8月份拥堵不是很明显,但是9月开学季拥堵马上上去,主要原因开学季,开学其实对我们城市拥堵占比还是很大的因素。另外还有9月份中欧节、周一到周五最堵,原因恶劣的天气可能对拥堵有影响。多种数据关联进行数据洞察和挖掘。
还有对于大数据来讲,当政府做一系列行为的时候,是否能够通过数据来验证这些结果,当武汉长江大桥的时候,我们迅速对数据调查发现,的确对整体拥堵有所下降,而且里程时间从30分钟一下降到2.8分钟,而且对上游拥堵下降56%,当然对下游像平安路,拥堵程度上升10%以上。当政府做出一系列管理上决策的时候,我们迅速可以通过大数据对决策进行量化分析,这样可以帮助他不断优化决策。
我还想谈一下大数据智能交通的问题,大家在用高德地图的时候,你会发现现在有大量的交警,沈阳、深圳、武汉交警全部入驻高德,我们探索智能交通出行新的模式,原来高德只是面向公众出行,面向公众出行远远不够,不能彻底解决用户出行问题,必须发动整个社会力量,把公众和行业全部整合一起,所以我们面向政府开放大数据,分析大数据都是免费开放。现在很多城市交警,利用高德提供数据分析平台,迅速把拥堵路段分析出来,根据拥堵路段进行相关的交警分配。我们高德地图所有用户在很快时间内,你上报的信息直接跟交警122和公安110对接,你发现这边拥堵,你发拥堵信息上报,122大厅看到广大用户的拥堵信息,很多拥堵都是主要道路的拥堵,因为一堵很容易路口堵死,几十分钟甚至几个小时不动,最可怕异常的拥堵。以前手段靠大家打电话,但是现在从开始,可以通过利用互联网数据或者车载数据,来帮助我们政府快速响应。
构建智能交通数据系统,不仅仅公众事情,而且是我们整个社会的事情,以前我们在做智能交通系统时,有一个很大的误区,大家闭门建大摄象头,还有对整个硬件投入,但是对于软件,我们是否通过大数据改变红绿灯状态,未来当你用高德地图,它可能跟信号系统联动,他把红绿灯信息反映车载云端,阿里跟高德已经在尝试,构建基于数据智能出行。以前我们都偏重系统上解决问题,后来发现光靠系统解决不了问题,因为我们整个城市出行不仅仅依赖于数据,真正出行是每个人,以前技术没有速达出行人进行相关的调度和信息采集,所以智能交通系统显着效率低下,但是互联网时代,我们通过手机、通过汽车传感系统,可以对每个个体进行精确的数据分析和编码分析,进行调度和指挥有可能提升,不进行社会基本秩序改造下,通过软实力的解决解决拥堵问题。
每个为超过三五千万用户增加,积累大量的用户行为,还可能进行商业化的研究,UBI研究和其他用户行为研究,这也是下一步要开展的工作,也希望跟各位有更多的合作,希望我的介绍对大家有更多帮助,谢谢!
相关文章
[错误报告][推荐][收藏] [打印] [关闭] [返回顶部]