?桔妹导读:定位是所有LBS服务的基础服务。在滴滴的业务场景下,定位主要是指各类终端设备的位置,包括手机、单车、行车记录仪、车机端等。作为底层服务,在滴滴日均提供700亿次定位服务,支撑着平台的各类业务。
离线建库主要是基于有GPS时的采集数据,建指纹库的过程。指纹库中记录AP的各类信息在不同地理 格内的采集数据分布,如下图所示。
纵轴为采集数据中的AP编 ,横轴为空间 格编码,相交点表示每个AP在对应 格中的采集信 强度分布。空值表示AP在对应的位置无采集数据。
以一个实时定位query信息:(AP1:RSSI=1,AP3:RSSI=0)为例,介绍 格召回、排序、平滑的过程。
召回阶段,基于扫描到的AP1和AP3,可以召回Grid1、Grid2、Grid4;
排序阶段,结合离线AP库,基于独立性假设和贝叶斯公式,计算各 格的权重:
其中,
##▍2.2 有监督回归模型
无监督概率模型的方法,思路清晰易懂,易实现,是早期 络定位的主要方式。但有以下问题:
-
联合概率的方式对采集信息不充分的位置不友好,例如上例
原始特征中的稠密特征和低维稀疏特征经过GBDT进行特征组合、交叉;GBDT输出的叶子节点编 与高维稀疏特征经过DeepFM 络,最终输出 格与真值的位置偏差。
TopK 格平滑:预测偏差距离从小到大排序,截取TopK 格;爬山法,梯度下降求解最优坐标。
##▍2.3 端到端CNN模型
有监督模型在特征利用、模型结构、优化目标等方面提供了更大的操作空间,可以极大地打开天花板。上线后定位精度等指标取得了显著的收益。
但该方法仍有以下问题:
-
每个 格孤立刻画,信息采集时的不均衡、有偏的问题无法有效解决
-
TopK平滑层与排序层割裂,无法联合优化,且引入部分人工超参
对于以上问题,考虑以下解决方案:
-
CNN 络:充分利用空间信息的局部相关性,增强特征的提取能力
-
端到端 络:合并排序与平滑层,改为直接回归位置坐标,目标更统一,减少人工超参
最终,整体 络结构如下:
络结构:在CNN 络部分,采用多尺度卷积核提取特征后,经过两个卷积+池化层后,将特征图打平。Wide部分稀疏特征经过embedding后,与稠密特征级联。两部分tensor级联后经过全连接层,最终输出与召回中心点的位置偏差。
Label与Loss:label为真实位置与召回中心位置的偏移dx和dy,召回中心点+预测偏移即得预测位置。loss最初使用的是经纬度的L2 loss:
CNN模型在线上AB实验取得了显著的收益,已全量上线。CNN端到端模型升级了信息的表达方式,由单 格、结构化的信息表达改为了Image的表达方式,配合cnn 络结构,获取了效果的显著提升;并且将几十甚至几百个 格的预测问题改为了单次位置回归问题,虽然模型复杂度有所增加,但整体性能基本持平。
##▍2.4 线上效果
络定位三阶段的模型先后上线进行了AB对比实验。以基站定位三个主要技术指标为例,对比结果如下表所示:
2017年加入滴滴,目前从事地图定位算法方向,多年LBS领域算法研究工作,在滴滴先后从事猜你想去、上下车点推荐、定位算法等方向的开发工作。
201#8年加入滴滴,主要从事 络定位、融合定位等方向的算法开发工作。
##团队招聘 滴滴地图与公交事业群定位团队负责为滴滴平台上的司乘双方提供精准的定位服务,构建出行基础设施,发挥平台的大数据优势,应用概率统计、机器学习、深度学习等技术,在GPS质量优化、 络定位、惯导推算、融合定位等细分方向上持续深耕,以技术驱动用户体验的提升。团队长期招聘算法工程师,包括机器学习、惯导推算等方向,欢迎有兴趣的小伙伴加入,可投递简历至 diditech@didiglobal.com,邮件请邮件主题请命名为「姓名-应聘部门-应聘方向」。
http://mp.weixin.qq.com/s_biz=MzU1ODEzNjI2NA==&mid=2247502881&idx=1&sn=fb1388bc3f67e3b1b8c8befbf4f350cf&chksm=fc29a286cb5e2b90a2426407707d14b64155c54218fedc844748d0ababebbe7a6bc44e9f7968&scene=21#wechat_redirect
http://weixin.qq.com/r/Hi8FHc7EiJP3rYp_93oM (二维码自动识别)
滴滴技术 出品
相关资源:橘子快速启动软件(橘子启动器)v3.0绿色免费版-其它代码类资源…
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!
-