算法比赛,无人机

上周开始做携程的销量预测比赛,基于出行产品23个月的成交明细,预测之后14个月的每月销量。尝试了用时序预测的方式做,效果不好,也可能是由于之前没有接触过时序预测的方法。目前选择了回归,建了14个模型,第1个模型用9个月销量预测下一个月,第2个模型用9个月数据隔开一个月预测下一个月,等等。目前离及格线还有距离。

读研时接触的问题通常是一个被同行研究过的问题,在已知的数据集上跑通baseline,然后试着超越,经历更多的放在算法调优、特征选取上。现实问题来自实际需求,可能没有明显的解法,需要对问题进行规约,也许需要数据挖掘,也许简单的规则也能做好。就携程这个比赛来看,formulation比算法更重要。

本周末开始看京东的购买行为预测问题,和之前做过的天猫购买行为预测类似。想起之前轴逼地试图用原始行为数据建模,结果惨败。看了之前天猫比赛的获奖者分享,和初步构想类似。但又碰到了新问题,成交数据在千万级别,单机内存比较难处理了,好用的数仓服务似乎都不便宜,比赛群里有人吐槽本次比赛会提升内存销量,京东打得一手好牌。

讨论完比赛困倦无比,哈欠连连,缺乏锻炼,身体状况不佳。

听说实验室买了Mavic,向师弟借来玩。机翼可以折叠,遥控器也很小,整套装备装在包里,看起来不比一个单反相机更大。悬停、降落也比早起的Phamton稳定可靠,唯独飞起来还是有点怕。

晚上重启跑步,力竭骑共享单车回家。

Leave a Reply

Your email address will not be published. Required fields are marked *