阿里妈妈搜索广告转化预测
成员
黄焯恒,李博,毕丽阳,闫斌
问题描述
1、问题背景分析
搜索广告是一种常见的互联网营销方式,商家(广告主)根据商品特点自主购买特定的关键词,当用户输入这些关键词时相应的广告商品就会展示在用户看到的页面中。随着互联网的快速发展,搜索广告和电商广告在互联网广告中的占比越来越高,成为互联网行业最主要的商业模式之一。由此可见,搜索广告的巨大商业价值和研究价值。 阿里巴巴电子商务平台积累了海量的交易数据。阿里妈妈作为阿里巴巴广告业务部门,在过去几年利用这些数据预测用户的购买意向,有效提高了用户的购物体验和广告主的ROI。然而,作为一个复杂的生态系统,电商平台中的用户行为偏好、商品长尾分布、热点事件营销等因素依然给转化率预估带来了巨大挑战。比如,在双十一购物狂欢节期间,商家和平台的促销活动会导致流量分布变化剧烈,在正常流量上训练的模型无法很好地匹配这些特殊流量。如何更好地利用海量的交易数据来高效准确地预测用户的购买意向,是本次项目需要继续解决的技术难题。
2、问题描述
以阿里电商广告为研究对象,提供了淘宝平台的海量真实交易数据,参赛选手通过人工智能技术构建预测模型预估用户的购买意向,即给定广告点击相关的用户(user)、广告商品(ad)、检索词(query)、上下文内容(context)、商店(shop)等信息的条件下预测广告产生购买行为的概率(pCVR),形式化定义为:pCVR=P(conversion=1 | query, user, ad, context, shop)。 2.1. 数据准备 淘宝平台的海量真实交易数据;数据预处理,按不同时间(特殊时期)进行分析商品的转化率; 2.2. 模型建立 根据平时时间和特殊时间选择合适的训练模型,利用CTR等相关指标作为参考,建立预测模型
项目评估
评估指标 通过logarithmic loss(记为logloss)评估模型效果(越小越好), 公式如下:
logloss=-\frac{1}{N}\sum_{i=1}^{N}(y_{i}log(p_{i})+(1-y_{i})log(1-p_{i}))
其中N表示测试集样本数量,yi表示测试集中第i个样本的真实标签,pi表示第i个样本的预估转化率
项目分工
数据处理:李博 算法和实现:黄焯恒,毕丽阳 报告及PPT制作:闫斌