- 课题背景和意义:
随着科技的进步,最近十几年里互联网也在高速发展,同时在线广告也逐渐发展成为互联网企业最具有价值的商业模式之一,展示出了巨大的市场潜力,受到广泛的关注和应用。例如:Google、Bing、百度等搜索引擎的搜索广告以及Amazon、eBay、阿里巴巴等电子商务平台的推荐广告,每年都会带来巨大的利益回报。点击率(CTR,Click-Through Rate)是用来衡量广告会被用户点击的可能性大小的指标,提高CTR预估的准确性不仅能够提高用户体验,增强广告的宣传效果,同时还会带来更多的广告收益,所以如何能更准确预估CTR就成了重中之重。
目前业界大多采用从日志中抽取大量特征来构建逻辑回归模型,使用大量的历史点击数据再来训练模型的方法。这种方法不仅无法很好的解决新广告没有历史点击数据带来的预估偏差的问题,而且还可能出现从日志中抽取大量特征而形成的高维度向量在模型训练过程中造成计算复杂度过载的情况,大大影响了在线广告点击率预估的准确率。
- 国内外研究现状:
在绝大部分情况下,在线广告的点击率预估和转化率预估采用相同的技术。点击率预估和转化率预估也存在一些不同之处。例如,展示到点击的时间间隔很短,而点击到转化的时间很长,可能达到几个小时,也可能达到几天。
目前在业界已经出现很多成熟的预估CTR的模型,并且都取得了不错的成果。根据是否基于广告的历史点击日志,大概可以分为以下两类:
一种是基于历史点击数据的模型,它们具有很大的优势,因为大量的历史点击数据可以很明确的反映出一条广告质量的优与劣,将其用于预估模型的下线训练,可以使模型很好的表现出这种特性。例如:[15]等建立了一个协同过滤系统来预估广告CTR;[10]等提出了用最大似然估计的方法来学习概率模型的参数,但这种模型只能适用于那些有历史点击记录的广告;[16]选择逻辑回归模型来作为训练模型,并提出用回退法来解决新广告没有点击数据的问题,具体步骤是:首先提取页面关键词,然后从广告索引中拉取与页面关键词匹配的广告,之后依次计算每条广告的点击率,特征权重通过线下使用机器学习算法从广告历史日志训练得出。由于特征是从大量广告点击日志中提取的,整个特征向量的维度可能特别高,对于之后的模型训练的计算会是一个不小的负担。
另一种是从原始数据中抽取特征并基于提取出的个性化特征进行建模,业界早期系统是基于页面和广告出现的单词和词组的相似度来选择广告,这种算法和本文提出的方法类似,将页面和广告根据抽取的特征抽象为不同的的向量,最优广告就是最接近于页面向量的广告。但是这个方法有个很大的缺点,就是太过于依赖先模型而忽略广告展示点击日志带来的影响。[11]曾提出的特征工程法(Feature Engineered)模型来提取广告的特征;[18]等人选择利用人工神经网络对日志中抽取的大量特征进行选择,选取出对CTR影响最大的特征因素,从而可以降低特征向量维度;[17]等人从原始数据中抽取特征并在此特征基础上建立高等统计模型;[5]等人抽取了广告购买关键字及相关关键字、决定广告质量的相关属性集合、购买关键字集合、关键字在查询曰志中出现的频率等对新广告建立预测模型;[9]是第一个提出广告位置这一特征对于广告点击率预测的重要性的研究者;[4]等人则选取了广告深度(一页的展示广告总数)、广告位置、检索词意图进行特征分析。
但是上述的广告点击率预估系统解决方案无法很好地解决新广告没有历史点击数据的问题,并且在高维度特征向量、大数量的点击日志上的训练速度慢,可扩展性较差,无法应对线上广告所需的高性能、快速迭代的要求。
- 立论依据:
以在线广告点击率为对象,解决在线广告点击率预估系统的功能和性能提高问题,期待取得以下两样结果:(1)对大众点评在线广告点击率预估系统进行功能和性能方面的需求分析;(2)给出基于深度学习模型的在线广告点击率预估系统的实现。
- 参考文献:
- 刘旭. 基于深度学习的互联网广告点击率预估方法研究[D].
- 寇茜茜. 基于深度学习的CTR预测研究[D].
- 王文涛. 基于深度学习的CTR预估算法研究[D].
- R.Bckkcrman, M.Bllcnko and J.Langford.Scaling up machine learning:Parallel and distributed approaches,2011.
- M.Richardson,E.Dominowska and R.Ragno.Preadicting clicks:estimating the click-through rate for new ads,In WWW,pages 521-530,2007
- 刘梦娟, 曾贵川, 岳威, et al. 面向展示广告的点击率预测模型综述[J]. 计算机科学, 2019(7).
- 陈巧红[1], 余仕敏[1], 贾宇波. 告点击率预估技术综述[J]. 浙江理工大学学报, 2015(33):857.
- 刘华玲, 恽文婧, 林蓓, et al. 网络广告点击率预估的特征学习及技术研究进展[J]. 浙江大学学报(理学版), 2019(5).
- A.Broder,MCiaramita,M.Fontoura,E.Gabrilovich,V.Josifovski,D.Metzler,V.Murdock and V.Plachouras.To swing or not to swing: learning when (not) to advertise.In Proceeding of the 17th ACM conference on Information and knowledge managemen t ,CIKM 08,pages 1003-1012,New York,NY,USA,2008.ACM
- K.Dembczynski,W.Kotlowski and D.Weiss.Predicting adsrsquo; click-through rate with decision rules.In WWW 2008 Beijing,2008.
- M.Gupta.Predicting click through rate for job listings.In WWW 2009 Madri d.2009.
- 周永. 基于特征学习的广告点击率预估技术研究[D]. 2014.
- 马雅从. 基于特征组合的展示广告点击率预估模型研究[D].
- 潘博, 张青川, 于重重, et al. FM集成模型在广告点击率预估中的应用[J]. 计算机应用与软件, 2018, 35(1).
- A.K.Menon,K.P.Chitrapura,S.Garg,D.Agarwal and N.KotaResponse prediction using collaborative filtering with hierarchies and side-information.InProceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining (KDDrsquo;11).ACM,New York,NY,USA,2011:141-149
- M.Regelson and D.Fain.M.Regelson and D.Fain.Predicting click-through rate using keyword cluters.In Proceedings of the Second Workshoro on Sroonsored Scorch Auctions.2006
- C.J.Wang and H.H.Chen.Learning user behaviors for advertisements click predivtion.In SIGIR 2011 Workshop:Internet Advertising,Beijing,China,2011.
- Y Zhang,B.J.Jansen and A.Spink.Identification of factors predicting clickthough in web searching using neural network analysis.Journal of the Ameracan Society for Information Science and Technology,2008,60:1-14
以上是毕业论文开题文献,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。