·首先就是模型平衡档,这个目录就是根据五大部分加后续规划,可能会加个后续规划。第一部分就背景说明,第二部分是什么?当做回顾一下。第二部分就是建模,建模发介绍。第三部分就是样本定义及分布,表现期y的定义和酵母样本的分布。第四个就是模型效果,这一个阐述模型的离合情况,k s、i u c、k s table等等。
·还可以做一些补充分析,与脑科、脑模型的交叉分析。还有最后关键上面的模型的入模特征的描述,包括可用的数卷的一些特征讲解一下。肉模特征的作图,做一个battle的走势图,可能会加一些成本分析。成本分析后面我给大家讲,肉模变量成是用哪些数据源对应的什么成本。
这样多个模型进行选择,比如模型a用a r模型做的十五个入模变量,效果可能是k s四十,模型b也用x t b做模型,叫模型b。入模是五十个变量,五十个变量的效果可能是四十一、四十二,但是成本就不一样了。十五个变量对应的成本可能就是来源于三个数据,每调用一次价格可能都两块钱。

差的b可能需要五十个变量,调用一次可能需要三块钱,而仅仅k s只提高了零点二,不如用l2模型考量成本的因素。
·后面还有后续需要改进的地方,比如需不需要分客群建模,提出这样的遐想,尿酸的同学去确定一下用什么样的客群去划分,去划分什么样的客群,先记后本的客户需不要单独再做个模型等等。就类似于后续的规划,这个跟之前截图是一样的,就是些模板什么样的业务,背景是什么,为什么要开发模型,老模型当时为什么不稳定以及ks到达多少了,为什么要开发新模型,预期的ks达到多少,预期的区分就达到多少等等。
用哪些数据源,用哪些观测样本,观测样本数多少时间段等等。建模方案的介绍就是如何筛选样本,用什么样的模型,样本的定义和分布,y怎么定义的,据外定义,卓越的分布是怎么样的,是否稳定等等。模型的离合效果就比较好了,lr达到六十,零点六一,而且非常接近。
kstable也是非常单调的,并且提升度非常非常大,高分段就是高率概率比较高的,这一段外购物非常明显,百分之七十接近,这个非常好,可以直接作为策略了,直接可以砍掉了。像前大于零点一五的概率大于零点一五的可以直接进行拒绝。
·然后样本的一些描述等等,入不变的描述是否单调,分布情况等等。
·成本分析就是比如这个例子当中可能用到了内部数据,比如十五个特征,有第三个是内部数据,就是可能APP上获取的一些数据。
·还有几个变量,五个特征是用的file去采购的一些数据,file分也是非常贵的,可能一块钱钓上一次。
·然后同盾等的外部数据,多投数据,还有消费数据,消费记录等等,就这样的数据。
·还有一些融汇的三方的设备信息,还有一些多投的一些等等,可能钓一次零点八。