其次,个性化的因数。虽然会有很多文章说视频的主题、风格、之类等等,但其中非常重要的是视频和视频之间的相关性,即行业内称为类似item2item的技术。抱大腿是很重要的,你的视频里面本身存在一些相关的热门视频,容易给你带来流量,和知乎的蹭热点是一个道理。
再者,不要把现在技术想的太高大上,比如认为模型在实时理解视频的内容含义,所以标题还是很重要的,一个好的标题,不仅能吸引人的眼球,还要尽量让算法解析出足够多的信息。在PC时代,seo风靡一时,其实在app内,SEO也是要做的。一般都是用搜索引擎去处理这些视频内容,而搜索引擎会对文本切词、建索引,再与视频的标题、描述文本等去匹配。多一些可能会被搜的关键词,匹配到的概率会变高,也是为什么淘宝之类的商品会堆砌标题的关键词。
最后,机器学习在里面,始终是在预估一定的概率,模型最求的是全局最优解。所以容易存在各种badcase,流量会上下波动,这些是不可避免的。模型如果做得好,特征数量有可能会几十亿、几百亿,再加上一些非线性的组合,解释性并不强。但大家只要想清楚一个问题就行,模型在优化什么,新闻类的一般是点击率,视频类的一般就是播放完成率,各个业务定义不一样。你需要做的事情是,让自己的作品或内容,尽量往模型追求的结果去靠,剩下的交给系统去吧。
补充一点,所有上述的因子,对新的视频都是不友好的,所以模型在设计时,有些策略是直接扶持新品,比如新品期的视频有流量扶持。也有些策略是尝试Explorer&Exploit,简单来讲就是先拿一部分流量给这些新品试下,好的继续,差的淘汰。