272.微头条(2 / 4)
整个推荐模型中,会有些可量化的数据,比如用户行为:点击率、点赞、评论转发;用户环境数据:地理位置、时间;热度特征:全局、分类和主题热度。
基于内容和用户进行匹配,这就是老程设想的创新性。当然,也不是说没人想到这个点子。不过开始做的人应该是不多。”
陈东卓微微点头,“这个我可以理解路总,但在实现上,我想是有比较大的问题。首先是初始启动,针对内容我们需要进行标签标注和分类,只有内容的训练模型ok了,我们才能够将内容和用户进行关联。”
路舟笑了笑,“这个你可以放心。数据源,梦谷是有人提供。在分类上,我们采用层次化的文本分类,比如大类科技、体育、财经,如体育再细分篮球足球,再一层层往下细分。
而你们需要将它不断细化和颗粒化,比如娱乐中最下层级甚至要具体到人,比如某明星之类。颗粒越小,标识度越高,那推荐效果自然更理想。
我想,杨密的用户应该很喜欢有她的八卦消息。”
陈东卓,“那么接下来?”
路舟,“既然内容分类层级有了,自然是文章内容输入到系统中,系统为每篇文章打上分类标签。
随着内容推送到用户眼前,客户端即可收集用户行为,比如根据他的点击、留存,进而判断他的喜好,这样用户标签也就有了。
而对初始用户而言,那就是首先选择喜好的大类,接着推送分类热度高的文章,再进一步收集用户行为。”
陈东卓听了显然是明白了许多,这可比盲头苍蝇到处乱撞要快上许多。
他显得有些兴奋,“明白路总!我这就下去安排。”
路舟,“别急。批量计算,目前微讯或者梦谷云是满足不了实时分析的要求,针对这点你需要单独进行一些设计。当然,短时间内是可以适当牺牲这部分需要。
至于算法方面,你让老程联系一下实验室,如果有新的成果进展可以做些大胆尝试。别怕出错,改就是。
数据的问题,我会安排人和你对接。”
↑返回顶部↑
基于内容和用户进行匹配,这就是老程设想的创新性。当然,也不是说没人想到这个点子。不过开始做的人应该是不多。”
陈东卓微微点头,“这个我可以理解路总,但在实现上,我想是有比较大的问题。首先是初始启动,针对内容我们需要进行标签标注和分类,只有内容的训练模型ok了,我们才能够将内容和用户进行关联。”
路舟笑了笑,“这个你可以放心。数据源,梦谷是有人提供。在分类上,我们采用层次化的文本分类,比如大类科技、体育、财经,如体育再细分篮球足球,再一层层往下细分。
而你们需要将它不断细化和颗粒化,比如娱乐中最下层级甚至要具体到人,比如某明星之类。颗粒越小,标识度越高,那推荐效果自然更理想。
我想,杨密的用户应该很喜欢有她的八卦消息。”
陈东卓,“那么接下来?”
路舟,“既然内容分类层级有了,自然是文章内容输入到系统中,系统为每篇文章打上分类标签。
随着内容推送到用户眼前,客户端即可收集用户行为,比如根据他的点击、留存,进而判断他的喜好,这样用户标签也就有了。
而对初始用户而言,那就是首先选择喜好的大类,接着推送分类热度高的文章,再进一步收集用户行为。”
陈东卓听了显然是明白了许多,这可比盲头苍蝇到处乱撞要快上许多。
他显得有些兴奋,“明白路总!我这就下去安排。”
路舟,“别急。批量计算,目前微讯或者梦谷云是满足不了实时分析的要求,针对这点你需要单独进行一些设计。当然,短时间内是可以适当牺牲这部分需要。
至于算法方面,你让老程联系一下实验室,如果有新的成果进展可以做些大胆尝试。别怕出错,改就是。
数据的问题,我会安排人和你对接。”
↑返回顶部↑