淘宝综合搜索,到底是如何排序的?(下)
你好,欢迎收听贾真5分钟,我是贾真,我们今天继续昨天的话题,谈淘宝综合搜索,是如何排序的。
我们关于综合排序上篇的内容,讲的是淘宝搜索筛选商品的纬度,怎么识别什么商品和顾客的搜索关键词匹配,并且在匹配用户需求的商品里选出人气比较高的。也许到这里,聪明的你可能发现一个问题,这里面得到的商品的排序结果,默认了一个结果,就是所有的顾客在搜索同一个词的时候,需求都是一样的,但是现实中这是不合理的。举例说明,男性和女性在搜索“T恤“这个词,需求就不一样;高富帅和学生在搜索“T恤“这个词,需求也不一样。
这里面就要讲到搜索排序的第二个主要纬度,人群标签权重。
人群标签的本质,是做双向匹配,一类人群标签下的顾客匹配某个对应标签的商品。这里的两个标签,人群标签和商品标签,因为这两个标签都是变量,就好像是“先有鸡,还是先有蛋“的博弈,到底是先确定人群标签,在对应的生成匹配的商品标签,还是先确定商品标签,再生成对应的人群标签呢?
阿里巴巴天猫团队里,有个重要的部门,叫品牌打分,他们基于目前线上和线下所有的品牌销售数据,品牌活跃店铺数量和活跃商品数量的数据,给淘宝所有的品牌打分,大概的打分规则是这样的:0-3分,是没有品牌或者低知名度的贴牌商品;3-4分,是有一定数据量的品牌;4-5分,是进行了线上线下布局的,有实体店规模的知名品牌;5分以上,是国际知名品牌。
有了这个品牌分级数据之后,淘宝就会根据用户历史购买品牌的等级情况,进行第一次的人群打标签,经常买国际大牌的一个人群标签,然后把所有得到这个标签的顾客,进行购物反馈,如果这个标签的人,在购买连衣裙的时候,大部分购买的是400元以上的连衣裙,那么这些400元价格以上的宝贝,就会打上高消费人群标签,接下来这个人群标签下的其他所有顾客,在搜索相同关键词的时候,这些打上标签的宝贝就会优先展示。
我们曾经想测试下,淘宝搜索的标签匹配,目前能智能到什么程度,是不是可以完全做到每个商品都准确的打上标签,比如某个商品虽然价格很低,但是5分以上标签的人群仍然很喜欢,那么是否可以做到这个低价的商品,仍然能展示在5分标签人群的搜索结果里。
我们测试的方式是,先找三个人手机搜索某个关键词,确定无线前13名的展示最低价,比如是128元,因为我们的商品虽然在销量排序是第二名,但是因为价格是99元,所以默认搜索结果里不能展示。接下来,我们调整宝贝一口价,把搜索展示价格从99元提高到128,刷新搜索词后这个产品就出现在我们的搜索结果页面里。
所以我们得到的结论,就是搜索到目前位置商品的标签,并没有打的很细,搜索展示价格仍然是商品和人群匹配的主要纬度。
这就可以解释,为什么那些单个商品30元,设置销售价格59元,买一送一,或者拍下立减30元,仍然可以拿到搜索流量。
除了有人群消费能力标签外,人群还会有年龄,性别,地域和时间标签等,我之前在看阿里数据负责人的书,里面写到阿里巴巴给每个用户13个性别标签,因为他们发现,一个用户账号并不一定只有一个人用,可能是家庭账户,所以它上午的时候,可能是女人,下午就是男人,晚上是儿童,某个时间又可能是老人。
当给了所有用户打上了属于自己的人群标签后,接下来再对于每个人群分别执行上节课我们说的商品纬度的算法,就得到了一个关键词下的每个人群标签结果,这样就实现了搜索结果的“千人百面“。
没错,是千人百面,并不是千人千面,因为这个结果是每个相同标签的人,看到的结果是一样。比如和你相同标签的人群,搜索手机壳的时候从来不会去点击和购买9.9元的手机壳,那么你在初次搜索手机壳的时候,就看不到这个价格的手机壳;如果你这个标签的大部分人,搜索手机壳都点击了25元以上的手机壳,那么你的搜索结果的主要价格段就在25元。
这个算法利用中国的一句老话:“物以类聚,人以群分“。但是,也可能有例外,比如虽然我购买其他品类都买国际品牌,但是我买手机壳,就买9.9元就可以了。所以,之前的课程讲搜索历史行为标签的时候,我们讲到,搜索会基于你的个人行为,即时的更新你的商品展示结果。
最后,人群标签+个人行为实时反馈,就把搜索结果从千人百面升级成了千人千面,这就是我们说的搜索排序的第二个纬度,人群标签权重。
除了商品纬度和人群纬度之外,淘宝搜索排序结果,为了保证平台生态的健康发展,为了展示商品的丰富性,还有第三个比较重要的纬度,叫平台生态纬度,从平台可持续发展角度,去设置一些算法。
这里面就有我们反复提到的,搜索打散原则:同一个关键词下,无线搜索结果前13名,只展示一个店铺的两个宝贝(不算直通车);同人店铺限制:同一个团队,运营的多个商品相同的店铺,会收到搜索流量的限制(同时满足两个条件,同团队,同产品)。
商品纬度和人气纬度只影响单品,而平台生态纬度,影响的整店搜索流量的获取,对于卖家更加重要,但是因为这两个规则,我们前面的“贾真5分钟“内容里反复讲过,在这里就不复述了,不了解的同学可以加我助理微信jiazhen1080,和助理索取。
我们说到,我们自己在做淘宝店铺运营的时候,一定要做“猜想-执行-验证“的循环才能真正成长,做每个事情先从逻辑上给出假设,然后把猜想的部分执行下来,最后找数据验证我们的假设是否正确,如果不正确,就循环执行猜想执行验证,一直到提高为止。
淘宝搜索的算法是否会大范围使用,也是要做这种评估分析。他们的做法是,先找一定数量的用户当“小白鼠“,然后把这些“小白鼠“尽量公平的分成几组放到“桶“里,当作对照测试组;接下来,淘宝搜索会给每个“测试桶“的小白鼠使用不同的算法,最后来看每个桶的最终核心数据反馈结果,哪个桶的小白鼠反馈数据好,就证明哪个桶的算法更适合。
所以,有的时候你店铺的某个商品,在周五,周六的搜索流量突然降低,周一恢复,很可能原因就是你的商品周五在某个桶里被测试,这个测试的新算法不太好,所以在周一的时候淘宝搜索就恢复之前的算法,你的搜索流量就恢复了。
好了,我们今天的贾真5分钟分享就到这里,因为淘宝搜索算法所有规则都是个“黑匣子“,外面的人不可能看到里面,我分享的所有算法是我基于实操的猜测后的测试结果,不一定正确,大家辩证的去看,希望用贾真的知识,能够唤醒你的智慧。
贾真5分钟,每周一到周五晚上8点更新,和贾真一起,不断更新自己的淘宝运营能力。