42

头条踢馆搜索

 5 years ago
source link: http://www.lieyunwang.com/archives/454151?amp%3Butm_medium=referral
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

【猎云网(微信:)北京】4月30日报道(文/方文)

头条在2019年初开始主推搜索的时候,百度正在发力短视频。上周,百度和头条又打起来了,就是因为头条的搜索业务。

4月26日,百度起诉头条在搜索结果中大量抓取百度搜索top1的结果,要求立即停止侵权,赔偿9000万元并连续30天在其APP及网站首页道歉。

在同一天,抖音以不正当竞争为由将百度诉至法院,因发现百度在搜索中窃取了海量抖音短视频。抖音要求百度立即停止侵权,赔偿9000万元并在百度首页连续道歉30天。

百度和头条之间的竞争一直互相交错、纠缠不清。信息流、短视频,这些业务的争夺,动辄就是百亿的广告市场份额的得失。如果说百度原来是大街上的一家中餐厅,头条的信息流相当于在隔壁开了一家西餐厅,百度和头条的关系属于竞争,但不至于水火不容。现在头条开始做搜索,就好比在路对面又开了一家中餐厅,这是直接进攻百度大本营,如果说之前的争斗关乎钱,那这次是关乎基业,关乎命,可谓是生死之战。

百度和头条不断地侵入到对方的领域,业务也走得越来越像。就在上周,有媒体报道称百度在开发一款产品,形态是线上的抖音+线下的歌手。为何百度和头条会打得如此的胶着、激烈?其根本在于两家公司的基业存在着很多的相似之处,无论是主动搜索还是被动推荐,百度和头条做的,都是信息筛选的生意。而信息筛选的基础,就是数据(内容+服务)和算法。

通过数据和算法,搜索和推荐这两种形态的业务,有了衔接点和过渡点,双方的重合度就会越来越高。当头条的推荐做的足够好的时候,做搜索就是必然。

一、百度和头条的算法

搜索的两个基础条件:数据和算法。百度的搜索引擎结果排序和头条的信息流推荐,都是算法。

这两种算法,从表现形式上是不同的。搜索引擎的算法追求的是精准,用户输入关键词,如果返回结果(不考虑广告)是10条,那越优质的内容应该排得越靠前。比如说,Top1就应该是当前最好的答案。对于好的标准,是基于结果页被引用的次数等维度,这个结果对于大多数人来说是最优结果,在当前关键字下,是一个标准的求解。

头条的算法,基于内容生态属于消费型,容错率比百度高。比如,对于某个用户,当前一屏10条内容,可以推荐5条体育新闻,5条娱乐新闻,都可能是用户感兴趣的。而这10条新闻中,有2条可能用户兴趣度并不高。但是对于内容消费型的推荐结果,是允许这种情况存在,2条匹配度不高的内容并不会对用户使用体验造成特别大的影响。

头条的算法,推荐维度上比较复杂。我们可以这样具象化的简单理解:百度的搜索结果,是一条内容流,基于搜索关键词展现相关度最高的内容。而头条用户每屏内容,是基于用户兴趣,如体育、娱乐等多条内容流,初始状态下,是根据用户特征进行的推荐。比如,用户在没有发起搜索的时候,其实可以认为信息流在默认地为某个特征,比如“体育”展示搜索结果。

当用户在头条主动发起搜索后,信息流在原先的结果中,根据关键字匹配出相关度更高的内容展示。比如搜索“足球”,就会在“体育”的搜索结果中选择与足球相关的内容,减少甚至去除原先娱乐特征下的内容。

也就是说,头条的推荐结果,本身就是多个小的搜索引擎在同时工作,推荐和搜索,本质上是没有太大的差别。

那么,头条的搜索引擎做的够好吗?这在信息流大战中头条已经证明了自己,头条的算法无论是在灵敏度还是复杂度上,都是建立起了一定的壁垒。

算法推荐,可以细分为三个阶段:数据准备、数据检索和数据推荐。头条经过多年的头条号、头条问答、微头条等内容建立,算法的不断优化,起码已经准备得有能力一战了。

头条和百度的搜索,又有可能不一样。百度虽然多次提到要做搜索结果千人千面,但目前还是给每位用户推荐标准版的结果。举个例子,如果搜索结果的来源有机构、个人站点等多个维度,那机构站点的权重可能高于个人站点,导致相同的内容下,机构站点会在显示结果中排在个人站点前面。由于当前关键字下搜索结果的排序是基于网站本身的权重和属性,对于所有的用户最终显示的结果都一样的。

而头条目前的内容体系除了阅、转、评、赞等赋予内容本身的属性和权重外,用户自身还存在大量的特征,搜索结果对应的匹配,又多了一层用户特征的过滤,因此每一个用户在同样关键字的搜索结果下,会得到不同的内容展示,也就是千人千面。目前不同用户在头条的搜索结果差异并不明显,但是确实存在不同。

百度不是说没有用户特征,而是百度多年来未完善的用户体系,导致至今没有很准确的用户特征。这也是百度在今年春节期间,除了大力推广手机百度和视频等单独的应用外,也希望通过打通用户账号来建立一个比较完善的用户体系。

二、百度和头条的数据

搜索的另一个基础条件是数据。头条和百度在数据储备上差距大吗?谁的数据更优?

百度自然不必说,通过多年的积累,被认为拥有全网的数据,但现在对百度来说情况早已开始起变化。比如说拥有海量用户微信的数据,百度拿不到;头条号的数据,百度拿不到。

反观头条,其数据储备正在快速的增长。头条起家时用爬虫网罗了大量的数据,媒体的资讯、微博的内容,到现在头条建立起来的内容生态,头条号、微头条、问答,以及第三方内容,比如互动百科、360百科等,头条的数据储备也具备开展搜索业务的基础。甚至,对于大多数普通的内容使用者来说,头条的数据优于百度。

百度近些年来在内容生态的短缺,造成了与互联网信息的割裂,百度对内容的把控开始显得不足。很多企业在近些年逐渐地把网站作为一个基本信息展现的地方,甚至放弃PC端网站。反而是企业的头条号、公众号,有大量的信息不断地产出,而这是百度无法收录到的。

直到百家号的出现。今年初,一篇《搜索引擎已死》,重新挑起了人们对于百度生态的怀疑,百度大力发展的百家号,被指是将流量圈在自家体系中。事实上,对于百度来讲,这是对自身体系的一种补救。百家号的这种策略,从商业的角度来看是正确的,如果没做百家号,那现在头条做搜索,百度会更加的被动。反观头条,依仗得不就是数据逐渐丰富的优势吗?

三、头条做搜索的必然

头条拥有足够的数据储备和算法能力,进军搜索是必然。而且,张一鸣也有足够的商业动力去这么做。头条发展凶猛,但是头条有压力吗?有的。互联网红利消失,每一家互联网公司都有发展压力,当然头条也有。前些年头条的发展速度太快了,以致于现在对于头条来说,想要达到之前的增速几乎是不可能了。而就在今年初,传出了今日头条母公司字节跳动要上市的消息。如果要在上市后给资本市场交代,那搜索这块既成熟,又顺手,又肥的业务,是头条最好的选择。

如果说百度某天突然消失了,李彦宏手里只剩全网的数据和一套成型的算法,那李彦宏会做什么?李彦宏应该依然会做搜索引擎,或者去做一个头条。

现在的情况是,张一鸣恰巧有家店面,还有几个不错的厨子。那对他来说,开个餐馆,是顺气自然,也是必然。这也就是,头条现在具备了数据储备,具备了算法能力,去做搜索也是必然。

搜索引擎需要的数据,无非就是内容+服务。内容方面,百度和头条各有优劣,但是服务,两家的能力都不能算及格。

近些年来,百度的搜索引擎对用户在交易(服务)方面的能力不断地弱化,消费者的习惯改变,早已不会在PC甚至是移动端的网页上进行交易。而且,百度在账号体系和支付方面的不足,甚至自身都不能完成很好的闭环。同样,头条在这方面和百度半斤八两,这也就不难理解,头条和百度,都在跟进小程序了,这是完成服务闭环的一个解决方案。百度和头条今年春节大战的红包提现,都有意识在支付的环节上进行完善。

百度和头条,在搜索引擎的基础建设上,一个是守城,一个是进攻。城墙并非牢不可破,进攻方并非无坚不摧,这也是,双方才有打这场仗的必要。搜索的战场,未完,待续...


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK