9年网站SEO优化实战经验,5年全网营销推广服务,3年互联网运营思维应用
主页 > SEO优化 > seo优化关键词:百度如何判断网页和关键词相关性的依据

seo优化关键词:百度如何判断网页和关键词相关性的依据

来源:墨钰科技    作者:墨钰科技    发布时间:2020-11-21 19:58
[文章简介]徐州SEO外包今日资讯:在一些站长群里面,很多站长会和博主一样常常会听到一种声音,我每天都在写原创文章,可是关键词什么排名都没有。似乎大家听惯了这种声音,认为做SEO就是...

  徐州SEO外包今日资讯:在一些站长群里面,很多站长会和博主一样常常会听到一种声音,我每天都在写原创文章,可是关键词什么排名都没有。似乎大家听惯了这种声音,认为做SEO就是看百度的脸色,侃侃而过。当然,也有站长会支招,除了写优质原创内容,也要提升网页关键词密度,网页关键词密度控制在2%-8%之间,然后分析关键词布局,首段和结尾一般会出现关键词。这些文章SEO写作技巧已被众多站长所接受,很多站长也套用此方法去优化自己的网页。这些大多是前人的经验之谈,其中却存在了很多SEO站长不知道的原理,作为一名SEO工作者,我们应该有探索精神,下面深圳SEO博客做个浅析。

seo优化关键词:百度如何判断网页和关键词相关性的依据

  百度如何判断页面与关键词的相关度

  一个网页是否和关键词相匹配,首先SEO站长要明白两个概念,一个是词频,一个是密度。搜索引擎刚发展的时候,很多站长都知道堆积关键词就可以轻松获取排名,这就是词频。显然这个算法是有弊端的,所以衍生出密度这个说法,密度的出现对关键词堆积的行为有了一定的遏制。

  上面说到词频这个概念,我们要了解一种统计方法TF-IDF。TF就是词频 (temfrequency),IDF是逆文档频率(inverse document frequency)。针对一个特定关键词,包含这个关键词的文件数量除以数据库文件总数,得到这个词的文件频率。反过来,文件总数除以包含这个词的文件数量(通常真正计算时还要取对数) ,就得到逆文档频率。所以,语言中越常见的词,包含这个词的文件数越多,文件频率也就越高,逆文档频率越低。

  逆文档频率代表了这个词的语义重要性或者说区别文件的能力。举例来说,“的”通常在所有文件中出现,文件频率极高,逆文档频率极低,也就是“的”这个词的语义重要性很低,几乎无法用来代表和区别文件内容。“搜索引擎”这个词只出现在一小部分文件中,逆文档频率要高得多,对文件内容来说重要性要高得多。

  搜索引擎在判定页面与什么关键词更相关时,不是单纯考虑词频,而是计算词频乘以逆文档频率,也就是TF-IDF。逆文档频率低,即使词频高,页面与关键词相关性还是不高。举个例子,如果要优化“新加坡旅游”这个词组,在百度搜索“新加坡”返回27600000个结果,搜索“旅游”返回100000000个结果,包含“新加坡”的文件数远小于包含“旅游”的文件数,百度数据库的文件总数是固定的,所以“新加坡”的逆文档频率大于“旅游”。或者换句话说,“新加坡”这个词在区别、辨识文件能力上比“旅游”这个词要高。在优化文案时,增加“旅游”出现次数就没有增加“新加坡”次数更有效。

免责声明:“墨钰科技”的传媒资讯页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与我们联系删除或处理。稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性,更不对您的投资构成建议。我们不鼓励任何形式的投资行为、购买使用行为。
免费获得专属报价

专业品质精心服务好每一位客户。