L氪迹答:大部分SEO站长在考虑这个问题时通常会以SEO为出发点,感觉百度搜索引擎就是通过自己布局关键词的几个地方来判断页面关键词的。抛开SEO,假设一个网站没有做SEO优化,任何SEO细节都没有考虑,甚至页面Title、H1、加粗之类的标签都没有使用,但是页面中有对用户十分有用的内容(比如一些政府或组织的网站),那么百度搜索引擎还需要索引这样的网站和页面吗?还需要判断这些页面的核心关键词吗?答案显然是“需要”。那么这些在大众SEO眼中的一些重要位置没有布局关键词的页面,百度还能判断其核心关键词吗?答案显然是“可以”,不然百度和其他搜索引擎都不用生存发展了。
搜索引擎判断页面的核心关键词时,会比较注重页面Title、H标签、内容中加粗变色标签、主体内容靠前部分中关键词出现的频率等,但是这并不是搜索引擎判断页面关键词的主要渠道,而只是促进搜索引擎认为这个页面和SEO人员在这些地方所布局的关键词更相关而已。从在采集内容中硬性插入关键词,单纯以页面几个重要地方着重关键词和硬性提升内容主关键词密度的所谓“伪原创”方法已经基本失效,就可以了解到搜索引擎并不只是根据大众SEO所注重的几个地方来判断页面关键词的。
搜索引擎判断一个页面的核心关键词的流程应该有:
抽取页面部分内容,对内容进行分词处理;
根据各个关键词在页面中的频率以及在全网中的频率来判断哪些词是该页面的主要关键词,这里一般运用的是TF-IDF及其改进算法;
根据更为先进的语义识别算法进行判定;
把页面Title、H1标签、内容开头部分内容(有时甚至只是第一句)、内容中加粗变色文字所提取的关键词与其他算法判定的关键词进行加权计算,从而最后得出这个页面和哪些关键词相关,并按照相关度把关键词进行排序,前几个关键词一般就可以被判定为该页面的核心关键词。
作为对SEO优化的建议是:需要特别注意在页面重要位置和标签内突出我们心中的核心关键词,但是更要注重网站内容的自然建设,而不是为了堆积关键词而布局关键词。