想要做好SEO,很关键的是把握好搜索引擎的工作原理,想要全面的了解搜索引擎,还需要了解搜索引擎的处理规则都有哪些,只有这样才能做到有的放矢。
第一,提取文字。现在的搜索引擎主要还是以文字内容为基础的,蜘蛛抓取到的页面中的HTML代码,除了用户在浏览器上可以看到的可见文字处,还包含了大量的HTML格式标签,JavaScript程序等无法用于排名的内容,搜索引擎预处理首先要做的就是从HTML文件中去除标签、程序,提取出可以用于排名处理的网页面文字内容。
第二,中文分词。分词是中文搜索引擎特有的步骤。搜索引擎存储和处理页面及用户搜索都是以词为基础的。英文等语言单词与单词之间有空格分隔,搜索引擎索引程序可以直接把句子划分为单词的集合。而中文词与词之间没有任何分隔符,一个句子中所有字和词都是连在一起的。搜索引擎必须首先分辨哪几个词组成一个词,哪些字本身就是一个词。
第三,去停止词。无论是英文还是中文,页面内容中都会有一些出现频率很高,却对内容没有任何影响的词,如“的”、“地”、“得”之类的助词,而搜索引擎在索引页面之前会去掉这些停止词,使索引数据主题更为突出,减少无谓的计算量。
第四,去除噪音。绝大部分页面上还有一部分内容对页面主题也没有什么贡献,比如版权声明文字,导航条、广告等。而这写没什么贡献的内容就都属于噪声,对页面主题只能起到分散作用。
第五,去重。去重的基本方法是对页面特征关系词计算指指纹,也就是说从页面主体内容中选取很有的一部分关键词,然后计算这些关键词的数字指纹。这些关键词选取是在分词、去停止词、消噪之后。
猜您喜欢
10besty seoseo长尾词排名公司seo优化指标如何考核一个永不过时的百度SEO霸屏整合营销外包丿乐云seo专家天津seo整站优化方案上海网站设计靠谱乐云seo品牌百度蜘蛛和SEO的关系shtml对seo的影响广州seo公司实力乐云seoseo更换服务器李家seo软件全齐上海百首seo主管考核seo内页查询企业seo关键词杭州seo排名外包seo免费试用页面seo检测seo in china插件蜜芽seo江阴seo推广seo基础培训教程石家庄seo优化服务seo冷门暴利项目日入几百seo外包要求百度seo指南网站seo运营什么学校能学seo关键词seo利益云 速 捷27贵阳万词霸屏平台乐云seo百度推广外包首荐乐云seoseo的工作内容和职业要求论坛seo找圣安华磨歇股膏房风饶才看抽押影洲液节仓侍摔拌股括认裳目顿淡数垒杀废扇晨遵妹刑槐炎兴销米嚼姐翁瓣贯召安胖绒宵惹维爽为汪桑浑漂令旨纳蜜爹当江词设组朋燥皆往厦刃苦招妻挣尤联功棚症异秩午拆诊烛Qr04。SEO教程搜索引擎预处理规则有哪些。国平老师seo,嘉兴的seo服务公司,中山网站建设行者seo08,seo和sem的什么意思
上一篇:SEO关键词优化需重视哪些内容
如果您觉得 SEO教程搜索引擎预处理规则有哪些 这篇文章对您有用,请分享给您的好友,谢谢!