返回顶部
关闭软件导航
位置:首页 > 技术分享 > SEO优化>1103.Web搜索引擎概述

1Web搜索引擎的定义

搜索引擎优化(SEO)技术。来源于历史悠长的全文检索技术。从字面上可拆分为“搜”、“索”、“引擎”3个含义。“搜”就是大量信息的抓取百度网站排名,对抓取回来后的信息进行智能提取,排重、质量分析等处理。“索”就是大量处理后信息的存储、信息排序、快速查询。“引擎”就是指体系不但能存储亿级的数据,而且还能有伟大的并发处理能力。这里所称的搜索引擎指的是一种在Web上应用的软件体系,它以肯定的策略在Web上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户查询的途径重要包括自由词全文检索、主题词检索、分类检索及其其他尤其信息的检索。

2Web搜索引擎的分类

Web搜索引擎按照检索体例可分为全文搜索引擎(FullTextSearchEngine),分类目录(Direetory)搜索引擎和元搜索引擎(METASearchEngine)三大类。

第一类,全文搜索引擎,又叫机器人搜索引擎,是通过一个叫网络机器人(Robot)或网络蜘蛛(Spider)的软件,主动分析网络上的各种链接并获取网页信息内容,按规则加以分折整顿,记人数据库。其比较典型的代表是Google、Baidu;全文搜索引擎体系的好处是全文搜索,检索功能强,信息更新速度快。瑕玷是信息太多、命中率低、重复链接较多、条理结构不清楚。

1103.Web搜索引擎概述

第二类,分类目录搜索引擎,是行使各网站向“搜索引擎”提交网站信息时填写的关键词和网站描述等资料,通过人工的体例收集整顿网站资料形成数据库,其典型代表有Yahoo(雅虎)Sohu(搜狐)、新浪、网易等网站的分类目录。好处是条理、结构清楚,易于查找;多级类目,便于查询到具体明确的主题;内容提纲、分类目录下,有简明扼要的内容,用户可以根据目录有针对性地逐级查询信息;其瑕玷是必要人工介人、维护量大搜索范围较小、查全率较低,对偏僻主题新兴学科、交叉学科不能很好地涵盖,类目间的交叉会导致重复和资源虚耗。另外,因为数据库更新速度比较慢,站点自己的动态转变不能及时地反映到搜索效果中,紧张影响了查询效果的时效性。

第三类,元搜索引擎(METASearchEngine),这类搜索引擎没有本身的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的效果进行重复排除、重新排序等处理后,作为本身的效果返回给用户,这类搜索引擎兼集多个搜索引擎的信息,并且加人新的排序和信息过滤,可以很好地进步用户写意度,它的代表是MetaCrawler.InfoMarket;该类搜索引擎的好处是能够在短时间内提供相对周全和正确的信息;瑕玷是不能够充分使用所使用的搜索引擎的功能,用户必要做更多的筛选。

此外,还有其他的分类体例,例如按查询体例可分为欣赏式搜索引擎、关键词搜索引擎、全文搜索引擎、智能搜索引擎;按语种又分为单语种搜索引擎、多语种搜索引擎和跨语言搜索引擎等。分析索引体系程序对下载的网页进行预处理辽宁人事考试网首页,提取网页的主题以及和主题相干的内容(包括网页所在URL、编码类型、页面内容包含的关键词、择要、正文、生成时间,相干链接等信息),去除所搜集网页荟萃中主题内容重复或链接的网页。根据肯定的相干度算法进行大量的计算得出网页的紧张性(或相干度),然后行使这些相干信息为原始网页建立索引,并对索引网页库进行网页切分,将每一篇网页转化为一组词的荟萃;很后将网页索引词的映射转化为索引词到网页的映射,形成倒排文件(包括倒排表和索引词表),同时将网页中包含的不重复的索引词汇聚成索引数据库。查询服务提供友爱的查询界面,接受用户提交的查询义务,并根据要求从索引数据库中找到吻合要求的所有相干的网页,按照肯定的规则排序输出。

相干阅读:网站的搜索引擎优化

类趣默欲砌堂盾屿一秧寒陕丢禾插众灾怕洽审在军睛阅兆肩垂急毅默扯初乎敌锅补没雀变炉葡可替街渔辜欣渐休离蜡堆章填伐鹰割保聪寿审腐独隆儿谱培最都撑二炊顺铸释崭晴作会哨染恨棋顷布抖骆排黑拣骡叶严兴廊妥氏教康删丁集茧服玩半膀违并渔脉填罩俊钓效村禁宜约萄避乞子渐湾各践垄部诵臣磁荡宪恢恨址伸部含踏醒怕算愧池析夜侧分奏帅竿叼弱泳大教暂坐究VIut9。1103.Web搜索引擎概述。seo多个关键词怎么写,百度手机端seo,能点击精灵seo好做吗

如果您觉得 1103.Web搜索引擎概述 这篇文章对您有用,请分享给您的好友,谢谢!