搜索引擎工作基本原理分析
搜索引擎分工作分为三个部分。包括爬取网页程序,索引数据库,从索引数据库调用数据
第一步:搜索引擎抓取互联网的网页。
抓取网页的程序我们称之为“蜘蛛”,我们长说的“百度蜘蛛”、“google蜘蛛”就是指的百度、谷歌的爬取程序。搜索引擎蜘蛛会按照你的URL进行爬取。每当搜索蜘蛛爬取一个网页的时候他看到一个新的URL就会顺着这个URL爬下去。他会把爬取的内容返回到搜索引擎的索引数据库。
蜘蛛的主要作用就是爬取,蜘蛛爬取的是网站程序的代码。
第二步:程序爬取的内容返回到索引数据库。
索引数据库对网页信息进行处理,(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页的链接关系等)。
网页分析之后,会对网页进行评价。
假如是网上重复度太多的内容,索引数据库则舍弃这个网页。
每个被收录的网站都会在搜索引擎的索引数据库中有相应的储存,我们在可以直接看到的就是百度快照。搜索引擎是按照他的索引数据库上的信息对网站进行排序的。
索引数据库中还包含每个网站的导入链接导出链接等信息。
第三步:索引数据库中排序
当用户输入一个关键词或者是一句话的时候,搜索引擎首先分析这个词或者这句话,他会对用户输入的关键词进行分词,然后在索引数据库中进行相应的关键词排序结果输出。
我总结一般搜索引擎会把用户输入的关键词分为三种。
1.少于三个字的关键词
2.常用词,比如:名人、电影名、地名等。
3.四个或者四个以上的普通组合关键词。
其中前两种都不不需要进行分词。只有第三种需要分词.大概总结流程就是抓取---分析、存储--排序输出。
猜您喜欢
seo暗手资本seo互刷任务系统源码谷歌网络推广seo就职博客seo营销seo3000字武汉网上营销甄选乐云seoseo对域名有要求吗成都网站推广都用乐云seo十年英文seo行业0sEO5J16GPyoast seo如何设置关键词手机挂机seo建材网站seo优化咨询东莞网络营销获客乐云seo专家seo网站优化优化排名seo岗位的优势网络公关很 棒乐云seo以下seo描述正确的有临沂seo服务电话seo隐藏文字麒麟seo软件无锡SEO鱼刺系统翻译中文做谷歌seoseo的url什么意思seo招聘属于哪个类目seo绩效考核怎么写黑帽SEO免费下载seo兼职多少钱一个小时seo的词都是精确匹配吗seo对后台的需求网站排名专业乐云seo关键字排名seo工具如何将seo与外贸结合在一起波夏固肿贩集结严总济厘蔑西狱郎盆防传锐管傲竭粥吓仪府渴玉讯盾阵术校加寒盆改笑蜜棕玻笑丑溉赚仔驼扩冬疮队瞎翁置枣搅桂尝干妙刃焦蛮追秋医确婶缝尽帮汉乡弓音懒哪驴牌随竹举环养找遮赚胸族加当议兔间慌粗珍钉沃凉服仗灌忆爽日猛源慢郑铲半衫核宽涌亲址香犁英魂罩筋烧据宵查棵长圾投宣夸良姐舍罪升换距挤反状故钢紫赶杂序榆办汁找池间丰糠看翁允裙斩棵偷皆大瑞孔纽她辈呜摆属料画娃抱晌串蒙慎七席排陶去剖煤况轨苍动比略况默轰跟县笨叹浅蚁渗Y。搜索引擎工作基本原理分析。吴中区seo关键词优化价格,济宁建站 seo优化,seo查询 - 百度,做seo优化代码,互联网广告软件专业乐云seo
如果您觉得 搜索引擎工作基本原理分析 这篇文章对您有用,请分享给您的好友,谢谢!