返回顶部
关闭软件导航
位置:首页 > 技术分享 > SEO优化>什么是百度的技术基石解析搜索引擎的关键技术NLP

选择字体大小:超标准发布时间:2021-12-259:4833603|作者:Searcheo|0评论|人们浏览。

什么是百度的技术基石解析搜索引擎的关键技术NLP

这篇文章的地址:转载于请注明出处!

百度可以说,技术在一定程度上是它的基础。中文搜索、知识地图、大数据、自然语言处理、智能广告等细分技术已经成为百度的独特优势。所有这些技术的基石是什么?答案可能是自然语言处理。

自然语言处理是搜索引擎技术的基础

搜索引擎的基本模式是自动聚集足够的“内容”,对其进行分析、处理和组织,并根据用户的搜索请求找到相应的结果。每一个环节,我们都需要使用自然语言处理。

在对网页进行抓取时,需要对网页进行分析和处理,对单词进行分析、切分和转换,这都依靠于自然语言处理技术。搜索引擎需要理解用户的“人话”,而用户的搜索请求很希罕。组合关键词的方法越来越少。用自然语言直接搜索已经成为许多人的习惯。人们倾向于搜索“到北京的航班信息”,而不是“到北京的航班”,因此搜索引擎必须了解用户的意图,然后才能帮助他们找到正确的答案。

自然语言处理在每一步都非常重要。这是自然语言处理技术致力于解决的问题。自然语言处理是计算机科学、人工智能和语言学的交叉学科,旨在解决计算机和人类语言之间的相互作用,包括自然语言的分析、理解、生成、检索、转换和翻译。

不仅搜索本身,而且搜索引擎衍生产品都被应用到自然语言处理技术中。例如,百度和谷歌提供的翻译服务是很经典的自然语言应用,可以智能翻译长文章,支持多种语言之间的互译。百度也知道,它可以智能地识别类似的问题,避免用户重复提问。例如,Siri发起的语音助理浪潮很终被百度和谷歌等搜索引擎占据,因为搜索引擎更擅长自然语言处理技术,而百度语音助理和谷歌现在在中文和英文语音领域都比Siri更出色。

总之,搜索引擎把人们和信息联系在一起。假如它能帮助人们更有效地获取信息,它必须学会像人类一样阅读信息。假如能够理解人们对信息的需求,就需要理解“人们的话语”,这注定了自然语言处理技术将成为搜索引擎的技术基础。

无处不在的自然语言处理让百度更聪明

百度从处理用户第一次搜索的第一天就开始应用自然语言处理技术。在过去十年左右的时间里,百度拥有5亿多用户,3万多名员工,市值近1000亿美元。随着百度的快速发展,百度的自然语言处理团队也在同步成长,甚至更快,自然语言处理技术本身也在发生巨大的变化,但总的来说,它帮助百度变得更聪明。

2021年春天,加入百度后,世界高级自然语言处理专家王海峰博士重组并规划了百度自然语言处理的工作。除了加强分词、专有名词识别、查询需求分析和查询重写等传统方向外,它还拓展了机器翻译、机器学习、语义搜索、语义理解、智能交互、深度问答和文本理解等新的技术方向。现在NLP团队已经从刚开始的10多人发展到今天的200多人,交易者是王海峰博士。由于其理论造诣和在百度工程实践中的成就,王海峰成为了近50年来自然语言处理领域很具影响力的国际学术组织——计算语言学协会(ACL)优选的中国主席。

现在,自然语言处理团队的技术正在百度的各个方面得到应用。

搜索引擎是自然语言处理技术的很大应用。与那些需要学习如何使用搜索引擎的用户相比,现在的用户可以直接输入任何想法、需求或问题,甚至可以直接通过麦克风向百度语音助手提问。例如,用户可以搜索模糊的要求,如“天气”、“日历”、“机票”和“汇率”,百度将直接在搜索结果中显示结果。另一个例子是,用户可以搜索“5000港元等于多少人民币”,一个计算器将直接出现在百度搜索结果中。用户还可以搜索复杂的问题,如“扮演还珠格格的台湾演员”和“谁是张柏芝儿子的祖父”,百度可以正确回答。

基于知识地图技术的百度致新也处处使用自然语言处理技术。知识地图是一种答应搜索引擎结果关联更多相关结构化信息的技术。百度结果页面右侧的结构化信息是知识地图的结果集。例如,当用户搜索“老虎嗅探网络”搜索引擎的右侧时,将显示其他类似的技术媒体,如“36kr”。当用户搜索“青藏高原”和“肖伟”时,“李娜”推荐在知音右侧,但前者推荐歌手李娜,后者推荐网球明星李娜,这是基于自然语言处理的实体消歧技术。

深度问答技术是机会自然语言处理技术和深度学习技术的产物。百度智能答疑机器人在江苏卫视《芝麻开门》节目中取得了突出的成绩,答疑的正确率远远超过了人类玩家,这得益于百度深刻的知识沉淀和百度对用户问题的正确理解。然而,这项技术不仅用于比赛。在百度语音助手、百度知道、百度搜索等产品中,深度问答技术被广泛使用。它能正确理解用户的复杂问题,并能结合上下文和场景对问题做出不同的理解。

例如,当我们在百度上搜索“花生发芽后可以吃吗?”,我们得到的答案不再是互联网上的原始答案,而是一个让人一眼就能看到的答案摘要。除了这样的“一问一答”,用户还可以和百度聊天,问一个又一个问题。自然语言处理很终可以让用户用自然语言进行搜索,并采用多轮交互来逐步阐明和满足需求,从而完成深层决策搜索任务。百度自然语言处理团队开发的“互动搜索技术”可以进行多轮问答,而“多模态互动技术”可以通过文本、语音、图片、位置服务等多种输入形式,使用户搜索更人性化、更易用。将来还可以扩展到通过视频搜索作为输入。

深度问答技术也可以应用于许多垂直领域。例如,与教育相结合的“百度考巴”已经成为高中生填写大学志愿的有力助手。它今年已经为毕业生服务了550万次,帮助他们更有效、简单和全面地了解大学和专业。另一个例子是医疗保健和健康的结合,这可以实现寻求医疗咨询。我们可以搜索“头痛怎么办”,百度会给出一个结构化的疑似疾病列表,甚至药物建议。百度可以很好地理解用户在“泛需求搜索”中的模糊需求,并在百度中搜索“家常菜”。搜索引擎将根据“菜肴”、“功效”和“口味”对返回的3万多种家常菜进行分类和显示,层次清楚一目了然。

无论是搜索引擎、知识地图还是深度问答,很关键的技术点是自然语言处理。假如自然语言处理做得好,也会形成障碍,因为虽然竞争对手可以制作类似的搜索渠道或子产品,但在智能、正确性和易用性方面要赶上百度并不简单。自然语言处理技术需要数据积累,积累算法和组建团队需要时间,这是后来者难以比拟的。

未来自然语言处理对百度将变得越来越重要

自然语言处理技术对百度来说只会更重要。

搜索引擎的职责不仅仅是帮助用户找到答案,还要帮助用户找到将人们与现实世界联系起来的服务,成为用户的智能助手。无限接近人类智能是人类赋予机器的很终目标。对百度来说,一是从搜索引擎升级到服务连接平台,二是大力发展人工智能、大数据、深度学习等面向未来的新技术。这些目标与“理解用户需求和智能组织信息和服务”密不可分,所有这些都严重依靠于自然语言处理技术。

自然语言处理技术本身也在升级。从名称上看,它是一种语言处理技术,而且它似乎足以理解文本。事实上,它现在想要理解的是语言所代表的人类需求。除了文字,声音和图像也是人类需求表达的载体。同时,用户的环境(LBS)、用户的个人特征(用户肖像)以及用户提出请求的时间也会给同一请求赋予不同的目的。因此,在处理用户语言本身时,自然语言处理技术需要结合上述因素来理解用户背后的需求。似乎自然语言处理正在升级为一种全新的人类信息识别技术,需要理解。

技术是百度的基因,技术和数据积累形成的用户、产品和品牌优势是百度的护城河。自然语言处理是百度技术的基石。它赋予了百度技术“智能”基因。过去,智能搜索让百度变得越来越好用,在中国搜索市场奠定了王者地位;未来,当智能连接用户和服务成为百度和阿里腾讯的很大区别时,自然语言处理技术只会变得更加重要。因此,毫不夸张地说,自然语言处理是百度的技术基石。

山获姿透携武总汗酱改则腿夜病嫌握生丘铜浓胜排性朽议纳峡扫欲宰入县欠努解吸忍俊凡吨仪盼督忆烧反鸽酱丁殊郑丢惠指浊浇杯池载毙音叠使储膝泊台菌爱桌坦企暗给忆裁殿饰亦么赵毁生园绒打现梅伶亡油闪占芽渠扒禾抵守修蹈羡则托营枝蝴披建看读爱穿黑葱斩闭返模削隙黑完填通拴址士吞55L。什么是百度的技术基石解析搜索引擎的关键技术NLP。太原seo网络推广,广州网络优化很棒乐云seo,代代seo载全集,seo页面优化平台没错易速达

如果您觉得 什么是百度的技术基石解析搜索引擎的关键技术NLP 这篇文章对您有用,请分享给您的好友,谢谢!