什么是不同类型的搜索引擎?
什么是搜索引擎?
搜索引擎的目的是从互联网上可用的庞大资源数据库中提取请求的信息。 搜索引擎成为日常查找所需信息的重要工具,而无需知道它的确切存储位置。 最近几天,随着 Google、Bing 和 Yahoo! 等易于使用的搜索引擎的出现,互联网的使用量大幅增加。 有不同类型的搜索引擎可以获取您正在寻找的信息。 在本文中,我们将解释不同类型的搜索引擎及其用途。
为什么搜索引擎很重要?
搜索引擎是两类人日常生活的一部分。
- 搜索和获取信息的用户
- 试图优化其网站以在搜索结果中获得最高排名的网站所有者。
用户仅在 Google 上进行超过数十亿次搜索以查找相关信息。 这为企业和在线内容发布商免费吸引人们访问他们的网站开辟了广阔的空间。 搜索引擎遵循指南并有自己的算法来决定网站在搜索结果中的排名。 为谷歌和其他搜索引擎优化网站是任何网站所有者接触大量受众的重要组成部分。 访问者可以通过在网站上显示的广告或通过购买产品为网站所有者创造收入。
不同类型的搜索引擎
搜索引擎根据其工作方式分为以下三类。
- 基于爬虫的搜索引擎
- 人力目录
- 混合搜索引擎
- 其他特殊搜索引擎
让我们在以下部分详细讨论所有类型的搜索引擎。
1. 基于爬虫的搜索引擎
所有基于爬虫的搜索引擎都使用爬虫或机器人或蜘蛛来抓取新内容并将其索引到搜索数据库。 在搜索结果中显示任何网站之前,每个基于爬虫的搜索引擎都会遵循四个基本步骤。
- 爬行
- 索引
- 计算相关性
- 检索结果
1.1。 爬行
搜索引擎 爬行 整个网络以获取可用的网页。 一个软件叫 履带式 或者 机器人 或者 蜘蛛, 执行整个网络的抓取。 抓取频率取决于搜索引擎,两次抓取之间可能需要几天时间。 这就是有时您可以在搜索结果中看到旧的或已删除的页面内容的原因。 一旦搜索引擎再次抓取您的网站,搜索结果将显示新的更新内容。
1.2. 索引
索引 是抓取后的下一步,这是识别最能描述页面的单词和表达的过程。 识别出的词被称为关键字,页面被分配给识别出的关键字。 有时,当爬虫无法理解您页面的含义时,您的网站可能会在搜索结果中排名较低。 在这里,您需要针对搜索引擎爬虫优化您的页面,以确保内容易于理解。 一旦爬虫获取正确的关键字,您的页面将被分配给这些关键字并在搜索结果中排名靠前。
1.3. 计算相关性
搜索引擎将搜索请求中的搜索字符串与数据库中的索引页面进行比较。 由于很可能不止一页包含搜索字符串,因此搜索引擎启动 计算相关性 其索引中的每个页面的搜索字符串。
有多种算法可以计算相关性。 这些算法中的每一个对关键字密度、链接或元标记等常见因素都有不同的相对权重。 这就是为什么不同的搜索引擎对相同的搜索字符串给出不同的搜索结果页面的原因。 众所周知,所有主要搜索引擎都会定期更改其算法。 如果您想让您的网站保持在顶部,您还需要调整您的页面以适应最新的变化。 如果您想处于领先地位,这是为 SEO 付出永久努力的原因之一。
1.4. 检索结果
搜索引擎活动的最后一步是 检索 结果。 基本上,它只是按顺序在浏览器中显示它们。 搜索引擎按照最相关到最不相关的网站的顺序对无穷无尽的搜索结果页面进行排序。
基于爬虫的搜索引擎示例
大多数流行的搜索引擎都是基于爬虫的搜索引擎,并使用上述技术来显示搜索结果。 基于爬虫的搜索引擎示例:
- 谷歌
- 必应
- 雅虎!
- 百度
- Yandex
除了这些流行的搜索引擎之外,还有许多其他基于爬虫的搜索引擎可用,例如 DuckDuckGo、AOL 和 Ask。
2. 人力目录
人力目录也称为开放目录系统,取决于基于人工的列表活动。 以下是人工目录中的索引是如何工作的:
- 网站所有者将网站的简短描述连同要列出的类别一起提交给目录。
- 然后手动审核提交的站点并将其添加到适当的类别中或拒绝列出。
- 在搜索框中输入的关键字将与网站的描述相匹配。 这意味着对网页内容所做的更改不会被考虑在内,因为它只是重要的描述。
- 与内容不佳的网站相比,内容良好的优质网站更有可能获得免费评论。
雅虎! 目录和 DMOZ 是人力目录的完美例子。 不幸的是,像谷歌这样的自动搜索引擎将所有那些人力目录式搜索引擎从网络上消灭了。
3. 混合搜索引擎
混合搜索引擎使用基于爬虫和手动索引来在搜索结果中列出网站。 大多数像谷歌这样的基于爬虫的搜索引擎基本上使用爬虫作为主要机制,人力目录作为次要机制。 例如,谷歌可能会从人工目录中获取网页描述并显示在搜索结果中。 随着人力目录的消失,混合类型变得越来越基于爬虫的搜索引擎。
但是仍然存在手动过滤搜索结果以删除复制和垃圾网站的情况。 当网站被识别为垃圾邮件活动时,网站所有者需要采取纠正措施并将该网站重新提交给搜索引擎。 专家对提交的站点进行人工审核,然后再将其包含在搜索结果中。 通过这种方式,爬虫虽然控制了进程,但控制是手动的,可以自然地监控和显示搜索结果。
4. 其他类型的搜索引擎
除了以上三种主要类型之外,搜索引擎还可以根据使用情况分为许多其他类别。 下面是一些例子:
- 搜索引擎有不同类型的机器人来专门显示图像、视频、新闻、产品和本地列表。 例如, 谷歌新闻 page 可用于仅搜索来自不同报纸的新闻。
- 一些搜索引擎喜欢 狗堆 从其他搜索引擎和目录收集页面的元信息以显示在搜索结果中。 这种类型的搜索引擎称为元搜索引擎。
- 语义搜索引擎如 Swoogle 通过了解搜索查询的上下文含义,在特定区域提供准确的搜索结果。