如何使用 XPath 表达式来增强您的 SEO 和内容策略
30 秒总结:
- 随着 Google 越来越青睐内容体现专业知识、权威和可信度 (EAT) 的网站,SEO 和营销人员制作的内容不仅要写得好,还要展示专业知识。
- 您如何理解哪些主题和关注点对您的客户群最重要?
- 您可以使用问答来告知内容策略吗?
- XPath 符号可以成为您的宝库。
- Catalyst 的有机搜索经理 Brad McCourt 分享了有关使用 XPath 符号和您最喜欢的爬虫以简单易懂的格式快速获取问答的详细指南。
随着 Google 越来越青睐内容体现专业知识、权威和可信度 (EAT) 的网站,SEO 和营销人员制作的内容不仅要写得好,还要展示专业知识。 展示对某个主题或产品的专业知识的一种方法是直接在您的内容中回答常见的客户问题。
但是,您如何确定这些问题是什么? 您如何理解最重要的主题和关注点?
好消息是它们隐藏在众目睽睽之下。 很有可能,您的消费者一直在亚马逊等网站的问答部分敲响键盘。
这些部分是真实客户对您销售的产品提出的(大部分)严肃问题的宝库。
您如何使用这些问答来告知内容策略? XPath 表示法就是您的答案。
您可以使用 XPath 符号和您最喜欢的爬虫以简单易懂的格式快速获取问答。 XPath 通过自动收集内容策略的重要见解,使您免于点击无休止的问题屏幕。
什么是 XPath?
XML Path (XPath) 是一种查询语言,由 W3 导航 XML 文档并选择指定的数据节点。
XPath 使用的符号称为“表达式”。 使用这些表达式,只要网页之间的结构一致,您就可以有效地从网站中提取所需的任何数据。
这意味着您可以使用这种语言提取源代码中的任何公开可用数据,包括来自精选亚马逊问答页面的问题。
本文并不是 XPath 的综合教程。 为此,有 来自W3的大量资源. 然而,XPath 很容易学习,只需要知道 XML 和 HTML 文档的结构。 这就是它成为 SEO 如此强大工具的原因,无论编码能力如何。
让我们通过一个示例向您展示如何……
使用 XPath 从 Amazon 提取客户问题
先决条件:选择您的网络爬虫
虽然网络爬虫中的大多数大牌——Botify、DeepCrawl、OnCrawl——都提供了从源代码中提取数据的能力,但我将在下面的示例中使用 ScreamingFrog。
ScreamingFrog 是迄今为止最具成本效益的选择,允许您在不购买许可证的情况下抓取多达 500 个 URL。 对于较大的项目,您可以购买许可证。 这将允许您抓取 RAM 可以处理的尽可能多的 URL。
第一步:收集要抓取的 URL
对于我们的例子,假设我们正在研究我们应该包含在我们的产品页面和微钉列表中的主题。 对于那些不知道的人,微钉是您靴子或鞋子的配件。 它们在寒冷的条件下为您提供额外的抓地力,因此它们在寒冷天气的徒步旅行者和跑步者中特别受欢迎。
资料来源:https://www.amazon.com/s?k=microspikes
在这里,我们列出了 Amazon.com 上排名靠前的 microspike 页面的 13 个问答页面。 不幸的是,创建列表需要一些手动工作。
最简单的方法是搜索主题(即 microspikes)并拉出指向所列顶级产品的链接。 如果您手头有产品的 ASIN(亚马逊标准识别号),您也可以使用上述格式生成 URL,但切换掉 ASIN。
第二步:确定 XPath
从这里开始,我们需要确定 XPath。
为了找出用于提取所需文本的正确 XPath 表示法,我们有两个主要选项:
- 查看源代码
- 查看呈现的源代码并直接从 Chrome 的 Inspect Element 工具中复制 XPath
您会发现在亚马逊问答页面中定位所有问题所需的表达式是:
//跨度[@class=”a-declarative”]
这是分解的 XPath 符号:
- // 用于定位以下表达式的所有实例。
- 跨度 是我们要查找的特定标签。 //span 将定位源代码中的每个 标签。 其中有 300 多个,因此我们需要更加具体。
- @班级 指定 //span[@class] 将确保所有具有指定类属性的 标签都将被定位。
- @class=”a-声明式” 指示 //span[@class=”a-declarative”] 仅定位 class 属性设置为“a-declarative”的 标签——也就是说,
为了返回指定标签的内部文本,还有一个额外的步骤,但 ScreamingFrog 为我们做了繁重的工作。
请务必注意,这仅适用于亚马逊问答页面。 如果您想从 Quora、TripAdvisor 或任何其他网站提取问题,则必须调整表达式以定位您希望在爬网中收集的特定实体。
第三步:配置你的爬虫
一切就绪后,您就可以进入 ScreamingFrog。
配置 -> 自定义 -> 提取
这将带您进入自定义提取屏幕。
在这里您可以:
- 为提取命名,以便在抓取后更容易找到,尤其是在提取多个实体时。 ScreamingFrog 允许您在单次爬网期间提取多个实体。
- 然后您可以选择提取方法。 在本文中,一切都是关于 XPath 的,但您也可以选择通过 CSSPath 和 REGEX 符号提取数据。
- 将所需的 XPath 表达式放在“输入 XPath”字段中。 ScreamingFrog 甚至会为您检查您的语法,如果一切检查通过,则会提供一个绿色的复选标记。
- 然后,您可以选择要提取的内容,无论是完整的 HTML 元素还是在定位标签中找到的 HTML。 对于我们的示例,我们希望提取类属性设置为“a-declarative”的任何 标记之间的文本,因此我们选择“提取文本”。
然后我们可以单击确定。
第四步:抓取所需的 URL
现在是时候爬取我们的亚马逊问答页面列表以查找微尖峰了。
首先,我们需要将 ScreamingFrog 中的模式从“Spider”切换为“List”。
然后,我们可以手动添加我们的 URL 集或从 Excel 或其他支持的格式上传它们。
在我们确认列表后,ScreamingFrog 将抓取我们提供的每个 URL,提取所有包含类属性设置为“a-declarative”的 标签之间的文本。
为了查看收集的数据,您只需要在 ScreamingFrog 中选择“自定义提取”。
乍一看,输出可能看起来并不那么令人兴奋。
但是,这只是因为数据中包含大量不需要的空间,所以如果未展开以完全显示内容,您可能会看到一些列显示为空白。
将数据复制并粘贴到 Excel 或您选择的电子表格程序后,您终于可以看到已提取的数据。 经过一些清理后,您将获得最终结果:
结果是真实客户提出的 118 个关于微尖峰的问题以一种易于访问的格式出现。 有了触手可及的这些数据,您现在就可以将这项研究纳入您的内容策略。
内容策略
在深入研究内容策略之前,先告诉智者一句话:你不能只是从另一个站点抓取、抓取和发布内容,即使它是可公开访问的。
首先,那将是剽窃,并希望受到打击 数字千年版权法案 (DMCA) 通知. 其次,你不是在愚弄谷歌。 谷歌知道内容的原始来源,你的内容不太可能排名很好——这违背了整个策略的目的。
相反,此数据可用于为您的策略提供信息并帮助您生产高质量、 独特的 用户搜索的内容。
现在,您如何开始分析?
我建议首先对问题进行分类。 对于我们的例子,有很多问题是关于:
- 尺寸:特定鞋/靴尺寸需要多大尺寸的微鞋钉?
- 正确使用——微钉是否可以用于商店、湿滑的屋顶、钓鱼、修剪草坪或在石膏上行走?
- 特点:它们是否可调,材料类型,是否配有手提箱?
- 顾虑:它们是否舒适,是否会损坏您的鞋子,是否会损坏您所在的地板/地面类型,耐用性?
这是对客户在购买微型钉之前可能存在的潜在顾虑的惊人洞察。
从这里,您可以使用这些信息来:
1. 增强产品和类别页面上的现有内容
将主题纳入产品或类别描述中,先发制人地回答购物者可能提出的问题。
对于我们的示例,我们可能希望非常清楚地说明尺码是如何工作的——包括尺码表,并特别提及产品可能兼容或不兼容的鞋类类型。
2. 建立一个简短的页面常见问题解答部分,以原创内容为特色,回答常见问题
确保执行 FAQPage Schema.org 标记 以便有更好的机会出现在诸如“人们还询问”部分之类的列表中,这些部分在搜索结果中越来越多地占据了房地产。
对于我们的示例,我们可以回答有关舒适度、鞋类损坏、耐用性和可调节性的常见问题。 我们还可以解决产品是否带有手提箱以及如何最好地存放产品以便旅行的问题。
3. 制作产品指南,包括对围绕产品或类别的常见问题的回答
另一种策略是制作内容广泛的一站式产品指南,展示特定用例、规模、限制和功能。 对于我们的示例,我们可以为每个用例创建特定的内容,例如远足、在冰天雪地中跑步等。
更好的是,将视频、图像、图表和特色产品与清晰的购买路径结合起来。
使用这种方法,您的最终产品将是展示专业知识、主题权威的内容,最重要的是,在客户想问之前就解决客户的疑虑和问题。 这将有助于防止您的客户不得不进行额外的研究或联系客户服务。 由于您的信息丰富且有用的内容,他们将更愿意购买。
此外,这种方法还有可能降低产品退货率。 知情的客户不太可能根据假设的或不完整的知识购买错误的产品。
结论
亚马逊只是这里的冰山一角。 实际上,您可以将此策略应用于任何具有可公开访问的数据以提取数据的网站,例如来自 Quora 的有关产品类别的问题,Trip Advisor 对酒店、音乐场所和景点的评论,甚至是 Reddit 上的讨论。
您越了解客户在访问您的网站时的期望,就可以更好地满足这些期望、激励购买、减少跳出并提高自然搜索性能。
Brad McCourt 是 Catalyst 波士顿办事处的有机搜索经理。