上海11选5

海诺培训

网站地图制作工具,搜索引制作快速抓取

admin

上海11选5   本教程将介绍如何使用Screaming?Frog?SEO spider生成XML Sitemaps。首先,需要下载精简形式的免费SEO蜘蛛,最多500个URL。你可以通过加站长QQ免费获取。

  创建XML Sitemap的后续步骤如下 

网站地图制作工具,搜索引制作快速抓取

上海11选5   1)抓取网站

上海11选5   打开SEO蜘蛛,在“输入网址到蜘蛛”框中输入你想要抓取的网站,然后点击“开始”。

上海11选5   2)点击“站点地图>创建XML站点地图”

上海11选5   当爬网达到100%并完成后,单击顶级菜单中“站点地图”下的“创建XML站点地图”选项。

上海11选5   这将打开许多站点地图配置选项。

上海11选5   3)选择要包含的“页面”

  只有“内部”选项卡中包含的HTML页面以及来自爬网的“200”OK响应才会默认包含在XML站点地图中。因此,您无需担心重定向(3XX),站点地图中包含客户端错误(4XX错误,如断开的链接)或服务器错误(5XX)。可以选择包含它们,因为在某些情况下您可能需要它们。

  被robots.txt阻止,设置为’noindex’的页面已经’规范化’(规范网址与网页的网址不同),分页(具有rel =“prev”的网址)或PDF也不是包括作为标准。这可以在XML Sitemap的“页面”配置中进行调整,因此只需选择您的首选项即可。

上海11选5   可以在“响应”标签下使用相应的过滤器查看哪些网址没有响应,被阻止或重定向或出错。在“指令”标签下查看哪些网址为“noindex”,“canonicalised”或在其上设置了rel =“prev”链接元素,并使用了过滤器。

上海11选5   4)从XML站点地图中排除页面

  在上述配置选项之外,可能还有其他“内部”HTML 200响应页面,根本不希望包含在XML站点地图中。

上海11选5   例如,在站点地图中包含“重复”页面。如果一个页面可以通过两个不同的URL访问,例如http://xusseo.com和http://www.xusseo.com(并且它们都以’200’响应解析),那么只有一个首选的规范版本应该包含在站点地图中。

  有几种方法可以确保它们不包含在XML Sitemap中 –

  如果你不希望在XML站点地图中包含网站或URL路径的各个部分,则只需在配置预爬网中将其排除即可。由于它们不会被抓取,因此它们不会包含在“内部”选项卡或XML站点地图中。

上海11选5   如果你已经抓取了不希望包含在XML Sitemap导出中的URL,则只需在顶部窗口窗格的“内部选项卡”中突出显示它们,右键单击并“删除”它们,然后再创建XML站点地图。

上海11选5   或者,你可以在生成XML站点地图之前将“内部”选项卡导出到Excel,过滤和删除任何不需要的URL,并以列表模式重新上载文件。

  5)选择上次修改日期

上海11选5   这是一个完全可选的属性,包含在XML Sitemap中,因此如果你不想包含文件上次修改的日期,则可以“取消”’包括lastmod标签’框。这只是上次更新页面时搜索引擎的一个提示。

  如果你希望包含’lastmod’,那么只需选择是否要使用直接从服务器提供的“上次修改”响应(并在“内部”选项卡的“上次修改”列中查看)或使用自定义日期。

上海11选5   6)选择URL的“优先级”

  “优先级”是包含在XML Sitemap中的可选属性。如果您不想设置URL的优先级,则可以“取消选中”“包含优先级标记”框。优先级为搜索引擎提供了相对于您网站上其他网址的URL重要性的提示。有效值的范围从0.0到最高优先级1.0,默认值为0.5。

  SEO Spider允许您根据URL的“级别”(深度)配置这些。你可以在“内部”标签中的“级别”列下查看网址的“级别”。

  如上面的屏幕截图所示,默认情况下,主页(或爬网的起始页面)设置为“1”的最高优先级,每个深度级别优先级降低0.1,级别5+降低到0.5。这些可以根据您的喜好进行调整。

  请记住,URL的“优先级”不会影响它们在搜索引擎中的得分方式。“优先级”用于增加最重要页面被爬网和编入索引的可能性。实际上,谷歌在算法上做得非常好。

上海11选5   7)选择URL的“更改频率”

  ‘changefreq’是另一个可选属性,它“提示”页面可能更改的频率。

上海11选5   SEO Spider允许您根据URL的“最后修改”响应或“级别”(深度)配置这些。“从上次修改标头计算”选项意味着如果页面在过去24小时内已更改,则会将其设置为“每日”,如果不是,则将其设置为“每月”。

  请记住,这些不是搜索引擎的命令,只是“提示”。谷歌基本上会在算法上通过XML站点地图中提供的任何“提示”抓取URL。

上海11选5   8)选择要包含在站点地图中的图像

  将图像包含在XML站点地图中是完全可选的。如果勾选了“包含图像”选项,则默认情况下将包含“内部”选项卡(和“图像”选项卡)下的所有图像。如果你的图像位于CDN,子域或驻留在外部,则它们将显示在UI中的“外部”选项卡下。你可以在配置中输入正则表达式,以将这些包含在XML Sitemap中。

  通常,您不需要在XML站点地图中包含诸如您自己的徽标,间隔符或社交媒体配置文件图标之类的图像,因此您可以选择仅包含具有特定数量的源属性引用的图像以排除这些图像。

  通常,像徽标这样的图像会链接到整个网站,而产品页面上的图片(你通常希望包含这些图片)可能只会链接到两次。“图像”标签中有一个“IMG Inlinks”列,显示图像被引用的次数,以帮助调整可能适合包含的“链接”的数量。

  你也可以按照与任何其他URL一样的方式右键单击并“删除”你不想包含的任何图像。

上海11选5   9)包括hreflang

  如果你已经通过属性或HTTP标头在网站上设置了hreflang,则可以选择将hreflang添加到XML Sitemap中。

上海11选5   请注意 – 如果当前已经存在(作为属性或通过HTTP标头),SEO Spider只能使用hreflang创建XML Sitemaps。更多来这里。

上海11选5   10)单击“下一步”以生成XML站点地图

上海11选5   完成配置各种站点地图属性和选项后,只需单击“下一步”即可创建XML站点地图。站点地图文件不能包含超过50,000个URL,并且必须不大于50 MB未压缩。因此,如果您拥有超过49,999个URL,SEO蜘蛛将自动创建其他站点地图文件和引用站点地图位置的站点地图索引文件。

上海11选5   然后单击“保存”到计算机上的首选位置。虽然这是创建XML站点地图所需的所有步骤,但我们之后会推荐几个步骤!

上海11选5   将XML站点地图提交给百度站长平台

  现在,XML站点地图已准备好提交给搜索引擎。最后强烈建议你通过百度站长工具向百度提交XML Sitemap,作为跟踪索引的方法。

  将Sitemap条目插入您的Robots.txt文件

上海11选5   最后,建议你在robots.txt文件中的任意位置添加以下行条目,以通知搜索引擎XML Sitemaps的存在。

上一篇:没有了

下一篇:没有了