友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!阅读过程发现任何错误请告诉我们,谢谢!! 报告错误
九色书籍 返回本书目录 我的书架 我的书签 TXT全本下载 进入书吧 加入书签

搜索引擎优化魔法书-第28章

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!




     每一个       父标记包括一个         子标记条目。 



2、XML 标记定义  



    以下对可用  XML      标记进行说明。 



                             表 6…8…2   XML  标记 



                必 

            封装此文件并提供当前协议标准作为参考。 

                填 



                必 

               每个网址条目有一个父标记。剩余标记为此标记的子标记。 

                填 



                必   该页的网址。如果你的  Web           服务器需要网址的话,此网址应以协 

      

                填   议开始(例如:http )并以斜线结尾。此值应少于  2048                  个字符。 



                可   该文件上次修改的日期。此日期应采用  W3C Datetime                格式。如果 

    

                选   需要的话,此格式允许省略时间部分,而仅使用  YYYY…MM…DD 。 



                    页面可能发生更改的频率。此值为搜索引擎提供一般性信息,可能 

                    与搜索引擎抓取页面的频率不完全相关。有效值为: 

                        * always 

                        * hourly 

                        * daily 

                        * weekly 

                        * monthly 

                可       * yearly 

   

                选       * never 

                    值“always”应当用于描述每次访问时都会改变的文档。而值“never” 

                    应当用于描述已存档网址。 

                    请注意此标记的值被视为提示而不是命令。尽管搜索引擎抓取工具 

                    在做决定时考虑此信息,但是它们对标记为“hourly”页面的抓取频 

                    率可能低于每小时一次,而对标记为“yearly”页面的抓取频率可能高 

                    于每年一次。抓取工具也可能定期抓取标记为“never”的页面,以便 

                    它们能够处理对这些页面的意外更改。 



                    此网址的优先级与你网站上其他网址的优先级相关。有效值范围从 

                可   0。0 到 1。0。此值不会影响你的网页与其他网站上网页的比较结果, 

    

                选   只是告诉搜索引擎你认为你的那个网页最重要,从而它们对你页面 

                    的抓取可以按照你最喜欢的方式进行排序。 



                                                                        第90 页 


… Page 99…

搜索引擎优化魔法书 SEO Magic Book  浩维互动免费电子书 timev 



                    一个网页的默认优先级为0。5。 

                    请注意,你为页面指定的优先级不影响你的网址在搜索引擎的结果 

                    页的排名。搜索引擎在同一网站的不同网址之间进行选择时使用此 

                    信息,因此,你可以使用此标记来增加相对重要的网址在搜索索引 

                    中显示的可能性。 

                    而且,请注意为你网站中的所有网址都指定高优先级对你没什么好 

                    处。由于优先级是相互关联的,只用于在你自己网站的网页之间进 

                    行选择;你网页的优先级不会与其他网站的页面优先级进行比较。 



3、实体转义  



    Sitemaps  文件为  UTF…8 编码(通常在保存文件时可以做到)。对于所有的  XML                    文件, 

任何数据数值(包括网址)都应对下表中列出的字符使用实体转义码。 



                              表 6…8…3  实体转义 



                        字      符                  转 义 码 



               & 符号             &            &; 



               单引号              '            ' 



               双引号              〃            "; 



               大于               》            >; 



               小于               《            <; 



   此外,所有的网址(包括 Sitemaps 的网址)都应编码,以便它们所在的,以及网址转义 

的  Web 服务器识别。然而,如果使用任何脚本、工具或日志文件来生成网址(除了手动输 

入之外的任何方法),通常这部分已经替你完成了。如果提交了  Sitemaps                        却收到  Google  无 

法找到某些网址的错误消息,请查看并确保你的网址遵循RFC…3986 URI                        标准、RFC…3987IRI 

标准以及  XML     标准。 

    这是使用非  ASCII     字符(ü )以及要求实体转义的字符(&)的网址示例: 

    example/ümlat。html&q=name 

    这是  ISO…8859…1 编码的(用于使用该编码的服务器上的托管)以及网址转义过的同一 

网址: 

    example/%FCmlat。html&q=name 

    这是  UTF…8  编码(用于使用该编码的服务器上的托管)且网址转义过的同一网址: 

    example/%C3%BCmlat。html&q=name 

    这是实体转义过的同一网址: 

    example/%C3%BCmlat。html&;q=name 



4、XML Sitemaps 示例  



    下例显示了一个  XML  格式的  Sitemaps 。示例中的  Sitemaps         包含少数网址,每一个都 

用   XML 标记来识别。此示例中,为每个网址提供了一组不同的可选参数。 



                                                                       第91 页 


… Page 100…

搜索引擎优化魔法书 SEO Magic Book  浩维互动免费电子书 timev 



 

 



     

      example/ 

      2005…01…01 

      monthly 

      0。8 

     

     

      example/catalog?item=12&;desc=vacation_hawaii 

      weekly 

     

     

      example/catalog?item=73&;desc=vacation_new_zealand 

      2004…12…23 

      weekly 

     

     

      example/catalog?item=74&;desc=vacation_newfoundland 

      2004…12…23T18:00:15+00:00 

      0。3 

     

     

      example/catalog?item=83&;desc=vacation_usa 

      2004…11…23 

     

 



     你可以使用  gzip       压缩 Sitemaps 文件。压缩 Sitemaps 文件会降低对带宽的要求。请注意, 

未压缩的  Sitemaps      文件不得大于  10MB 。 



5、使用 Sitemaps 索引文件(对多个 Sitemaps 文件进行分组)  



     你可以提供多个  Sitemaps          文件,但提供的每个  Sitemaps            文件包括的网址不得超过 

50,000   个,并且未压缩时不能大于  10MB                  (10,485,760)。这些限制条件有助于确保  Web 

服务器不会因传输非常大的文件而遇到麻烦。 

     如果要列出超过  50,000           个网址,你需要创建多个  Sitemaps                文件。如果预计你的 

Sitemaps  网址数量会超过  50,000  个或大小超过  10MB,应考虑创建多个Sitemaps 文件。 

如果你的确提供了多个 Sitemaps,你可以将其列在Sitemaps 索引文件中。Sitemaps 索引文件 

只能列出不超过  1,000            个 Sitemaps。 

     Sitemaps  索引文件的  XML        格式与  Sitemaps     文件的  XML  格式非常相似。Sitemaps 

索引文件使用以下  XML             标记: 



                                                                                     第92 页 


… Page 101…

搜索引擎优化魔法书 SEO Magic Book  浩维互动免费电子书 timev 



     loc 

     lastmod 

     sitemap 

     sitemapindex 



    注:Sitemaps  索引文件只能指定与其位于同一网站的  Sitemaps 。例如, 

    yoursite/sitemap_index。xml 可包含位于yoursite 的 

Sitemaps,但不能包含位于example 或yourhost。yoursite 的Sitemaps。 

与 Sitemaps 一样,你的 Sitemaps 索引文件应为UTF…8          编码。 



6、XML Sitemaps 索引示例  



    下例展示了一个  XML  格式的 Sitemaps 索引。该 Sitemaps 索引列出了两个  Sitemaps: 



 

    

  

   example/sitemap1。xml。gz 

   2004…10…01T18:23:17+00:00 

  

  

   example/sitemap2。xml。gz 

   2005…01…01 

  

    



    备注:与  XML     文件中的所有值一样,Sitemaps           网址需要实体换码。 



Sitemaps  索引  XML  标记定义 



     需要有        标记并用其来识别  Sitemaps       的位置。 

         标记是可选标记,用于指示相应  Sitemap            文件的修改时间。它并不 

        对应于该  Sitemap    中列出的任一网页的更改时间。lastmod              标记的值应采用 

        W3C Datetime 格式。通过提供最近修改的时间戳启用搜索引擎抓取工具,抓 

        取工具将只检索索引中的 Sitemaps           的一个子集,也就是说,抓取工具只检索 

        某特定日期之后修改的 Sitemaps。通过这一递增的Sitemaps  提取机制,可以 

        快速发现超大型网站上的新网址。 

     标记封装单个 Sitemaps 的相关信息。 

     标记会压缩有关文件中的所有 Sitemaps 的信息。 



7、Sitemaps 文件的位置  



    Sitemaps 文件的位置决定该 Sitemaps 中所能包含的一组网址。位于 

example/catalog/sitemap。gz 的Sitemaps 文件可包含以example/catalog/开 

始的任何网址,但不能包含以example/images/开始的网址。 

    如果有更改example。org/path/sitemap。gz 的许可,你应该也可以提供以 

example。org/path/作为前缀的网址的信息。 



                                                                         第93 页 


… Page 102…

搜索引擎优化魔法书 SEO Magic Book  浩维互动免费电子书 timev 



     example/catalog/sitemap。gz 中,被认为有效的示例网址包括: 

         example/catalog/show?item=23 

         example/catalog/show?item=233&user=3453 

     example/catalog/sitemap。gz 中被认为无效的网址包括: 

返回目录 上一页 下一页 回到顶部 0 0
未阅读完?加入书签已便下次继续阅读!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!