6分钟阅读时间 (1225字)

Joomla中的重复页面:原因、最常见错误、解决方案

Duplicate Pages in Joomla: Causes, Most Common Errors, Solutions

每个拥有Joomla网站的人迟早都会面临重复页面的问题。因此,让我们从内部探讨这个问题,我们将弄清楚什么是重复页面,搜索引擎如何对它们做出反应,以及如何摆脱这些邪恶的双胞胎。

因此,页面重复是指您网站上的相同文档,可以通过不同的URL访问。实际上,页面重复是大多数CMS的弱点,不仅仅是Joomla的。所有这些页面在它们被爬虫索引之前都是无害的。最重要的是要关注索引并及时采取行动从结果中删除这些页面,最好的做法是在事先考虑结构并避免这些情况。

重复出现的主要原因在于网站的错误结构。首先,您需要考虑分类和菜单项的层次结构。如果您事先创建多个分类,这可以防止未来出现重复页面。

让我们看看最常见的错误。假设您有一个“新闻”分类,它有几个子分类——“政治”、“经济”等,您直接将所有材料链接到子分类。如果您只创建子分类的菜单项,例如——“政治”,链接可以是以下形式(针对材料)

https://website.com/politics/23-material

https://website.com/1-newsi/politics/23-material

https://website.com/1-newsi/2-politics/23-material

https://website.com/index.php?option=com_content&task=view&id=23&Itemid=1

等等,URL形成的可能变体有很多,所有这些都将只是单个页面的副本。这是一个不应该这样做的一个例子。此外,搜索引擎可能会索引通过“打印”、“PDF”、“发送给朋友”链接可用的技术副本。

当你刚开始创建一个网站时,你需要仔细考虑其结构,并确定主要类别和子类别。随着资源的增长,没有必要更改现有的结构,只需添加必要的附加部分即可。在网站发展的顶峰进行重构是一次沉重的打击,可能会让你几个月都无事可做。实际上,一些页面(或所有页面)可能会更改地址,这会导致搜索结果和访问量不可避免地下降。

那么,搜索引擎是如何找到重复页面的呢?

最常见的原因是开发者在 Joomla 网站上安装的扩展和组件。例如,主页上的新闻模块可能会给出不同的地址。有时这些页面重复可以在网站地图中看到,例如,如果你安装了 Xmap

如果你的网站已经索引,那么找到重复内容并不难,只需复制页面上的几个独特内容并提供,然后在 Google 搜索中以引号插入这些材料。如果你的网站尚未索引,你可以尝试 XENU(如果你的网站真的不是很大),它将找到到达网站的所有可能途径。

为什么我们需要消除页面重复呢?

搜索引擎“不喜欢”并且试图不索引具有大量相同页面的网站,因为这些页面在搜索中的必要性是有疑问的。当针对某些关键字优化页面时,会选择最相关的页面,并针对它们优化内容。如果这些页面有重复,在更新搜索引擎时可能会用它们的副本替换相关页面(这会导致排名急剧下降和流量下降)。

6 种消除重复的方法

每个主题(网站)都是独特的,让我们看看在 99% 的情况下都能很好地工作的最流行的方法。请随意选择这些选项中的任何一个或使用其中的几个。一般来说,这些解决方案可以应用于任何其他 CMS。

如果你在 Joomla 的一般设置中开启了标准 SEF 和 URL 重定向,那么所有这些示例都是有效的。

1. StyleWare 内容规范插件

内容规范插件解决了单页多个 URL 的问题。所以如果你有 component/content/article/32-something.htmlsomething.html,这两个都将从单个 URL(something.html)索引。这是一个非常棒的插件,它做到了它应该做的事情。

2. Joomla 的 Robots.txt

此文件包含在 Joomla 的标准包中,放置在根目录中,可通过链接 yourwebsite.com/robots.txt 访问。它向搜索引擎提供了如何索引网站的说明。借助它,你可以关闭网站的一些部分。此外,你还可以在文件中添加以下说明到默认数据中

Disallow: /*? #包含此标记的每个链接都不会被索引 *

只需一行代码就可以让你避免存储大量内容,例如

  • 打印页面材料;
  • rss 源链接;
  • 网站上的搜索结果页面;
  • 也会关闭页面分页;
  • 可能还有其他选项,具体取决于所使用的扩展。

是否使用此行*由你决定,但请注意,太大的 robots 文件被认为是完全允许的。请注意:该行不得覆盖重要内容,如网站地图,因此你可以简单添加行 Allow: /site_map 你可以在谷歌帮助中的网站地图了解更多信息。

3. 301 重定向

如果您的URL已更改,但所有文档仍然存在,则使用301重定向是合适的。在这种情况下,为了正确绑定,您需要在.htaccess文件中使用301重定向。搜索引擎将知道该文档已移动到新地址。这种方法可以同时保留您的网站性能和PR。

301重定向还可以用于粘合页面重复内容。例如,Joomla网站中主页的常见重复包括 /index.php 和菜单别名 Home,例如: /home/homepage,这些项可以很容易地粘合:打开您的 .htaccess 文件并输入

Redirect 301 /index.php http://site.com/

...或者您也可以在模板的索引文件中执行301重定向

<?php
if($_SERVER['REQUEST_URI'] == '/index.php') {
header("Location: /",TRUE,301);
exit();
}
?>

以下是一个带有和不带有www.的网站URL的优雅示例。

RewriteEngine On
RewriteCond %{HTTP_HOST} ^www.example.com$ [NC]
RewriteRule ^(.*)$ http://example.com/$1 [R=301,L]

* 将example.com替换为您的网站域名。

在此博客文章中,您可以找到更多关于如何使用301重定向的方法如何使用301重定向

4. Meta Tag Robots

防止索引页面重复内容的另一种方法是使用meta标签robots

<meta name="robots" content="noindex"/>

目前,此选项比在robots.txt文件中使用阻止指令更适合Google。例如,要关闭打印页面版本,您需要获取地址,您可以在模板根目录中的 component.php 文件中打开并输入标签 ?tmpl = component<head> </ head> 中。

要关闭搜索结果中的页面,您可以在模板的 index.php 中使用标准 com_search,只需添加以下条件即可

<?php if ($option == 'com_search') : ?>
<meta name="robots" content="noindex"/>
<?php endif; ?>

但首先您需要指定变量

$option = JRequest::getVar('option', null);

5. 从Webmaster面板删除URL

摆脱重复内容的另一种方法是手动从网站管理员的控制面板中删除,对于Google — https://www.google.com/webmasters/tools/home?hl=en

6. X-Robots-Tag标题

Google建议使用X-Robots-Tag作为本综述中第四种方法的替代方案。

HTTP/1.1 200 OK
Date: Tue, 25 May 2010 21:42:43 GMT
...
X-Robots-Tag: noindex
...

如您所见,有多种方法可以删除重复内容,尽管您需要了解每个方法的工作原理,以便选择最适合您的方法。

Joomla社区杂志上发表的一些文章代表了作者对特定主题的个人观点或经验,可能不符合Joomla项目官方立场。

0
使用视频培训客户 - 第4部分
 

评论

已经注册? 在此登录
尚未发表评论。成为第一个发表评论的人

通过接受,您将访问 https://magazine.joomla.net.cn/ 之外第三方提供的服务