使用Google Analytics细分网站流量2—分割频道流量
本篇将深入“网站的轮廓数据”,从不同子域(频道)的维度对网站的各个度量进行细分。这里会用到Google Analytics的高级过滤器功能(也可以使用高级群众功能来分割数据,两个功能各有利弊。)同时也会解答之前的一个问题,为什么页面代码内的相对URL地址会造成内容报告的数据混乱。
先来模拟一个场景,假设我有一个网站http://bluewhale.cc/ 里面有两个子域(频道)分别是http://s1.bluewhale.cc和http://s2.bluewhale.cc从整体数据上看网站的表现是这样的。
Name | Avg. Time on Site | Bounce Rate |
www..bluewhale.cc | 00:01:42 | 53.04% |
通过和Google Analytics提供的基准数据对比发现,我网站的跳出率要高于行业同类网站的平均水平。(高了19.73%,不少的差距呢。)
53.04%代表全站(每个页面,每个流量来源,每个关键词)的平均跳出率。就是我们说的“网站轮廓数据”。现在要想办法降低网站的跳出率。从哪里下手呢?我的方法是打破这个平均数,把流量按子域(频道)进行分割,找出每个子域(频道)在跳出率上的表现。
分割流量的方法是将不同子域(频道)的流量放在不同的配置文件中。这样就可以为每个子域(频道)都生成一个独立的报告。获得子域的独立数据。模拟场景中我的网站有两个子域,所以要新建两个配置文件。
建立重复配置文件
在Google analytics里一个网站默认只有一个配置文件。重复配置文件是把一个网站的数据同时发送到另一个配置文件中,并且这两个报告的内容完全一样。为什么要创建两个一样内容的配置文件呢?请继续往下看。
创建重复配置文件的具体步骤是,在网站配置文件页选择增加新的配置文件,在创建新网站配置文件时选择为现有域添加配置文件。这个新配置文件是我们用来报告子域数据的,所以在配置文件名称中输入子域的名称或频道名称,并标明建立的时间。同样的方法再为S2子域新建一个配置文件。
现在我的网站配置文件界面中应该有三个配置文件,主域的配置文件和两个子域的配置文件。新建的两个重复配置文件需要几个小时才会有数据显示。我们利用这个时间来进行下一步操作。
为报告中的URL增加域信息
利用这个时间我们创建几个过滤器来分割不同子域(频道)的流量。Google analytics在默认的内容报告中会省略掉域信息,只显示URL路径和文件名信息。这在没有子域的情况下没有问题,但现在有两个问题:
1不同的子域(频道)中可能会存在路径或者文件重名的情况,这时候Google analytics会将流量混淆。
比如:
http://bluewhale.cc/index.html
http://s1.bluewhale.cc/index.html
http://s2.bluewhale.cc/index.html
在内容报告中会把三个域的流量归为一条记录(因为默认情况下会忽略掉URL的域信息),显示为/index.html或/。这也是造成数据混乱的一个原因,前面的系列漏掉了,这里补上。
2我们需要完整的URL来分割不同子域(频道)的流量。
直接过滤不同子域的名称是最方便的方法。这样可以避免URL中不同的路径名称及重复路径和重复文件名造成的问题。
为URL增加域信息需要用到高级过滤器功能。原理是根据页面所在的域把/index.htm修改为www.bluewhale.cc/index.html或者s1.bluewhale.cc/index.html 具体的实施方法是进入任意一个配置文件的编辑界面,在添加过滤器里选择自定义过滤器里的高级。然后按下面的方法设置。
在高级过滤器中输入以下内容:
字段A -> 提取A 主机名 (.*)
字段B -> 提取B 请求URI (.*)
输出至 -> 构造器 请求URI /$A1$B1
设置完毕后分别进入另外两个配置文件的编辑界面,在添加过滤器选项里选择将现有过滤器应用到配置文件,分别对两个配置文件添加刚才创建的高级过滤器。这一步很重要,如果子域的URL数据没有域信息,后面的频道流量分割将会失败。
分割子域(频道)流量
准备工作都已经完成了,现在开始分割不同子域(频道)的流量。还记得刚才新增加的两个重复配置文件吗。现在对两个重复配置文件分别创建包含过滤器,使用URL中的域信息来过滤不同子域的流量。使这两个重复配置文件变成含有不同子域(频道)数据的配置文件。
编辑名字是s1.bluewhale.cc_20100304的配置文件,选择自定义过滤器的包含。在过滤字段内选择请求URL,在过滤字段里用正则表达式输入子域信息。不要区分大小写。最后把这个过滤器命名为S1频道。
同样的方法在s2.bluewhale.cc_20100304的重复配置文件内创建S2频道过滤器。刚才新建的两个重复配置文件现在已经变成了子域配置文件了。
PS:过滤器只对设置后新产生的数据有效。并不会过滤之前已存在的数据。我已在创建配置文件时标注了日期,所以在过滤器名称里不用再次标注。
现在来对比一下不同子域(频道)和主域(网站)的数据差别:
Name | Avg. Time on Site | Bounce Rate |
www..bluewhale.cc | 00:01:42 | 53.04% |
S1.bluewhale.cc_20100304 | 00:03:03 | 30.02% |
S2.bluewhale.cc_20100304 | 00:00:16 | 64.10% |
我们发现S2频道的跳出率高于网站的平均水平。而S1频道的跳出率则低于网站和行业的平均水平。是S2频道拉高了全站的跳出率水平。如果要想降低网站的跳出率,我们要针对S2频道做点工作了。
最后来说明之前的一个问题,为什么页面代码内的相对URL地址会造成内容报告的数据混乱。这也是我在工作中碰到过的一个问题。
先来简单介绍下URL:
这是我博客上的一个URL地址
http://bluewhale.cc/2010-02-24/google-analytics-contents-report.html
由三部分组成:协议类型,主机名和路径及文件名。
http://是协议类型
bluewhale.cc/是主机名
2010-02-24/是路径
google-analytics-contents-report.html是文件名
URL分为绝对URL和相对URL:
绝对URL:http://bluewhale.cc/2010-02-24/google-analytics-contents-report.html
绝对URL包含协议类型,主机名和路径及文件名所有组成部分。
相对URL:2010-02-24/google-analytics-contents-report.html
相对URL指向的网页是相对于当前网页的,所以称为相对 URL。相对URL可以不包含头部的协议类型和主机名。当用户点击链接时浏览器会根据当前网页的相应部分自动将URL补充完整。
举个例子说明一下,我的网站上有三个域:
http://bluewhale.cc
http://s1.bluewhale.cc
http://s2.bluewhale.cc
现在http://bluewhale.cc上有个页面,地址是http://bluewhale.cc/abc.html。我在S1和S2子域的页面内分别用相对URL指向这个页面 /abc.html,当用户点击页面链接后。浏览器根据当前页面情况将相对URL补全。S1子域的完整URL是http://s1.bluewhale.cc/abc.html ,而S2子域的完整URL是http://s2.bluewhale.cc/abc.html这明显是不正确的。Google analytics通过记录页面地址栏里的URL信息来组织并生成内容报告。在我们对不同子域的流量进行分割后,刚才设置的过滤器会根据URL的域信息来判断流量应该属于哪个域(配置文件)。所以建议将所有页面内的URL改为绝对URL。避免出现这种问题。
转载请注明:数据分析 » 使用Google Analytics细分网站流量2—分割频道流量