4、与google的关系。
alexa的站点分类目录取自dmoz.org。别忘了,google的站点分类目录同时也取自这里。根据该分类信息,一个网站在alexa被归入哪一类哪一国,实际是在dmoz.org的分类上被归入哪一类哪一国。因此,所谓的alexa中国网站强就是这样产生的。许多网站,流量比百强中的网站大,但因为他的网站没有被dmoz.org收录,或者被收录在dmoz.org非中文/中国站点分类中,它就不会在中国网站百强出现。注意alexa上显示的与该站点存在链接/与之相近的网站,这一数据通常是通过goolge得到的。
5、alexa爬行原理:
Alexa不断地向各个可以公开得到的网络站点爬行,并创建一系列数据。 alexa收集数据所创造的特征主要是: 站点信息:评价, 站点的快照, 指向该站点的链接及与之相关的链接。
在每天,alexa收集这些站点的terabyte信息。爬行是外部的,也不需要你下载什么,也不防碍该站点的正常使用。 Alexa从1996年开始收集这些数据,并且不断增加已收集信息数量。
alexa发现网站的模式
alexa使用许多技术来发现网络站点的信息,并创建该站点的数据和链接特征。(通常是通过google搜索得到这些网站,如果该站点的排名在100万名内以内,就会显示该网站数据,如果单日排名超过10万位,就出在alexa图上显示他当时的曲线)