nykpupmf367692 发表于 2015-10-16 13:04

百度如何判断用户对网站的综合评价

   随着网站数量的急剧增长,网站的质量也良莠不齐,这就导致用户在进行检索时,常常会有各类低质量网站所提供的资源信息排序靠前,严重影响用户的体验度。因此,如何评价网站质量,已经成为百度技术人员需要解决的问题。
       根据百度网站评价算法的一个方面,提供一种计算机实现的用于确定待处理网站的评价信息的方法,其中,该方法包括以下步骤:a 获取所述待处理网站的服务质量信息; b 根据所述服务质量信息,确定该待处理网站的评价信息。根据百度网站评价算法的另一个方面,还提供了一种用于确定待处理网站的评价信息的评价装置,其中,该评价装置包括: 第一获取装置、用于获取所述待处理网站的服务质量信息;第一确定装置、用于根据所述服务质量信息,确定该待处理网站的评价信息。与现有技术相比,百度网站评价算法具有以下优点:1) 能够根据网站的服务质量信息来获得网站的评价信息,以在多种应用场合中筛选出服务质量更好的网站,提供给用户。例如,当将百度网站评价算法的方法应用于搜索场合或网站推荐场合时,可将服务质量较优的网站排序靠前,以使用户更容易获得优质网站,提高用户的体验度;2) 通过参考网站服务质量信息的,进一步结合网站的资源价值信息及用户访问信息,提高了网站评价信息的准确度。扩展阅读:算命最准的免费网站​hsm
       通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,百度网站评价算法的其它特征、目的和优点将会变得更明显:图1 为百度网站评价算法一个方面的用于确定待处理网站的评价信息的方法的流程图;图2 为百度网站评价算法一个优选实施例的用于确定待处理网站的评价信息的方法的流程图;图3 为百度网站评价算法另一个优选实施例的确定待处理网站的评价信息用于对检索结果进行排序的方法的流程图;图4 为百度网站评价算法又一个优选实施例的确定待处理网站的评价信息用于对检索结果进行排序的方法的流程图;图5 为百度网站评价算法一个方面的用于确定待处理网站的评价信息的评价装置示意图;图6 为百度网站评价算法一个优选实施例的用于确定待处理网站的评价信息的评价装置示意图;图7 为百度网站评价算法另一个方面的用于确定待处理网站的评价信息的评价装置示意图;图8 为百度网站评价算法又一个方面的用于确定待处理网站的评价信息的评价装置示意图;图9 为百度网站评价算法再一个优选实施例的确定待处理网站的评价信息用于对检索结果进行排序的评价装置示意图;图9a 至图9d 为图9 所示的评价装置中的虚线框X 的优选结构示意图;图10 为百度网站评价算法再一个优选实施例的确定待处理网站的评价信息用于对检索结果进行排序的评价装置示意图;附图中相同或相似的附图标记代表相同或相似的部件。
       下面结合附图对百度网站评价算法作进一步详细描述。图1 示出了百度网站评价算法一个方面的用于确定待处理网站的评价信息的方法的流程图。其中,根据百度网站评价算法的方法主要通过计算机设备中的操作系统或处理控制器来完成,为简明起见,以下将所述操作系统或处理控制器统称为评价装置。其中,该计算机设备包括但不限于:1) 用户设备;2) 网络设备。所述用户设备包括但不限于计算机、智能手机、PDA 等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing) 的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
       具体的,在步骤S11 中,所述评价装置获取所述待处理网站的服务质量信息。其中,所述服务质量信息包括但不限于以下至少一项:1) 访问友好信息;
该访问友好信息包括与该待处理网站向访问其的计算机设备提供的访问服务相关的质量信息。
例如,该访问友好信息包括但不限于以下至少一项:
a) 所述待处理网站的资源加载速度;
b) 所述待处理网站的网站稳定性;该网站稳定性表示该待处理网站的资源加载速度、可访问带宽等在一段时间内的波动幅度;
c) 所述待处理网站的死链率或死链次数;该死链率或死链次数表示在一段时间内加载所述待处理网站所提供的资源的失败率或失败次数;优选地,当所述待处理网站的主页中包含多个子页面的链接或者包含多个资源下载链接时,任意一个子页面加载失败或者任意一个资源下载失败均被计入前述失败率或失败次数中。
需要说明的是,上述举例仅为更好地说明百度网站评价算法的技术方案,而非对百度网站评价算法的限制,百度技术人员应该理解,任何与该待处理网站向访问其的计算机设备提供的访问服务相关的质量信息,均应包含在百度网站评价算法的访问友好信息的范围内。
2) 搜索引擎友好信息;
该搜索引擎友好信息包括与该待处理网站向访问其的搜索引擎提供的访问服务相关的质量信息。
例如,该搜索引擎友好信息包括但不限于以下至少一项:
a) 所述待处理网站的非文本资源的描述信息数量;其中,所述非文本资源包括但不限于:图片、视频、音频等; b) 所述待处理网站的非文本资源的描述信息的准确度;优选地,该准确度进一步包括:i) 该待处理网站的标题与图片上下文位置的描述信息是否相关;ii) 该待处理网站的非文本资源的描述信息与其他网站对相同或相似非文本资源的描述信息的相关程度等;c) 是否允许搜索引擎生成所需的介绍信息;例如,是否允许搜索引擎生成缩略图、搜索引擎是否能够压缩音频或是否能够截取部分视频等;d) 用户所浏览页面与搜索引擎所抓取页面的一致性;e) 网站所提供的网页中是否包含诸如flash、Java 等较难抓取内容的信息。
       需要说明的是,上述举例仅为更好地说明百度网站评价算法的技术方案,而非对百度网站评价算法的限制,百度技术人员应该理解,任何与该待处理网站向访问其的搜索引擎提供的访问服务相关的质量信息,均应包含在百度网站评价算法的搜索引擎友好信息的范围内。其中,所述评价装置获取服务质量信息的方式包括但不限于以下至少一项:
1) 评价装置直接获取其他设备提供的服务质量信息;
2) 评价装置获取所述计算机设备预存储的服务质量信息;
3) 评价装置获取来自用户的评价信息,以获得服务质量信息;
4) 评价装置通过一次或多次访问所述待处理网站的访问操作来获取服务质量信息。
       接着,在步骤S13 中,所述评价装置根据所述服务质量信息,确定该待处理网站的评价信息。其中,该评价信息包括以下至少一项:1) 评价等级;2) 评价值等。其中,所述评价装置确定该待处理网站的评价信息的方式包括但不限于:
1) 基于该待处理网站的访问友好信息及/ 或搜索引擎友好信息,直接确定该待处理网站的评价信息;
2) 先确定该待处理网站的访问友好度及/ 或搜索引擎友好度,再根据所确定的访问友好度及/ 或搜索引擎友好度来确定该待处理网站的评价信息。其中,所述访问友好度由访问友好信息所包含的各项质量信息,例如,资源加载速度、网站稳定性和死链率中的一项或多项,来确定;所述搜索引擎友好度由搜索引擎友好信息所包含的各项质量信息,例如,非文本资源的描述信息数量、非文本资源的描述信息准确度、是否允许搜索引擎生成所需的介绍信息和用户所浏览页面与搜索引擎所抓取页面的一致性中的一项或多项,来确定。例如,当在步骤S11 中,所述评价装置获得待处理网站的资源加载速度为100kbps,则评价装置根据该资源加载速度和预设的资源加载速度与评价等级的对应关系,确定该待处理网站的评价等级为第二级。又例如,在步骤S11 中,所述评价装置所获取的非文本资源的描述信息数量为20,非文本资源的描述信息准确度为“差”,则评价装置先根据描述信息准确度与评价等级的对应关系,确定初始评价等级为第五级,再根据预设的描述信息数量与评价等级调整方式的对应关系,来将初始评价等级上调二级,以获得评价等级为第三级。又例如,在步骤S11 中,所述评价装置所获取的资源加载速度为200kbps,用户所浏览页面与搜索引擎所抓取页面的一致性为“高”,则评价装置根据该一致性和预设的一致性与一致性分值的对应关系,确定一致性分值为5 ;接着,评价装置根据资源加载速度范围0-2000 及一致性分值范围0-10,来将资源加载速度及一致性分值进行归一化处理并求取平均值后,获得评价值为0.3。再例如,在步骤S11 中,所述评价装置所获取的非文本资源的描述信息数量为20,非文本资源的描述信息准确度为“差”,待处理网站的死链率为20%,资源加载速度为200kbps,则评价装置先根据非文本资源的描述信息数量和描述信息准确度,确定访问友好度为第四级,并根据待处理网站的死链率和资源加载速度确定搜索引擎友好度为第二级,则评价装置根据搜索引擎友好度来调整访问友好度,获得评价等级为第三级。
本文由:登封招聘网转载发布!
页: [1]
查看完整版本: 百度如何判断用户对网站的综合评价