武汉SEO浏览器中搜索引擎算法公式,PR算法安装步骤及计算

作者:全网营销公司 来源:网络营销 2019-08-10 10:37

能看到这篇文章的读者应该都使用过浏览器,但是你们有谁思考过浏览器中搜索引擎的运作模式?

说个我年轻时有意思的idea

每个用户输入搜索单词,百度就会记录下数据放进一个字典作为key值。然后给你展示一些相关网页,当你选择其中一个,这个选择会被记录为value值存入字典,相同类型越多,这个组合的位置上升地越高。

这么做现在想想也是可行,就是效率会特别低下。而且它有一个不足之处:它把多维关系进行了降维处理。

比如下图

value

A和B可以使一个key:value的关系,可是有时候B也可以是key值,这里就设计到一个权重问题。每一个网页都需要有一个权重值用来评估它的可靠性。

1998年之前的搜索引擎是通过时间顺序基于检索词进行检索。往往搜索结果网页质量不高,很多网页也会故意增加检索词频率,相当于现在的蹭热度。

比如你检索北京市某某中学,它会在下面弄一个友情链接:北京市教育局,公安局……这么做就是为了别人在搜索教育局和公安局的时候给自己增加权重。

为此谷歌的拉里佩奇提出了PageRank算法用来解决这一问题。PR直接翻译就是网页权重,指的是一个网页影响力等于所有入链集合的页面加权影响力之和。

具体公式如下

pr

首先需要了解两个概念

出链:链接出去的链接

入链:链接进来的链接

PR算法还有两个问题

等级泄露:如果一个网页没有出链,就像黑洞一样吸收了其他网页的影响力,导致其他网页PR为0

等级沉没:如果一个网页只有出链,没有入链,迭代下来也会导致该网页PR为0(不存在分母v)

为此拉里佩奇一拍脑门,想出了一个阻尼因子d用来收敛PR算法模型。

具体公式如下

pr

理论太枯燥,我们用实际案例来解释。

安装模块

安装模块

左下角install package。

导入模块

导入模块

创建有向关系

创建有向关系

就是上面那个图片关系。

这里你会发现这是一个列表,其中里面的有向关系是以元组的形式存在的。

创建有向图

创建有向图

查看数据类型

networkx.classes.digraph.DiGraph

添加节点

添加节点

查看个数/节点

查看个数/节点

run

run

求PR值

求PR值

run

run

基础的说完了,接下来实践一个项目,说实话网上数据很多,但是有向的数据真不多。为了给读者一个福利,我好费劲才弄了一份。嘿嘿嘿……

导入模块
导入模块

1和2就不介绍了

3是有向网络模型

4是防错字典模块

读取数据
读取数据

run
run

AB列是人名,我用了加密技术转化为了字符串,C列是两个人交易的金额。

把数据放入列表
把数据放入列表

PR算法中的有向关系是用元组的形式存储的,C列数据用于绘制网络中的边长度。

运行结果
运行结果

list1赋值给变量
list1赋值给变量

为啥要另外赋值一次?

没啥原因:处女座!

创建有向图
创建有向图

防错字典
防错字典

填充数据和边长
填充数据和边长

第一步:填充graph

第二步:填充edges_weights_temp

第二步看着有点复杂,理解了就简单了:假设一个元组不在edges_weights_temp中,则以该【元组】为key,C列为值,如果存在,则累加C列的值。

加个判断看一下效果
加个判断看一下效果

run
run

再把字典转化为列表

设置路径和权重
设置路径和权重

计算PR值
计算PR值

run
run

这就是每个人在这份数据中的交易权重。

设置节点属性
设置节点属性

定义画图函数
定义画图函数

1.判断语句为各种图形的类别

2.使用PR值设置节点大小

3.设置网络边长度

4.绘制图形的节点、边、标签

5.展示图片

运行结果

运行结果

我们发现f362这个人与其他人都有着密切的交易关系,这是一只大佬啊。

打开数据验证一下,正向交易
数据验证

验证fb2a
验证fb2a

如果我们觉得图片中点太多,只要发现其中隐藏的大佬,我们可以用PR值剪枝。

设置阙值
设置阙值

复制网络图
复制网络图

剪掉低于阙值的节点
剪掉低于阙值的节点

n和p_rank
n和p_rank

画图
画图

运行结果

pr

重要角色都被选了出来,是不是很好玩?今天的内容有点多,好好消化一下。


本文地址:网络营销知识频道 http://www.hkm168.com/zhishi/788.html,武汉易企推网络公司,是一家专业的武汉网络推广,网络营销,品牌营销策划,品牌推广公司,提供一站式全网营销推广服务:小程序开发,网站建设,SEO百度排名,SEM竞价托管,品牌营销推广、360搜狗百度竞价开户、百度地图标注、百科词条创建修改、新媒体引流加粉、公司负面公关处理等;另外,转载本文请保留本文地址,谢谢!


相关文章相关文章
本地企业
              可提供上门服务

便捷

本地企业可提供上门服务

提供适合、专业可行方案

周到

提供适合、专业可行方案

5-10分钟售后响应机制<

贴心

5-10分钟售后响应机制

按效果收费,无效果不收费

放心

按效果收费,无效果不收费

行业高标准,效果稳定可靠

稳定

行业高标准,效果稳定可靠

1-3个月排名上百度首页

快速

1-3个月排名上百度首页

武汉易企推网络公司;公司地址:武汉市武昌区静安路6号5.5创意产业园4楼;公司官网:http://www.hkm168.com

服务热线:18120550335 / 027-88866235 欢迎来电咨询; 联系QQ:1193073039

Copyrigh©2017-2030 版权所有:武汉易企推网络科技有限公司 备案号:鄂ICP备17012199号 网站地图