问答 第1485页

【每个网站必须要做的:SEO内链优化】 随着各大搜索引擎算法不断改进,SEO优化中外链的效用要远远小于内链的作用。相对于外链地位的下降,目前内链的作用可以说是扶摇直上。即使内链在布局上对于外链来说较于复杂,但是对于SEO优化工作来说,内链为王的作用还是不容轻视。 那么下面安琪娱乐网就为大家来介绍一下内链的作用...【EM算法深度解析】 最近在做文本挖掘的时候遇到了EM算法,虽然读书的时候简单地接触过,但当时并没有深入地去了解,导致现在只记得算法的名字。既然EM算法被列为数据挖掘的十大算法之一,正好借这个机会,重新学习一下这个经典的算法。学习的过程中,我发现网上的资料大多讲解地不够细致,很多地方解释得...

每个网站必须要做的:SEO内链优化

随着各大搜索引擎算法不断改进,SEO优化中外链的效用要远远小于内链的作用。相对于外链地位的下降,目前内链的作用可以说是扶摇直上。即使内链在布局上对于外链来说较于复杂,但是对于SEO优化工作来说,内链为王的作用还是不容轻视。 那么下面安琪娱乐网就为大家来介绍一下内链的作用。

内链的作用

控制成本

你直接就可以在自己的站上进行部署,不像外部链接的不可控性比较大,需要长期的积累才有办法实现稳定的SEO效果。

索引效率

有助于提高搜索引擎对网站的爬行索引效率,有利于网站的收录。

推动排名

良好的网站内部链接策略能推动网站的排名。

PR传递

内部链接还有助于PR的传递,平均站内网页的权威度。

提升流量

内部链接可以提高用户体验度,增加PV,提升访问量。

看到这里呢就有同学会问,既然内链这么重要,那要怎么优化内链合理呢,或者是具体怎么做内链优化呢,不要着急~接着往下看。

优化标准

首先, 一个好的内部链接网站往往体现在搜索引擎的收录量上。一个网站的收录量如果稳定并且持续增加,则意味着至少这个网站的内部链接处理得较为到位。

其次,如果网站有好的整体结构,整个网站的PR传递应该是很均匀的,首页最高,栏目页次之,内容页再次。如果你有意识地通过内部链接策略推动某些重要页面,那么是可以通过网页的链接影响PR的, 当这些页面的PR值和重要性升高的时候,也就意味着你对内部链接的优化是成功的。

最后就是pv值升高,访客的跳出率降低,用户体验度增高。

优化技巧

内链优化的方法和原则有很多种,下面介绍一些对大多数网站都适用的方法。

1.给网站做 Logo加上链接,检查网站的Logo是否带有指向首页的链接。

2.如果链接是图片,则检查图片有没有配上正确的 alt标签。

3.充分利用 导航、底部区域、版权信息等位置增加内链。

4.网站导航链接是搜索引擎蜘蛛向下爬行的重要线路,也是保证网站频道之间互通的桥梁, 建议使用文字链接。避免使用嵌入Java文件的方式实现网站导航。如果想使用图片作为网站导航链接,则需增加alt,另外在图片下搭配一个文字链接作为辅助。

5.在文章内容中增加内链。 文章内部的关键词是个大面积种植内链的地方,但是 不要给一个关键词重复加上链接,一次就好,两次勉强,配合strong、h和em等标签来使用,切忌过多。最好使用关键字插件,在整个网站之中进行频道链接的循环建设,并且利用大量长尾链接回首页。

6.在网站的通栏版权的地方,一定要做上关键词链接,这一点非常重要,还要做上网站地图,这样会更加利于蜘蛛爬行。

原文链接:http://anqiyl.com/800.html
继续阅读:每个网站必须要做的:SEO内链优化

EM算法深度解析

最近在做文本挖掘的时候遇到了EM算法,虽然读书的时候简单地接触过,但当时并没有深入地去了解,导致现在只记得算法的名字。既然EM算法被列为数据挖掘的十大算法之一,正好借这个机会,重新学习一下这个经典的算法。学习的过程中,我发现网上的资料大多讲解地不够细致,很多地方解释得并不明了。因此我决定抛开别人的想法,仅从数学推导本身出发,尽力理解每一个公式的含义,并将其对应到实际的实验过程当中。这篇博客记录了我对与EM算法的思考与理解,也是我人生中的第一篇博客,希望能够对于想要学习EM算法的同学有所帮助。

前面谈到我在做文本挖掘的时候遇到了EM算法,EM算法用于估计模型中的参数。提到参数估计,最常见的方法莫过于极大似然估计——在所有的候选参数中,我们选择的参数应该让样本出现的概率最大。相信看到这篇笔记的同学一定对极大似然估计非常熟悉,而EM算法可以看作是极大似然估计的一个扩充,这里就让我们用极大似然估计来解决一个简单的例子,来开始正式的讨论。

有A,B,C三枚硬币,我们想要估计A,B,C三枚硬币抛出正面的概率 , , 。我们按如下流程进行实验100次:

记录100次实验的结果如下:

我们将上面的实验结果表述如下:
表示第i次实验中,硬币A的结果,1代表正面,0代表反面; 表示第i次实验中,硬币B或硬币C抛出正面的个数,则参数 的极大似然估计分别为:

即硬币A,B,C各自抛出正面的次数占总次数的比例,其中 为指示函数。

实验流程与1相同,但是我们不慎遗失了硬币A的记录结果,导致我们只知道随后十次抛出了多少次正面,多少次反面,却不知道实验结果来自于硬币B还是硬币C。在这种情况下,我们是否还能估计出 , , 的值呢?

这时候利用极大似然估计似乎行不通了, 因为这种情况下,我们不但缺失了硬币A产生的观测值,同时也不知道哪些观测值属于硬币B,哪些观测值属于硬币C。

有些同学可能会提出,虽然我们无法得到三个硬币各自产生的样本,但是我们依然可以得到每个观测值出现的概率。比如在第一次实验中, 我们抛出了5次正面5次反面,我们可以做如下思考:

假设这5次正面由硬币B得到,那么概率应该为 ,而这次观测值来自于硬币B,也就是硬币A抛出正面的概率为

假设这5次正面由硬币C得到,那么概率应该为 ,而这次观测值来自于硬币C,也就是硬币A抛出反面的概率为

综合起来,利用条件概率公式,这个观测值出现的概率就是

因此我们可以将样本整体的概率和似然函数利用 , , 表示出来,通过对似然函数求导,令其关于 的偏导数等于0,我们可以求出三个参数的值。

这个思路听上去十分合理,我们可以顺着这个思路进行数学推导,看看可以得到什么样的结果。首先我们计算样本的概率:

对应的似然函数为

其中 关于 的条件分布为

的分布为

因此我们可以得到

至此,我们成功地得到了似然函数。然而观察可以发现,这个函数是由100项对数函数相加组成,每个对数函数内部包含一个求和,想通过求导并解出导数的零点几乎是不可能的。当然我们可以通过梯度下降来极小化这个函数,借助深度学习库的自动微分系统在实现上也非常容易。但是这种做法过于简单粗暴,有没有办法来优雅地解决这个问题呢?在继续讨论之前,我们先将这类问题进行一般化表述:

我们观测到随机变量 产生的m个相互独立的样本 , 的分布由联合分布 决定, 是缺失数据或无法在实验中被直接观测到,称为 隐变量 ,我们想要从样本中估计出模型参数 的值。在接下来的讨论中,我们假定 的取值是离散的,于是可以得到似然函数如下:

接下来,我们就探讨一下,如何利用EM算法解决这个问题。

这一部分的数学推导,主要参考了吴恩达CS229n的笔记,并且根据个人的思考和理解,尽力对公式的每一步进行详细的解释。我们先简单地介绍一下琴生不等式。

琴生不等式有多种形式,下面给出其离散形式的表述和概率论中的表述:
1.若 为严格凹函数, 为定义域内的n个点, 是n个正实数,且满足 , 则下述不等式成立:

当且仅当 时,不等式取等号。

2.若 为严格凹函数, 为实值随机变量,且期望存在,则下述不等式成立:

当且仅当 ,即 为常数时,不等式取等号。

注: 这里将函数上方为凹集的函数称为凹函数, 例如 函数就是凹函数。
相信大家对琴生不等式都十分熟悉,因此这里就不做过多的说明。接下来,我们将琴生不等式应用到我们的问题中。

回到我们之前的问题上, 我们想要极大化下面这个函数:

但是我们无法对这个函数直接求导,因此我们借助琴生不等式,对这个函数进行变换。为了让过程看上去简洁,下面只对求和中的第 项进行计算。

令 满足 ,且 ,则根据琴生不等式,可以得到:

当且仅当 为常数时,上述不等式取等号。也就是说,对于任意 , 是一个与 无关的量。设对于任意 ,我们可以得到:

因此当 时,不等式 取等号,容易验证此时 , 与 无关。将 综合一下,我们可以得到以下结论:

到这里为止,我们已经拥有了推导出EM算法的全部数学基础,基于 我们可以构建出E步和M步。上面的数学推导虽然看上去略为复杂,但实际上只用到了三个知识点:
1.琴生不等式:

2.条件概率:

3.联合分布求和等于边缘分布:

对上面的数学推导有疑问的同学,可以结合上面这三点,再将整个推导过程耐心地看一遍。

大部分关于EM算法的资料,只是在数学形式上引入了 函数,即 ,以满足琴生不等式的使用条件,却没有过多地解释 函数本身。这导致了很多人完全看懂了算法的推导,却还是不理解这些数学公式究竟在做什么,甚至不明白EM算法为什么叫做EM算法。所以在给出E步和M步之前,我想先谈一谈 函数。

我们回顾一下 函数所满足的条件(暂时不考虑琴生不等式取等号的限制),

在 所有可能的取值处有定义。可以看出, 是 的样本空间上任意的一个概率分布。因此,我们可以对不等式 进行改写。首先我们可以将含有 的求和写成期望的形式:

这里 指的是在概率分布 下,求随机变量 和 的期望。有同学会问,为什么我们平时求期望的时候只要写 ,并没有指明是在哪个概率分布下的期望。这是因为一般情况下,我们都清楚地知道随机变量 所服从的分布 ,并且默认在分布 下求期望。

举个例子,我手上有一个硬币,抛了10次,问抛出正面次数的期望。这种情况下,大部分人会默认硬币是均匀的,也就是说抛出正面的次数 服从二项分布 ,期望 。这时有人提出了质疑,他说我认为你这个硬币有问题,抛出正面的概率只有0.3,那么在他眼里, 期望 。

回到正题,我们利用等式 改写不等式 ,可以得到:

这正是琴生不等式在概率论中的形式。我们可以将不等式倒过来理解:
首先,假定随机变量 服从概率分布 , 是 的样本空间上的任意一个概率分布。这里 可以是一组定值,也可以是关于参数 的函数。

显然,当我们取不同的 时,随机变量 的期望也会随之改变。需要注意的是,由于 与 相关,所以这里的期望不是一个数值,而是关于 的函数。

当我们令 为 的后验分布 时,上面的期望最大。这里有两点需要注意,1. 后验分布 也是一个关于参数 的函数。2. 由于期望是关于 的函数,所以这里的最大指的并非是最大值,而是最大的函数。

若对于每一个 ,我们都令 为 的后验分布 ,则上述期望之和等于我们要极大化的似然函数,即

通过上述分析,我们为寻找似然函数的极大值点 提供了一个思路。我们不去极大化似然函数本身,而是去极大化 。至于如何将这个思路实际应用,就要利用到EM算法中的E-step和M-step。

这一节中,我们先给出E-step和M-step的数学形式,随后在结合抛硬币的例子来解释这两步究竟在做什么。下面进入算法的流程,首先我们任意初始化 ,按下述过程进行迭代直至收敛:

在第 次迭代中,
(E-step)对于每个 ,令
(M-step)更新 的估计值,令

EM算法从任意一点 出发,依次利用E-step优化 ,M-step优化 ,重复上述过程从而逐渐逼近极大值点。而这个过程究竟是怎样的呢,就让我们一步步地揭开EM算法的面纱。

假设我们现在随机初始化了 ,进入第一轮迭代:
(E-step)

由于我们已经假定模型参数为 ,所以此时 不再是与 有关的函数,而是由一组常数构成的概率分布。结合抛硬币的例子来看,这一步是在我们已知模型参数 的基础上(虽然这是我们瞎猜的),去推测每一次的观测值是由哪个硬币产生的,或者说我们对每一次观测值做一个软分类。比如我们根据初始化的参数,计算出 , 。可以解释为第 个观测值有20%的概率来自于硬币B,80%的概率来自于硬币C;或者说硬币A抛出了0.2个正面,0.8个反面。

(M-step)

考虑到 是一组常数,我们可以舍弃常数项,进一步简化上面这个要极大化的函数

由于 不再与 相关,因此上面的函数变成了对数函数求和的形式,这个函数通常来说是容易求导的,令导数等于0,我们可以求出新的参数 。我们仍旧以抛硬币为例进行解释,

令 , 可以得到,

这三个参数的解释是显而易见的。我们在E-step中对每个观测值进行了软分类, 可以看成是硬币A抛出正面的次数,所以 是 的极大似然估计; 是我们抛硬币B的次数, 是硬币B抛出正面的次数,所以 是 的极大似然估计;对于 我们有相同的解释。

我们将这个结果与抛硬币1中极大似然估计的结果相比较可以发现,之前结果中的指示函数 变成了这里的 ,在指示函数下,某个观测值要么来自于硬币B,要么来自于硬币C,因此也称为硬分类。而在 函数下,某个观测值可以一部分来自于硬币B,一部分来自于硬币C,因此也称作软分类。

将上述两步综合起来,EM算法可以总结如下:我们首先初始化模型的参数,我们基于这个参数对每一个隐变量进行分类,此时相当于我们观测到了隐变量。有了隐变量的观测值之后,原来含有隐变量的模型变成了不含隐变量的模型,因此我们可以直接使用极大似然估计来更新模型的参数,再基于新的参数开始新一轮的迭代,直到参数收敛。接来下我们就讨论为什么参数一定会收敛。

前面写了太多的公式,但是这一部分我不打算给出收敛性的数学推导。其实数学上证明EM算法的收敛性很容易,只需要证明每一轮迭代之后,参数的似然函数递增,即

继续阅读:EM算法深度解析

淘宝网店标题优化技巧

淘宝网店标题优化技巧 淘宝网店标题优化一直是提高转化率的重要因素,据统计,不少淘宝网店引入的`流量均不是精准流量,造成前期关键词搜索量偏差,下面我分享自己的标题优化技巧给大家。 一、标题优化中需要包含哪些关键词呢? 1、 品牌,商品品牌或店铺名称, 2、 商品名称 3、 定位词,白领、学生等 4、 商品风格词,复古、小清新等 5、 卖点词,聚拢、瘦身等 6、 其他词,正品、买一送一(可加可不加) 二、标题优化过程 1、 新品期前15天,点击率至关重要,主要优化三级长尾关键词,保...
继续阅读:淘宝网店标题优化技巧

低版本苹果手机如何安装微信

微信作为一款全球流行的社交应用程序,已经在人们日常生活中扮演着重要的角色。尽管如此,对于一些使用低版本苹果手机的用户来说,安装和更新微信可能会遇到一些挑战。本文将详细介绍如何在低版本苹果手机上顺利安装微信,并提供一些解决方案。首先,在低版本的苹果手机上下载微信,需要通过App Store应用商店进行。在搜索框中输入“微信”或“WeChat”,点击搜索结果中的“获取”按钮。系统将自动下载并开始安装微信。下载完成后,手机会自动跳转到安装界面,用户需要同意微信的使用条款和条件。确认无误后,点击“安装”按钮。在安装...
继续阅读:低版本苹果手机如何安装微信

怎么提高宝贝权重和排名免费教学

小编提供几大建议:怎么提高宝贝权重和排名免费教学:百度营销商学院、阿里巴巴商学院、淘宝商学院、牛商学院;SEM/SEO网站,比较出名的网站:北京SEO研究中心/潭洲营销网站/潭洲SEO论坛/无忧技术博客/简爱SEO/我爱自学网/推一巴; 3.到相关培训中心报名系统的学习; 4.自己买相关教程/视频/书籍; 5.与有经验丰富之人经常互动。 6.边学边运用边总结,助自己快速成长,将宝贝权重和排名优化上去。越努力,越幸运!加油!你说的是淘宝吗?你可以百度一下,建议走正规渠道。...
继续阅读:怎么提高宝贝权重和排名免费教学

纸媒怎么与新媒体结合

纸媒与新媒体的结合,是内容与渠道的深度融合。纸媒作为内容源,其优势在于深度、专业、有品质的文章产出。新媒体作为传播渠道,能跨越时间和空间的限制,将内容快速触达大众。两者结合,将为读者提供更丰富、更便捷的阅读体验。在数字化时代,纸媒可以通过开发手机APP,将内容搬上移动终端,实现线上阅读。同时,还可以通过社交媒体等新媒体平台进行内容分享和传播,提升影响力。内容为王,只要纸媒能产出高质量、有价值的内容,就能在新媒体渠道中找到市场。广告商对内容的认同,是其愿意付费的重要因素。因此,纸媒需要不断优化内容策略,满足用...
继续阅读:纸媒怎么与新媒体结合

微信公众号文章排版怎么设计

微信公众号文章排版设计要点:1. 封面图: 封面图是吸引读者点击的关键,尺寸为900x383像素。不会设计封面图的话,可以使用免费在线设计工具,如创客贴或稿定设计,修改模板文字即可。2. 文章配图: 寻找免费且可商用的图片避免版权问题。推荐使用Pexels网站,图片免费且可用于商业用途。3. 文字排版: 正文字号设置为15像素,标题为17像素,行距2像素,字距1.5至2像素。段落两端对齐,首行不缩进,段落间空一行,标题间空两行。字体颜色以灰色或黑色为主,整篇文章的配色不宜超过三种。4. 底部二维码: 二维码...
继续阅读:微信公众号文章排版怎么设计

浅谈网络营销的风险

昨天看了一个帖子,那位朋友说他扔了2万块搞网络推广,资金安排并不怎么合理,虽然钱不多,但是也会觉得可惜,如果真的做好了,倒没什么,做不好即丢了钱,又浪费了时间、人力。网络营销跟其他传统营销方式一样,都存在风险,当然,这里指的风险不一定是赔钱,有时候,走错一步,可能使你前功尽弃。“风险总会有的,但是你要懂得管理”---《富爸爸》丛书作者罗博特·清绮这样说。是的,如果你担心风险而不敢去做,那你永远不会是个成功者,成功者一般都是冒险家,成功者知道怎么去管理风险。有些老板,虽然兜里很有钱,也明白网络的力量,但是他总...
继续阅读:浅谈网络营销的风险

淘宝上诺基亚二手机可靠吗?

不可靠 完全骗人的,而且网上的东西没有质量保证,坏了还得自己出钱去修。没有保修单。更何况是二手货,配件,主板什么的肯定都换过好多都是翻新机,注意点不是很可靠,还不如多加几百买个新的呢,等元旦,过年的时候买吧,到时各个卖得地方有活动可以优惠估计是山寨或翻新,便宜没好货...
继续阅读:淘宝上诺基亚二手机可靠吗?

xc营销助手是什么

题主是否想询问“营销助手是什么”?方案提供商,根据查询营销助手官网信息显示,营销助手是中国领军的线下中小实体店营销解决方案提供商。营销助手围绕门店引流、拉新、留存、裂变打造实体店营销闭环,通过去中心化的智慧门店解决方案赋能中小商家实现数字化转型。...
继续阅读:xc营销助手是什么