信阳大型网站SEO页面生成机制和数据分析

河南网站建设 phpacg 2年前 (2018-04-23) 124次浏览 0个评论

页面自动生成机制,指的是从导词-上线-调优的整个进程,机器自动生成,人工辅佐调参的。适用于拥有大数据量的站点。并且很久之前就有人在用了,算是新鲜的套路了。 当然小站点、新站点也不是不成以,只不过需求渡过资源空短期。 好比这是14年收的一个小单站

页面自动生成机制,只的是从“导词-上线-调优”的整个进程,机器自动生成,人工辅佐调参的。适用于拥有大数据量的站点。并且很久之前就有人在用了,算是新鲜的套路了。

当然小站点、新站点也不是不成以,只不过需求渡过资源空短期。

好比这是14年收的一个小单站,之前SEO流量就没超越1万,年底做了局部“页面自动生成机制”,很粗糙,然后等了3个没动态,第4个月终于末尾有革新,然后流量不时涨涨涨涨,之后不时不变在10万支配,又掉又涨,过了一年后,末尾掉掉掉,由于系统长时间不调整,灌出去很多渣滓词和渣滓数据。

信阳大型网站SEO页面生成机制和数据分析

好比这是本年终做的庞大规模的站群,异样的套路,但是由于经过一年多的各种折腾,顺序开发上的才干比之前牛逼许多,所以上数据的速度和规模也比之前大很多。一个半月流量从0到1万,然后由于某次系统更新,新上了一套模板,URL格式与之前的页面一样,好比都是:domain.com//.html,形成了URL路由担任抵触,招致一堆页面翻开前往500,过了半个多月才知道…..但是任何由于“网站不变性”形成的SEO损失,都是很难逆转的。

信阳大型网站SEO页面生成机制和数据分析

下面是“页面自动生成机制”的流程:

关键词导入模块

信阳大型网站SEO页面生成机制和数据分析

从各种渠道拉出一批行业词根

围绕这些词根去挖词

挖出的词,过滤掉涉嫌违禁、擦边、敏感、自定义黑名单、重复的词

由于各种扩词渠道,扩出的词能够与所属词根,完全不相关。所以需求计算一下扩展词与对应词根的字符串相似度,相似度高的,则为同一类词。

好比 “奥迪二手车价钱” 的扩展词有 “5万以内二手车

” 和 “奔腾二手车价钱”;

“奥迪二手车价钱”与“奔腾二手车”的相似值为:0.71875

“奥迪二手车价钱”与“5万以内二手车”的相似值为:0.3750

相似值>=0.45的为同类词,则“奥迪二手车价钱”与“奔腾二手车”是相关的,“奥迪二手车价钱”与“5万以内二手车”是不相关的。

相关且有搜索量的词,,进入该行业频道的词表,生成的页面给予最大的资源支持;相关但无搜索量的,给予较小的资源支持;不相关但有搜索量的,进入初始搜索词表,该词不归属于任何一个行业;不相关还没搜索量的,直接删除。

初始搜索词表中的词,依次经过相似度计算出与该词最相关的N个搜索词,作为“相关保举”板块的链接调用的逻辑。

内容获取模块

信阳大型网站SEO页面生成机制和数据分析

针对行业频道词表的词,依次抓取每个关键词的相关信息,信息来源如抓取各类搜索引擎搜索结果的注释、各类门户搜索结果的注释等等

过滤掉涉嫌违禁、擦边、敏感、自定义黑名单、重复的内容

剩余内容写入内容数据表

页面熟成模块

信阳大型网站SEO页面生成机制和数据分析

差异类型站点,页面自动生成机制的模型差异,本渣渣用过仅是“纯信息展现”类的站点。

假设网站是一个多边产品,那在模型的设计上需求思索更多的要素,好比触及B端和C端的平台产品,SEO页面的设计上还需求思索对B端流量分发平衡的状况等。

喜欢 (0)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址