网站全站敏感词检测、广告违禁词查询很简单,一个python脚本轻松搞定

建站运维 0 评论

做网站的同学都有一个共同的苦恼:就是自己辛辛苦苦经营的网站,如果内容中涉及色情、暴恐涉政、恶意推广、辱骂、违反广告法、涉及违禁品等文本内容,小则被搜索引擎处罚,严重的可能还会被请去喝茶。还有很多企业站因为编辑的不小心(有些词防不胜防),网页中使用了广告违禁词,可能会被竞争对手投诉到工商等部门,可能会面临关站、整改、罚款等处罚。

这样的例子屡见不鲜,百度去搜一下一大堆。

企业网站被投诉违反广告违禁词案例
企业网站被投诉违反广告违禁词案例

很多站长因此而头疼,目前网上能找到网站敏感词检测和广告违禁词查询的工具都是基于单网页或者单页面内容的,例如你的某一篇文章。对于有成千上万内容的网站检测起来就很麻烦了,总不可能一篇一篇复制过去检测吧。

前几天看到大神玉米同学写了一个全站违禁词检测查询的python脚本,使用以后发现了一些小问题,例如可能把网站上的图片当做一个内容页面去检测,这样会消耗更多网站的资源。就随手修改了一哈:只检测html文件或者目录,另外在过滤词库新增了18000余条色情、暴恐涉政、恶意推广、辱骂、违禁品等敏感词,实现不仅仅查询广告违禁词的功能。只保存有违禁词页面URL方便查询。

本脚本只有两个文件:1、filter.txt(过滤词库,你可以根据自己的需求去增加词库; 2、main.py(主程序)。使用方法如下:

网站全站敏感词检测、广告违禁词查询脚本使用方法:

提示:此脚本是基于python3.X。

1、把main.py主程序中的域名修改成你要查询网站的域名,然后保存。

全站敏感词检测、广告违禁词查询使用方法:1、修改域名
全站敏感词检测、广告违禁词查询使用方法:1、修改域名

2、运行这个脚本。(怎么运行,请到百度搜python或者自行脑补,提示缺py库的请自行pip install)。

全站敏感词检测、广告违禁词查询使用方法:2、运行脚本
全站敏感词检测、广告违禁词查询使用方法:2、运行脚本

3、程序会自动爬取你网站的所有连接,并提示哪个页面命中某个违禁词,最后会在程序运行目录下生成一个ok.csv文件。此文件详细记录了你网站的哪个页面有哪些违禁词。你可以根据这个上面的记录去修改相应的内容。

全站敏感词检测、广告违禁词查询结果
全站敏感词检测、广告违禁词查询结果

是不是很简单呢?当然这个检测查询脚本也只是给各位站长一个提示和预警,全面检测自己网站上面到底有哪些敏感词和广告违禁词,以便及时调整内容,避免遭到损失。最后放出此下载地址。解压缩即可运行。
下载地址:1606560966-全站敏感词查询源码

解压密码获取方法:请使用手机百度扫码(或者在手百里搜索“帽子谈网站优化”小程序),查看本文章,文末有解压密码。

帽子seo百度小程序

  • 本文标题:网站全站敏感词检测、广告违禁词查询很简单,一个python脚本轻松搞定
  • 本文地址:https://www.seoserp.cn/html/2098.html
  • 本建站运维版权归原创作者所有,与本站立场无关。转载请注明出处。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

^