CooCooWakka : AntiBadWords

首页 :: 索引 :: 修订历史 :: 最新评论 :: CooCooWakkaGroup :: 登陆/注册 :: 你好, 38.103.63.17
你的足迹: » AntiBadWords
最近发现挺多人经常往CooCooWakka页面中填写垃圾信息(也许是为了争取搜索排名而写下的连接)。发现这其实已经开始成为网上Wiki普遍遇到的问题[InterWiki]MeatBall:WikiSpam
对于这些问题,CooCooWakka已经在开发反垃圾信息功能,而之前在该站留写下的恶性链接地址已经被记录在案,将来会随同CooCooWakka一同发布。希望大家可以增加一下文明素养,让Wiki可以健康地在华语中发展。关于更多的讨论可前往AntiBadWords发表.

黑名单:BanList
如果对该名单由任何申诉或添补建议,可在这里发表。
(只有注册用户可编辑)

来自chonqed.org的超级黑名单

我把chongqed.org的数据导出,做了这个badwords.conf,并把其中51.net剔出(他有时不是垃圾者)
大家可以下载使用。在此也支持一下[External Link]http://www.chongqed.org这个反wiki spam的网站。
[External Link]http://www.hsfz.net.cn/coo/wiki/upload/badwords.conf

发现新的垃圾来源

竟然伪装referrer来制造垃圾链接,看来这里反向连接中的垃圾也要对付。--CooYip

我的referrer里spam成灾了,[External Link]http://giki.geneboy.net/wakka.php?wakka=Home/referrers救命呀

您指的是不是这几个
w w w . r a p e - s t o r i e s . b i z
w w w . i n c e s t - t a b o o . n e t
w w w . b e s t i a l i t y - p i c s .o r g 我的站点里也有 By iiuy at .
没错。 --CooYip
发现这些访问都来自于特定的ip:69 . 31 . 86 . 133 ,可以尝试在http服务器中ban掉他。 --CooYip
发现新的网段66.154.0.0/16。 --CooYip

更好的方法?

不知道除了对内容进行搜查还有什么方法防止垃圾呢? --CooYip

是挺烦人的,那边垃圾邮件的问题还没解决,这边又出问题了

其实不用管这些的,用为Google有一个PageRank Zero惩罚,所有发现进行这些操作的站点都会遭受PageRank Zero惩罚。
另外有一个坏消息,那就是bbs.hsfz.net可能遭受PageRank Zero惩罚了,因为某一天我发现它的PageRank由3跌为0,看来我们要改域名或者干点什么。 -CatCat
但无论如何,这都属于恶意修改页面,严重影响访问者。 --CooYip

我的想法

我是觉得waka的删除很成问题,再开放的环境下孕育的waka,信息源源不断的被记录,理论上认为这样的模式是无限增长的,但目前还没有出现理论上无限大的数据库,问题就来了,删除怎么办?这里我是觉得已经不仅仅是对垃圾信息的处理了,还有过期的信息,失效的信息,重复的信息,这些都是在处理范畴里的信息,而且这些信息也同样的在不断增长着,这个问题我想了很长时间,也参考了很多已经具备删除功能的wiki网站的做法,提个不太成熟的想法,是不是能加入人工智能的理念来进行处理,用类似蠕虫的方法来实现,综合链接回溯,地址跟踪,关键在于对记录的是否为处理信息上的界定能有个接近准确的判定,不知道CooYip有没有对waka的删除问题上有很好的解决思路,希望能够在这个问题上得到更多的讨论。--WaDn

关于rel=nofollow的使用

[External Link]http://groups-beta.google.com/group/CooCooWakka/browse_thread/thread/45d44f778f6eca3b
现在在CooCooWakkaCVS中我已经加入这个功能,一棒子打死所有对外联结。但我觉得这样做,特别是如果整个网络社群都这样做,是不利于发展的。折衷的方法是给每个页面加入Verified标记,通过验证的页面可以幸免于难。此外推广InterWiki的使用也非常有用。CooCooWakka不对InterWiki进行任何限制。
By CooYip at Sat January 22, 2005, 5:26 pm.
本页只有一篇留言.[显示留言板]

SourceForge.net Logo Creative Commons License
请享受共创成果的同时,尊重他人劳动。本站点内容如未特别声明,全部遵循 Creative Commons License by-nc-sa协议发布。