MFC+OpenCV(还是非法授权使用)+北大方正的文字过滤SDK(Hook xxxText API,比对关键字列表)
IE图像的获取:本来是认为用HTTP协议嗅探,截获Image Stream,至少我做是这样实现的.绿坝居然是自动扫描IE的Cache(通常在"C:\Documents and Settings\登录用户名\Local Settings\Temporary Internet Files"),所以有些FireFox无效,因为Cache目录不同,相信绿坝以后会改善.然后采用肤色匹配算法查找该图片连续肤色所占图片的比例.发现可疑进一步采取人类脸部的模式匹配(基本就是圆形).所以黄色占大部分,且整体外形不是圆形就一概为"色情"图片.这样就造成误判的比例非常高.
文字过滤Hook Api,不像屏幕取词,还Hook住SetText等(可能还Hook住输入法接口API,没有仔细研究)一旦发现可疑就立即关闭宿主程序.
以上所有监测手段的最后处理就是TerminateProcess直接关闭,造成用户的信息丢失.比如IE打开多个窗口,其中一个被绿坝截获关闭则所有IE都被强制关闭.
绿坝整体感觉就是SDK堆砌出来的东西,所有东西的实现都有相对应的OpenSource SDK可以实现.感觉雇一些业余程序员赶工个几个月就可以实现.
4000W资金到帐后就完全不一样了,可以请些牛人重写核心代码.比如个人建议是图像和文字识别都采用Http协议流的嗅探,另外增加 FTP,POP3,SMTP,甚至MSN,QQ协议的破解嗅探可以对Internet上的这些主流服务的图片,文字传输进行截获分析.文字比对放到服务器上而不要放到客户机上.关闭进程前给用户个倒计时给用户保存的时间.取消本地的Hook API.一,不稳定.二,没必要,只需截住对外发送的文字流就足够了.截获的实现可以再Socket层,可以用驱动,也可以HOOK等.但个人认为有资金在最后结合网卡驱动进行OEM整合或者干脆自己做个绿坝网卡,通过工信部实施所有电脑免费安装该网卡,可以把Internet数据流在网络口第一时间进行转换,截获.代码固化在网卡硬件中,通过网卡驱动与绿坝通信.这样最安全也最稳定,基本上有人破解也要费很长时间,在通过法律手段宣布破解绿坝违法这样就基本上达到全民电脑监控的目的了.
以上只是技术上的探讨,如有不对敬请指正.