西电科大研究团队首次全面破解现行文本验证码
开发新型验证码 计算机难以识别
近日,西安电子科技大学高海昌教授提出一种简单通用的文本验证码自动识别方法,一举破解当前所有使用基于字母和数字识别作为验证码的网站。至此,包括全球流量排名前20的所有网站所使用的验证码被首次全面破解。研究团队共同撰写的论文被信息系统安全顶级国际会议“NDSS’2016”正式全文接收,由此西电科大成为继北大、清华之后,第三家在这个会议上发表论文的国内科研机构。同时,研究团队推出的新型图形验证码,进一步避免当前图形验证码的弊端,对保护互联网资源不被滥用,加强网络安全意义重大。
简单方法破解验证码
准确率超过现有研究团队
高海昌教授介绍说,平时常见的验证码包括文本验证码、语音验证码、图形验证码。若这些验证码存在漏洞,后果很严重。
“我们用一种简单方法,在世界上首次实现所有现存主要文字验证码的破解。”高海昌教授解释,破解思路就是“拆散”再“组合”,随意选择一组文字验证码,使用方向滤波器,经0°、45°、90°、135°四个方向滤波后,原验证码被分解成为只有这四个方向线条的四张图片。原先粘连在一起的字符便被拆散。随后,再把这些线条重新组合在一起。最后,运用动态规划算法将可能的所有结果都组合出来,与样本库中的字符对比,找到最佳组合,也就是要输入的结果。
经检测,世界排名前20的网站的文本验证码均可通过此方法识别,识别率最高可达77%,准确率超过现有所有进行文本验证码研究的团队。
推出新型图形验证码
人类容易分辨 计算机难以识别
“最近频遭质疑的12306网站的图片验证码,人类的通过率只有8%。相反,机器通过却易如反掌。12306后台目前的581种图片验证码,计算机不到一秒便可轻松通过验证码程序。”高海昌告诉记者。
而高海昌团队正致力于研究一种十分巧妙的新型图片验证码,将改变目前图片验证码的缺陷。“在背景图片上自动生成几个线条不连续不均匀、形状不规则的几何图形,图形之间相互交叠,背景中再加入一些短线条作为噪点,就构成我们正在提出的新型图形验证码。”高海昌指出,这种图形验证码的优点是人类很容易分辨,计算机却难以区分识别这些不规则几何图形的边界。
据悉,经试验,目前尚没有计算机程序能有效破解高海昌团队所提出的新验证码。在文本验证码被证明不再安全、失去深入研究的意义时,这种巧妙的验证码为今后相关领域的研究提供了一个深入探索的方向。
高海昌指出,运用指纹、虹膜等生物特征作为验证码也将成为未来研究方向,坚持下去,验证码的发展或许会有翻天覆地的变化。 (记者 姜泓 通讯员 付一枫)
来源:《西安日报》2015年12月23日08版