逼疯你的验证码, 为什么越来越复杂

傻丫姑凉2024-05-06 21:50:08  67

这天,准备考研的你,踌躇满志地打开了考研报名网站。然而,还没来得及一展才学,你就被卡在了网站登录的验证码上。重叠在一起的字体,布满马赛克的背景,让你输了几次验证码都没有输对。你屡败屡战,但验证码上出现的“骉叕犇羴”,又瞬间让你怀疑自己的学识水平。你再一次自我激励,决定这一次一定要输对,却见刷新出来的验证码上,大大写着两个字:别考。

逼疯你的验证码,为什么变得越来越复杂?折磨人的验证码这个究竟是o还是0?是1还是l?每一次输验证码时,你都会忍不住发出这样的疑问。它那扭曲的形状,粘连在一起的字符,雪花状的背景,常让你陷入自己是不是眼瞎的怀疑。然而,这种字符验证码,还只是日常的基础题,高难度的题目,往往出现在春节这样的特殊时刻。登入12306时要选择的图片验证码,就曾是每个在春节抢过火车票的人的噩梦。你要在一堆高糊的图片中,挑选出各种“犹抱琵琶半遮面”的物体。有时运气不好,碰上排风机、发电机等超出生活常识之外的东西,你就只能被困在一次又一次的选择错误中,眼睁睁看着车票越来越少。

网友们也纷纷调侃,要做对这样的图片验证码题,就如同要一一对应叫出韩国组合IZ*ONE的每个成员。有些验证码更是不满足只考你的眼力,还要测一下你的智商。在购票网站抢演唱会门票时,不仅要懂点文学典故,读过四大名著。末了,还要附带让你算一道数学题。屏幕上的每一个验证码,似乎都在提醒你:没点文化,就别跟人学着追星了吧。

甚至有些验证码,还成了你和朋友间友谊的试炼场。在登录Facebook验证时,系统会随机挑出几张好友发布过的照片,让你辨认照片中的人是谁。本就脸盲的你,再碰上你朋友修炼多年的P图技术,验证码的难度系数也因此倍增。

美国斯坦福大学的研究指出,验证码已经过难。研究者们搜集了8500个多种形式的验证码让受试者辨认,发现他们在判断验证码时,平均要花9.8秒,且同时让三个人辨别同一个验证码,三人间的一致率只有71%。如果是听声音辨识的验证码,准确率会更低,只有31.2%[1]。

验证码疯狂内卷,而你只想砸鼠标。验证码的进化,也是被逼无奈。其实,验证码也不是一开始就这么复杂。在验证码被发明前,许多免费的邮箱网站常遭受恶性外挂软件的攻击。例如在2000年时,雅虎邮箱中曾有大量用机器注册的马甲账号,他们会给用户发大量的垃圾、诈骗邮件。为了解决这个问题,程序开发人员试图找到一种登录验证方式,能判断出正在操作的究竟是人还是机器。

Alta Vista的工程师们便找到了有效的方式。他们发现,在当时,即使是配备了最先进的光学字符识别系统的电脑,也很难正确识别出印在纸本上的字,尤其当字符被拉伸、扭曲时,电脑就更难辨认[2]。然而,这对于人类来说却很容易。我们从小就一直在接受阅读训练,即使纸上的字歪歪斜斜,部分被遮挡,也不影响我们对整体的判读。

扭曲的字符,便成了最常用的登录验证方式,并有了“验证码”(Captcha)这个正式名字。程序员们会预先设定一个字符库,库中的字符会排列组合成字符串,再根据随机变量被扭曲、涂抹,定位在随机背景上,从而成了我们所见的验证码[2]。

这些字符谜题,确实有效减少了网站中的垃圾邮件,到2001年,“ADD-URL”邮箱中的垃圾邮件便减少了95%。但随着电脑光学字符识别技术的不断发展,这种形式的验证码已经越来越难将外挂机器挡在门外。在2014年Google工程师的测试中,即使是最难的扭曲字符类验证码,电脑识别的准确率也高达99.8%[3]。

为了挡住越来越聪明的机器,验证码因此被迫进化,出现了图形验证码、逻辑验证码、语音验证码,甚至还有把几种混合而成的究极形态[4]。不过,你受的每一次苦,也不是白费功夫。你在十秒内减少的脑细胞,其实都转移到了一个AI身上。我们辨识的一些验证码字符,来自那些年代久远的报纸、典籍,这些

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/435386.html
0
最新回复(0)