快捷搜索:  汽车  科技

反人类的验证码是什么:反人类的验证码 早应该被干掉

反人类的验证码是什么:反人类的验证码 早应该被干掉扭曲的字母失去了它最初的用处,该让下一代验证码登场了。2014 年,Google 发布了一个专门解读扭曲文本验证码的算法,人工智能技术已经能以 99.8% 的准确率解决最困难的扭曲文本,而人类的成功率是 33%。这就像互联网的一次众筹,求得你的时间而非金钱。互联网的神奇之处便在此,在技术支持下,再创造一些乐趣,你可以利用所有人的一点精力,自然而然聚沙成塔。2009 年,Google 收购了 reCAPTCHA,并将其用于数字化 Google 图书和纽约时报档案。 2011 年,Recaptcha 已经完成了整个 Google 图书档案、1300 万篇纽约时报文章的数字化。2012 年,它每天翻译大约 1.5 亿个单词。人类沉浸在知识的海洋,机器人也没有停下学习的脚步。

验证码创建于 2000 年代初,最早由卡内基梅隆大学的几位计算机科学家开发。

最初的验证码采用了扭曲的文本形式,避免被光学字符识别等计算机程序自动识别,超过了当时计算机可以破译的程度,但对大多数人类可读。

反人类的验证码是什么:反人类的验证码 早应该被干掉(1)

很快,研究人员意识到这项技术具有区分人类和机器人之外的潜力,他们开发了 reCAPTCHA 技术,让用户在填写验证码的过程中将纸质档案数字化,因为人类可以比计算机更好地破译老旧文献中扭曲的字母。

这一阶段,用户必须输入两个词,一个是答案明确的真正测试,另一个是尚未转录的新词。通过向世界各地用户多次显示相同单词,reCAPTCHA 便可以自动验证单词是否被正确转录。

反人类的验证码是什么:反人类的验证码 早应该被干掉(2)

这就像互联网的一次众筹,求得你的时间而非金钱。互联网的神奇之处便在此,在技术支持下,再创造一些乐趣,你可以利用所有人的一点精力,自然而然聚沙成塔。

2009 年,Google 收购了 reCAPTCHA,并将其用于数字化 Google 图书和纽约时报档案。 2011 年,Recaptcha 已经完成了整个 Google 图书档案、1300 万篇纽约时报文章的数字化。2012 年,它每天翻译大约 1.5 亿个单词。

验证码为什么越来越难?

人类沉浸在知识的海洋,机器人也没有停下学习的脚步。

2014 年,Google 发布了一个专门解读扭曲文本验证码的算法,人工智能技术已经能以 99.8% 的准确率解决最困难的扭曲文本,而人类的成功率是 33%。

扭曲的字母失去了它最初的用处,该让下一代验证码登场了。

2012 年,Google 推出了 reCAPTCHA 的图像识别版本,其中包括来自 Google 街景的照片,从而让用户转录门牌号码和其他标志。

反人类的验证码是什么:反人类的验证码 早应该被干掉(3)

类似当初将旧书数字化,在这个过程中,Google 一举多得,既防御了恶意脚本,自己的人工智能也在进步。

2014 年,Google 称:「街景和 reCAPTCHA 团队密切合作,两者都将继续改进,使地图更加精确和有用,reCAPTCHA 更安全、更有效。」让地图更加精确和有用,意味着 Google 需要训练人工智能更好地识别图像中的物体。

那怎么训练人工智能?reCAPTCHA。数以亿计的用户为了证明自己是人类,为科技公司建立起了机器学习数据集。

反人类的验证码是什么:反人类的验证码 早应该被干掉(4)

进步的不止 Google。2017 年,开发人员 Francis Kim 进行了一项实验,用 40 行 Javascript 构建了一个系统,使用 Google 竞争对手 Clarifai 的图像识别 API,尝试通过 reCAPTCHA 的图像验证码。结果,这个脚本成功找出了图中的商店。

理论上,这也可以使用 Google 自己的图像识别技术来实现。

Google 的验证码系统其实有两个目的:在用文本、图像等训练人工智能的同时,抑制恶性脚本的行为。但事实是,Google 的人工智能是越来越厉害了,但恶性脚本也在斗智斗勇中进步,只有用户证明自己是人越来越难了。

2014 年,Google 的 「No CAPTCHA reCAPTCHA」登台,即「没有验证码的验证码」,界面简洁友好,只需要你坚信「我不是机器人」。

反人类的验证码是什么:反人类的验证码 早应该被干掉(5)

猜您喜欢: