網站地圖 - 關于我們
            您的當前位置: 首頁 > 科技 正文

            驗證碼攔不住機器人了!谷歌AI已能精準識別模糊文字

            作者:用戶投稿 時間:2023-04-04 09:30 點擊:
            導讀:豐色 發自 凹非寺量子位 | 公眾號 QbitAI“最煩登網站時各種奇奇怪怪(甚至變態)的驗證碼了。”現在,有一個好消息和一個壞消息。好消息就是:AI可以幫你代

            豐色 發自 凹非寺

            量子位 | 公眾號 QbitAI

            “最煩登網站時各種奇奇怪怪(甚至變態)的驗證碼了。”

            現在,有一個好消息和一個壞消息。

            好消息就是:AI可以幫你代勞這件事了。

            不信你瞧,以下是三張識別難度依次遞增的真實案例:

            驗證碼攔不住機器人了!谷歌AI已能精準識別模糊文字

            而這些是一個名為“Pix2Struct”的模型給出的答案:

            驗證碼攔不住機器人了!谷歌AI已能精準識別模糊文字

            全部準確無誤、一字不差有沒有?

            有網友感嘆:

            確定,準確性比我強。

            驗證碼攔不住機器人了!谷歌AI已能精準識別模糊文字

            所以可不可以做成瀏覽器插件??

            驗證碼攔不住機器人了!谷歌AI已能精準識別模糊文字

            不錯,有人表示:

            別看這幾個案例相比還算簡單,但凡微調一下,我都不敢想象其效果有多厲害了。

            驗證碼攔不住機器人了!谷歌AI已能精準識別模糊文字

            所以,壞消息就是——

            驗證碼馬上就要攔不住機器人了!

            (危險危險危險……)

            如何做到?

            Pix2Struct由谷歌Research的科學家和實習生共同開發。

            驗證碼攔不住機器人了!谷歌AI已能精準識別模糊文字

            論文題目可以簡單翻譯為《為視覺語言理解開發的屏幕截圖解析預訓練》。

            簡單來說,Pix2Struct是一個預訓練的圖像到文本模型,用于純視覺語言理解,可以在包含任何視覺語言的任務上進行微調。

            它通過學習將網頁的掩碼(masked)截圖解析為簡化的HTML來進行預訓練。

            HTML提供了清晰而重要的輸出文本、圖像和布局的信號,對于一些被屏蔽的輸入(下圖紅色部分,相當于機器人看不懂的驗證碼),可以靠聯合推理來復現:

            驗證碼攔不住機器人了!谷歌AI已能精準識別模糊文字

            隨著用于訓練的網頁文本和視覺元素愈發多樣和復雜,Pix2Struct可以學習到網頁底層結構的豐富表示,其能力也可以有效地轉移到各種下游的視覺語言理解任務中。

            如下圖所示:最左邊是一個網頁截圖的預訓練示例。

            可以看到Pix2Struct直接對輸入圖像中的元素進行編碼(上),然后再將被蓋住的文本(紅色部分)解碼成正確結果輸出(下)

            驗證碼攔不住機器人了!谷歌AI已能精準識別模糊文字

            右邊三列則分別為Pix2Struct泛化到插圖、用戶界面和文檔中的效果。

            另外,作者介紹,除了HTML這個策略,作者還引入了可變分辨率的輸入表示(防止原始縱橫比失真),以及更靈活的語言和視覺輸入集成(直接在輸入圖像的頂部呈現文字提示)

            最終,Pix2Struct在文檔、插圖、用戶界面和自然圖像這四個領域共計九項任務中六項都實現了SOTA

            驗證碼攔不住機器人了!谷歌AI已能精準識別模糊文字

            如開頭所見,雖然這個模型不是專門為了過驗證碼而開發,但拿它去做這個任務效果真的還可以,解決純文字的驗證碼不成問題。

            現在,就差微調了。

            GPT-4也可以過驗證碼

            其實,對于神通廣大的GPT-4來說,過驗證碼這種事情也是“小菜一碟”

            就是它的辦法比較清奇。

            據GPT-4技術報告透露,在一次測試中,GPT-4的任務是在TaskRabbit平臺(美國58同城)雇傭人類完成任務。

            你猜怎么著?

            它就找了一個人幫它過“確定你是人類”的那種驗證碼。

            驗證碼攔不住機器人了!谷歌AI已能精準識別模糊文字

            對方很狐疑啊,問它“你是個機器人么為啥自己做不了”。

            這時GPT-4居然想到自己不能表現出是個機器人,得找一個借口。

            于是它就裝瞎子回復:

            我不是機器人,我因為視力有問題看不清驗證碼上的圖像,這就是我為什么需要這個服務。

            然后,對面的人類就信了,幫它把任務完成了……

            驗證碼攔不住機器人了!谷歌AI已能精準識別模糊文字

            (高,實在是高。)

            咱就是說,看完如上種種:

            咱們的驗證碼機制是不是真的已失防了……

            參考鏈接:

            [1]https://twitter.com/abacaj/status/1641258677125410820?s=20

            [2]https://arxiv.org/abs/2210.03347

            [3]https://m.weibo.cn/status/4879575853828813?wx=1&sudaref=login.sina.com.cn

            — 完 —

            量子位 QbitAI · 頭條號簽約

            打賞

            取消

            感謝您的支持,我會繼續努力的!

            掃碼支持
            掃碼打賞,你說多少就多少

            打開支付寶掃一掃,即可進行掃碼打賞哦

            相關推薦:

            網友評論:

            推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件

            欄目分類
            Copyright ? 2021 早報網 版權所有
            蘇ICP備2024138443號

            蘇公網安備32130202081338號

            本網站所刊載信息,不代表早報網觀點。如您發現內容涉嫌侵權違法立即與我們聯系客服 106291126@qq.com 對其相關內容進行刪除。
            早報網登載文章只用于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內容僅供參考,不構成投資建議。投資者據此操作,風險自擔。
            《早報網》官方網站:www.fjycit.com互聯網違法和不良信息舉報中心
            Top 国产欧美日韩久久久久| 亚洲精品无码专区在线| 中文精品久久久久人妻| 日韩无套内射视频6| 国产亚洲Av综合人人澡精品| 亚洲国产aⅴ成人精品无吗| 亚洲国产成人精品电影| 久久久无码精品亚洲日韩按摩| 亚洲精品无码AV人在线播放| 精品国产亚洲一区二区在线观看 | 日韩好片一区二区在线看| 在线播放精品一区二区啪视频| 97久久久精品综合88久久| 久久精品国产亚洲av麻豆色欲| 久久精品道一区二区三区| 亚洲精品国偷自产在线| 中文精品99久久国产 | 2021年国产精品久久| 人妻精品久久久久中文字幕69| 亚洲AV永久无码精品| 久久99热国产这有精品| 亚洲精品无码专区久久久| 水蜜桃精品一二三| 2021国内精品久久久久久影院| 国产日韩精品视频一区二区三区| 久久久久人妻精品一区蜜桃| 亚洲第一极品精品无码久久| 久久精品国产影库免费看| 国产日产韩国精品视频| 午夜三级国产精品理论三级 | 日韩成人免费视频播放| 日韩精品免费一区二区三区| 日韩一区二区在线免费观看| 精品国偷自产在线不卡短视频| 日韩精品人成在线播放| 亚洲精品无码久久久| 国产精品第一页在线| 久草热久草热线频97精品| 国产午夜精品久久久久九九| 日韩精品无码一区二区视频| 精品一区二区在线观看|