AI繪圖逆天了 透過細節、畫質與邏輯 你能破解Real or Not?
天啊嚕,AI 真的成精了。
最近,AI 生圖真假難辨這事兒,鬧得那叫一個沸沸揚揚。
除了火爆全網的 AI 谷歌小姐姐,社交平台上又冒出了形形色色的 FLUX 生成的人物照片,個頂個的逼真。
趁着這波熱度,微軟總裁 Brad Smith 在 X 平台上發布了一個 AI 測試小遊戲 ——Real or Not ?
玩法很簡單。每一輪遊戲有 15 張圖片,玩家來判斷哪張是 AI 生成的,哪張是真實的。
我們試玩了一下,15 張圖片猜對了 6 張,正確率還不到一半,真搞不懂是我眼瞎還是 AI 太逆天。
-1- 呦呵!這真真假假的世界
近日,微軟總裁 Brad Smith 在 X 平台上 po 出了一張照片,並附文稱:
「你能判斷這張圖片是真實還是偽造的嗎?參加這個測試來檢驗你的 AI 識別技巧,並分享你的得分,共同助力打擊 Deepfake 技術的濫用。」
同時,他還給出了這款小遊戲的鏈接:https://www.realornotquiz.com/
這裏面的圖片真實得有多離譜?
看看這位女士,微笑時眼角自然皺起的魚尾紋、嘴角的法令紋,淺棕色的眼睛,頭髮絲,甚至是隱約可見的色斑,都真實得不得了,但結果 ——
她竟然是 AI。
再看這四朵小黃花,畫質過於清晰,左下角的花瓣似乎有些扭曲變形,瞅着特別像 AI 抽風的「傑作」,但是 ——
這是真實的!
真服了這個老 6!開局就栽跟頭。
再給幾張圖片讓大家猜猜:
沒錯,以上這四張照片都是真實的。
經過我們火眼金睛一頓瞅,最終正確識別 40% 的圖片。
多番試驗,再加上網友們的啟發,我們發現了 AI 生成圖片的 bug。
第一看細節,尤其是手指是否畸形、影子是否扭曲等。
比如這幅多人彈吉他的圖片,仔細觀察會發現左側沙發上彈吉他的人憑空多出一隻手。
再比如這幅夕陽下海邊剪影。乍一看沒啥毛病,但看那人的影子,腦袋像個機器人,由此判斷是 AI 生成。
第二看畫質、膚質。
如果畫質過於清晰,皮膚細膩到看不見毛孔,額頭和兩頰還呈現出光澤感,這十有八九是 AI 生成的。
第三看是否符合物理世界邏輯。
例如消防員滅火時噴灑的乾粉滅火器,怎麼可能像下過雪一樣,堆得到處都是?
一輛生鏽破舊的坦克,大概率不會丟棄在遊樂園附近。
-2- 你到底是不是人?
無獨有偶。
去年還火了一款號稱「社交圖靈測試」的 AI 小遊戲 ——Human or not?
官網鏈接:https://app.humanornot.ai/
此遊戲綜合了 Jurassic-2、GPT-4、Claude 和 Cohere 四個大語言模型。
遊戲規則:系統在線給你分配一個搭檔(partner),你們只被允許限時聊 2 分鐘。然後,系統讓你回答屏幕對面的這個 partner 究竟是人類(Human)還是 AI 機器人(AI Bot)。
大家猜猜對方是人類還是個機器人?
這英語表達、這傲嬌的語氣,多像個真實的人類,但…… 它是個機器人。
再來一個:
聊完一個回合,在遊戲時間未耗盡的情況下,對方突然離開,毫無疑問,這就是人類。
而這種有問必答,禮貌得體的,則是 AI。
經過多番較量,我們摸索出一個經驗,回答簡短的不一定是 AI,但回答得長篇大論的,大概率是 AI,因為 20 秒根本來不及打太多字。(每次回答都有時間限制,20 秒)
此前,《每日郵報》的記者也進行了相關測試,在 10 次對話中,有 6 次猜對。報道稱,雖然 AI 偶爾會出現糟糕的語法,但它確實成功地複製了人類的語言,讓「Human or not?」的遊戲變得極其困難。
早在 70 多年前,計算機科學和密碼學先驅艾倫・麥席森・圖靈提出「圖靈測試」這一概念。
他認為,測試者與被測試者(一個人和一台機器)在隔開的情況下,通過一些裝置(如鍵盤)向被測試者隨意提問。多次測試後,如果機器讓每個參與者做出平均超過 30% 的誤判,那麼這台機器就通過了測試,並被認為具有人類智能。
AI 發展到今天這個地步,社交媒體上早已充斥着大量真假難辨的圖片、視頻,甚至聊天時都不知道對面是真人還是 AI。
我們在體驗到新奇和有趣的同時,也會有些恍惚和「小小的恐懼」,《黑鏡》降臨的世界究竟如何......
工具鏈接 ——
Real or not 鏈接:https://www.realornotquiz.com/
Human or not 鏈接:https://app.humanornot.ai/
延伸閲讀:購買平板電腦是為了生產力?用家表示:小屏做高性能才是最理想(點擊連結看全文)
【本文轉自「機器之能」,微信公眾號:almosthuman2017】