引述外媒報道,先進(jìn)的AI和機(jī)器學(xué)習(xí)算法可以生成逼真的位置和物體圖像,但它們也擅長將人與人之間的面孔互換,并發(fā)現(xiàn)復(fù)雜的深造假品。在微軟研究院和北京大學(xué)的團(tuán)隊(duì)發(fā)表的兩篇學(xué)術(shù)論文中,研究人員提出了FaceShifter和Face X-Ray,這是一種用于高保真度和遮擋意識的面部交換框架,以及一種用于檢測偽造面部圖像的表示形式。他們說,在不犧牲性能的前提下,兩者均與多個基準(zhǔn)相比均達(dá)到了行業(yè)領(lǐng)先的結(jié)果,并且與以前的方法相比,它們所需的數(shù)據(jù)要少得多。

FaceShifter解決了將目標(biāo)圖像中的一個人替換為源圖像中的另一個人的問題,同時保留了頭部姿勢,面部表情,光線,顏色,強(qiáng)度,背景和其他屬性。像Reflect和FaceSwap這樣的應(yīng)用程序聲稱可以相當(dāng)準(zhǔn)確地完成此操作,但是Microsoft論文的合著者斷言,它們對姿勢和透視圖變化敏感。
FaceShifter通過生成對抗網(wǎng)絡(luò)(GAN)來增強(qiáng)人臉交換的保真度-一種由生成器組成的AI模型,該生成器試圖欺騙鑒別器以將合成樣本歸類為真實(shí)樣本,稱為自適應(yīng)嵌入集成網(wǎng)絡(luò)(AEI-Net),該引擎提取屬性在各種空間分辨率下。新穎的是,該生成器結(jié)合了研究人員所謂的注意力非正規(guī)化(AAD)層,可自適應(yīng)地學(xué)習(xí)在哪里整合面部屬性,而單獨(dú)的模型(啟發(fā)式錯誤確認(rèn)細(xì)化網(wǎng)絡(luò)(HEAR-Net))則利用了重建圖像及其輸入之間的差異。

該團(tuán)隊(duì)表示,在一項(xiàng)定性測試中,F(xiàn)aceShifter保留了臉部形狀并忠實(shí)地尊重了目標(biāo)的照明和圖像分辨率。此外,即使在從互聯(lián)網(wǎng)上刮掉的“狂野面孔”上,該框架也學(xué)會了在不依賴于人類注釋數(shù)據(jù)的情況下恢復(fù)異常區(qū)域(包括眼鏡,陰影和反射效果以及其他不常見的遮擋)。
“所提出的框架顯示出在給定任何面部對的情況下生成逼真的面部圖像的卓越性能,而無需經(jīng)過特定學(xué)科的培訓(xùn)。大量的實(shí)驗(yàn)表明,所提出的框架明顯優(yōu)于以前的人臉交換方法?!毖芯啃〗M寫道。
與FaceShifter相比,F(xiàn)ace X-Ray嘗試檢測爆頭何時可能是偽造的。正如相應(yīng)論文中的研究人員所指出的那樣,確實(shí)需要諸如此類的工具-偽造的圖像可能出于惡意目的而被濫用。2019年6月,一份報告顯示,一名間諜使用AI生成的個人資料照片來欺騙LinkedIn中的聯(lián)系人。就在去年12月,F(xiàn)acebook發(fā)現(xiàn)了數(shù)百個帳戶,其中包含使用AI合成的假臉的個人資料照片。
與現(xiàn)有工作不同,F(xiàn)aceShifter不需要掌握操作方法或人工監(jiān)督。相反,它生成灰度圖像,揭示給定的輸入圖像是否可以分解為來自不同來源的兩個圖像的混合。該團(tuán)隊(duì)聲稱這是可行的,因?yàn)榇蠖鄶?shù)臉部操作方法在將更改過的臉部融合到現(xiàn)有背景圖像中共享一個共同的步驟。每個圖像都有從硬件(如傳感器和鏡頭)或軟件組件(如壓縮和合成算法)中引入的自己獨(dú)特的標(biāo)記,并且這些標(biāo)記在整個圖像中趨向于類似呈現(xiàn)。

因此,人臉X射線不需要依賴與特定人臉操作技術(shù)相關(guān)的偽像的知識,并且可以在不使用任何方法生成偽圖像的情況下訓(xùn)練構(gòu)成其基礎(chǔ)的算法。
在一系列實(shí)驗(yàn)中,研究人員在FaceForensics ++上對Face X-Ray進(jìn)行了訓(xùn)練,F(xiàn)aceForensics ++是一種大型視頻語料庫,其中包含使用四種最新的面部操作方法進(jìn)行操作的1,000多個原始剪輯,以及包含從真實(shí)圖像構(gòu)建的混合圖像。他們評估了Face X-Ray歸納四個數(shù)據(jù)集的能力,其中包括上述FaceForensics ++語料庫的一個子集。Google發(fā)行了成千上萬的可視化Deepfake視頻,以促進(jìn)Deepfake檢測方法的發(fā)展;來自Deepfake檢測挑戰(zhàn)的圖像; 以及Celeb-DF,這是一個包含408個真實(shí)視頻和795個具有減少的視覺假象的合成視頻的語料庫。
結(jié)果表明,F(xiàn)ace X-Ray能夠區(qū)分以前看不見的偽造圖像并可靠地預(yù)測混合區(qū)域。研究小組指出,他們的方法依賴于混合步驟的存在,因此可能不適用于完全合成的圖像,并且可能會被對抗性樣本擊敗。除此之外,他們說這是邁向普通人臉偽造檢測器的有希望的一步。
金大立免費(fèi)服務(wù)熱線
地址:成都彭州市工業(yè)開發(fā)區(qū)天彭鎮(zhèn)旌旗西路419號二維碼
