Amazon在計算機視覺和圖形識別重要年度會議CVPR中,發(fā)布了三篇改善用戶線上購買衣物體驗的論文,除了改善文本搜索商品的能力之外,也要讓系統(tǒng)能夠主動推薦能補充用戶已選擇商品的建議,并且還要讓系統(tǒng)能夠合成衣服到模特兒身上。

Amazon的第一篇論文描述了一種,能夠讓用戶通過文本描述,修正產(chǎn)品查詢的方法,像是用戶能以“我想要淺色的花朵圖案”,來改善產(chǎn)品查詢結果。研究人員訓練了一個擁有三個輸入的神經(jīng)網(wǎng)絡模型,三個輸入分別為來源圖像、文本修正描述以及與文本描述相符的目標圖像,這個主模型由位于工作管線中不同位置的三個子模型組成。
研究人員設計了一種可將文本描述表示,和圖像特征表示融合在一起的方法,在工作管線中,來源圖像和文本描述表示,會先融合在一起,接著才與目標圖像相互關聯(lián)。
由于較低端的模型傾向表示像是材質(zhì)與顏色等較低端的特征,而較高端的模型表達袖子長短和松緊等較高端的特征,因此這個新系統(tǒng)使用的分層配對(Hierarchical Matching)技術,有助于訓練模型,確保能在不同層次適當處理文本修正。
每種語言描述和視覺表現(xiàn)的融合,都由兩個獨立的組件模型執(zhí)行,其中一個關注來源圖像和目標圖像需要維持相同的視覺特征,另一個則關注要改變的特征。經(jīng)過測試,這個系統(tǒng)有助于提高搜索到與文本修正相符結果的幾率,較之前系統(tǒng)提高58%。
而Amazon的第二篇論文,則是建議用戶購買能夠補充選購衣物的商品,研究人員提到,這項新系統(tǒng)能夠預測服裝和飾品的兼容性,并在用戶選擇襯衫和夾克之后,推薦可搭配的鞋子。圖像會經(jīng)過模型產(chǎn)生一個表示矢量,矢量會以遮罩處理,這個經(jīng)訓練的遮罩,能夠?qū)κ噶刻卣鬟M行調(diào)整,縮小部分特征的影響以及放大部分特征的影響。
當目錄中的每個物品都以矢量表示,則要找出特定服裝的搭配,就變成了矢量配對的問題,研究人員提到,這個系統(tǒng)能以56.19%精確度推薦商品,較之前的系統(tǒng)表現(xiàn)都還好。
第三篇論文則是描述一個能將衣服合成到目標模特兒身上的系統(tǒng)Outfit-VITON,相當于虛擬試穿系統(tǒng),將參考照片中人物的穿著,合成到另一張照片的模特兒身上,研究人員提到,Outfit-VITON使用對抗網(wǎng)絡,由生成網(wǎng)絡和判別網(wǎng)絡的競爭產(chǎn)生結果。
Outfit-VITON由三部分組成,形狀生成模型、外觀生成模型以及外觀修正模型,形狀生成模型會圈出要試穿的衣服形狀,并計算要試穿模特兒的身材以及動作,其輸出的形狀表示到外觀生成模型,外觀生成模型的工作和形狀生成模型相似,其會結合形狀生成模型所生成的結果,合成出模特兒穿著指定服飾的照片,接著由第三個模型進行微調(diào),保留商標以及特殊圖案,研究人員表示,這個系統(tǒng)比以前的系統(tǒng)產(chǎn)生更自然的結果,能夠產(chǎn)生正確的分割圖,通過改變所選服裝的形狀,以符合目標人物。
網(wǎng)站欄目:Amazon運用AI要為模特兒虛擬換裝
瀏覽地址:http://chinadenli.net/article40/cjsheo.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供面包屑導航、云服務器、網(wǎng)站建設、小程序開發(fā)、網(wǎng)站設計公司、企業(yè)建站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)