三年過去了,日本「AI生成插圖」的水準發展到了不起的程度……
隨著AI人工智慧的發展,以前許多需要人工完成的工作,現在只需藉助人工智慧就能以快速和便利的方式完成。
通過AI生成插圖也是現在的流行技術之一,人工智慧通過收集大量如頭髮及臉型的畫法,便能自動生成一名二次元的美少女。
其實AI起初的生成插圖成果很粗糙,無論是五官還是比例都非常奇怪,不過伴隨技術逐步成熟,對比三年前後的結果,現在AI生成插圖的水準已經發展到了一種了不起的程度!
大家可以自行體會一下……
至於數個月前,微軟這邊也曾推出了新的人工智慧技術,這是一個像是「藝術家」的東西,一個所謂的「繪圖機器人」。
機器人能夠創建一個以文字描述對象的圖像,但它還能為此圖像添加了細節,這表示AI具有一些自己的想像力。
「如果你在Bing搜索一隻鳥,你會得到一張鳥的照片。但是在這裡,圖片是由電腦逐個從像素開始創建的。」
在華盛頓州雷蒙德市微軟研究實驗室,深度學習技術中心的首席研究員兼研究經理何曉東表示:「這些鳥可能不存在於現實世界中,它們只是電腦對鳥類想像力的產物。」
研究人員表示,機器人能夠生成各種圖像,包括從「普通的田園場景(如放牧家畜),到荒謬的漂浮雙層巴士」。
微軟表示,該機器人已經在配對圖像和標題的數據集上進行了訓練,使其能夠理解如何將單詞與圖像進行匹配。
例如,當標題上寫著鳥時,它能夠學會畫一隻鳥,並知道鳥的外觀應該是什麼樣子的。
他認為:「這是我們相信機器可以學習的根本原因。」
繪圖機器人的技術由兩個機器學習模型組成,一個是從文本描述中生成的圖像,另一個是使用文本描述來判斷生成的圖像的真實性。
前者試圖從後者獲得假照片,但後者不想被愚弄;當兩者結合起來,就能共同創造更高品質的圖像。
有趣的是,要求若沒有提到具體的細節時,機器人如何填補這段空白呢?
基本上由於其長期訓練數據,它已經具備一點自己的常識和想像力。
在鳥類的例子中,即使沒有在文本中說明,機器人通常會畫一隻坐在樹枝上的鳥,因為它最初知曉的圖像通常就是這些類似的東西。
根據最近的一篇研究報告,微軟還指出與現有技術相比,這種新型機器人的圖像品質提升了近三倍。
當然,這不是將AI與藝術相結合的第一項技術。
這兩者的交集有時會產生出色的結果,比如Google的人工智慧也吸引了那些具備自我藝術表演的機器所生成的圖像。
Google有個神經網路,可以猜測你正在繪製什麼內容,還有一個自動繪圖機器人等等,他們會定期詳細介紹它是如何幫助機器學習繪製圖畫這件事。
Facebook也一直在教導神經網路來製作飛機、汽車和動物等小圖片,甚至從照片中創建了自己的Bitmoji形象。
對於微軟來說,教一個機器人從文本中繪製圖像,也算是促進它在計算機視覺和自然語言處理領域裡所執行的工作。
這包括CaptionBot的自動寫入照片字幕的開發,以及可以回答人們詢問圖像式問題的技術,如對象的位置或屬性,這些對盲人有會有一定幫助。
至於AI藝術家在現實世界中的作用,微軟也有一些想法。
這表明該機器人可以作為畫家或室內設計師的素描助手,或者可以作為利用語音促進照片細化的工具。
此外隨著計算能力的增強,該技術可能會從螢幕上製作動畫電影,從而減少動畫師所需的手工勞動,但目前這種技術還沒有實現。
那時候如果仔細觀察這些圖像,幾乎總是會出現缺陷,這表明它們是由機器創造出來的,例如鳥有藍喙或者是各種奇形怪狀的香蕉。
然而微軟表示,這款機器人可能代表了AI的裡程碑。
不過就繪畫方面來說,有網友倒是表示:我的手殘有救了!