3月1日外媒最新報(bào)道,韓國(guó)科學(xué)團(tuán)隊(duì)近期研發(fā)出了一款名字叫做KOALA AI的新型人工智能圖像生成模型,該模型能有效降低對(duì)硬件的需求,并且根據(jù)文本的內(nèi)容,在兩秒之內(nèi)就能夠生成高質(zhì)量的圖片。
該款模型在設(shè)計(jì)的時(shí)候,添加了“知識(shí)蒸餾”的新技術(shù),因此模型設(shè)計(jì)出來之后,很大程度地壓縮了開源圖像生成工具的大小,據(jù)悉Stable Diffusion XL工具截止到目前總共有25.6億個(gè)參數(shù),而研發(fā)團(tuán)隊(duì)添加的知識(shí)蒸餾技術(shù)就可以將25.6億個(gè)參數(shù)減少到7億個(gè)左右。
KOALA正因?yàn)檫@個(gè)原因,不需要使用高端的圖形處理器,包括一些復(fù)雜的設(shè)備。就能非常流暢的運(yùn)行,并且只需要8GB的內(nèi)存,就可以在兩秒之內(nèi)生成非常高清的圖片。
從理論上講最新采用的蒸餾技術(shù),能夠讓大模型在不影響性能以及質(zhì)量前提之下,將大模型中所含有的大量的信息,有效篩選到小模型中,這樣小模型即使在沒有高端硬件支持之下,也能快速的生成高質(zhì)量的圖像,比如團(tuán)隊(duì)在測(cè)試的時(shí)候,就以一張宇航員在火星或者衛(wèi)星下看書的圖片作為提示詞。KOALA模型在1.6秒的時(shí)間內(nèi),快速生成了相應(yīng)的照片,而科技巨頭OpenAI公司所推出的DALL-E 3模型,生成圖片的時(shí)間則需要13.7秒。
該研究團(tuán)隊(duì)認(rèn)為生成式人工智能市場(chǎng),將會(huì)把以文本作為中心的生成模型慢慢的淘汰,產(chǎn)品更新迭代變成多模態(tài)生成模型,因此在大模型的競(jìng)爭(zhēng)格局中,將會(huì)出現(xiàn)更多更小更高效的模型,而這些模型將會(huì)成為發(fā)展新趨勢(shì)。KOALA的出現(xiàn),從AIGC產(chǎn)業(yè)鏈的觀點(diǎn)上看,這種技術(shù)已經(jīng)處于產(chǎn)業(yè)鏈的模型層上端。