橘子百科-橘子都知道橘子百科-橘子都知道

武汉市有多少人口2023年,武汉市有多少人口2022总人数

武汉市有多少人口2023年,武汉市有多少人口2022总人数 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆以来(lái),微(wēi)软(ruǎn)公司创始人比尔·盖(gài)茨(cí)已多次公开谈论人(rén)工智能话题。在最近(jìn)的一次(cì)采访(fǎng)中,他再次表示:“AI可(kě)能会让科(kē)技行业迎来一次剧烈的洗牌”。

这个结(jié)论(lùn)是他(tā)在当地时间2月20日接受《In Good Company》节目(mù)专访时提出的(de)。

他(tā)预期,AI的发(fā)展可能会威胁到谷歌的市(shì)占率,因为微(wēi)软在AI方面的行动相当迅速(sù)。而最(zuì)终科(kē)技(jì)巨头将把AI整合武汉市有多少人口2023年,武汉市有多少人口2022总人数成用户的“全能助手”,包揽一切应用(yòng),与(yǔ)人们进行沟通并提供建议,可以(yǐ)取代亚(yà)马逊、Siri或Outlook等应用。

大佬口中(zhōng)全(quán)能助手的到来可能尚(shàng)需时(shí)日(rì),但由ControlNet引发的又(yòu)一次AI绘画浪潮,让(ràng)AIGC在(zài)ChatGPT的话(huà)题(tí)热(rè)点包围中杀出(chū)重围。

ChatGPT之后又一应用(yòng)杀疯(fēng)了,AIGC或进入可控期,将洗牌(pái)科技行业?_黑料正(zhèng)能(néng)量

01

ControlNet颠覆AI绘画新玩法

AIGC向可控靠近

以AI绘(huì)画为代表的AIGC上一(yī)次爆火的时候(hòu),还是2022年8月,在美国(guó)科罗拉多州(zhōu)举(jǔ)办的(de)新兴数字艺(yì)术家竞赛中(zhōng),一幅名为《太空(kōng)歌剧院》的作品获奖。

随后各(gè)大厂商的AI绘画软件被广大网友熟知并体验,Stable Diffusion便是其中代表。

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可控期(qī),将(jiāng)洗牌科技(jì)行业?_黑料正能量

用(yòng)户们可以在(zài)应用(yòng)中输入一(yī)组关键(jiàn)词或(huò)者一(yī)张照片(piàn),就能(néng)获得一幅AI创作的画作。

作(zuò)画的关(guān)键(jiàn)就(jiù)是(shì)所输入(rù)的(de)文本。同一组关键词也可以创作出很多张风格不一(yī)样的画(huà)作,这让创作的过程就像(xiàng)开盲盒(hé)。

很多用户很喜(xǐ)欢(huān)这种不(bù)确定的惊喜,他们会(huì)将生(shēng)成的美(měi)图当做(zuò)头(tóu)像。而另一部(bù)分喜欢(huān)翻看AI绘(huì)画的“翻(fān)车(chē)”作品。在(zài)社交媒体(tǐ)上,许(xǔ)多用户分享AI“翻车现场”,例如,一(yī)位网友的小狗(gǒu)照片(piàn)被AI画成武汉市有多少人口2023年,武汉市有多少人口2022总人数了“肌(jī)肉男”,还有网(wǎng)友的个人照片被AI识别成了(le)建筑。

而如今随着ControlNet的出(chū)现(xiàn)与加持,以往AI绘画的(de)填写关键词游戏(xì)可能要被颠覆了。

ChatGPT之后又一应用杀(shā)疯(fēng)了,AIGC或进(jìn)入可控期,将(jiāng)洗牌科技行业?_黑料正能(néng)量(liàng)

ControlNet是一位正在斯坦福读博的中国人张吕敏(mǐn)创作的一种基于控(kòng)制点(diǎn)的图像变形算法,主(zhǔ)要用于数字图像处理、计算(suàn)机视觉(jué)和(hé)计算机图形学等领域。

其(qí)SD插件(jiàn)一经发(fā)布(bù),在短短的(de)两天内便成为了AI绘画领域最新(xīn)的热(rè)点。

在此(cǐ)之前,大家(jiā)用(yòng)了很(hěn)多方法(fǎ)想让AI生(shēng)成的结果尽可能的符合要(yào)求,但是都不尽如(rú)人(rén)意(yì),它的出现代表(biǎo)着AI生成开始进入真正(zhèng)的可控时期。

因为ControlNet可以直接提取画面的构图,人物的姿势和(hé)画面的深度(dù)信息等。有了它的(de)帮(bāng)助,就不用频繁的用提示词来碰运气,抽(chōu)盲盒式的创作了。

通俗的说(shuō)ControlNet相当于(yú)给AI绘(huì)画加了“魔(mó)法(fǎ)”,不少(shǎo)博(bó)主的作(zuò)品(pǐn)已经(jīng)获得了大量的浏(liú)览(lǎn)量,“viggo”就是其中之一,他(tā)用朋友的照片直接(jiē)带她们(men)走进动(dòng)漫世界。

ChatGPT之后又一应(yīng)用杀疯(fēng)了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑(hēi)料正能(néng)量(liàng)

viggo先(xiān)用(yòng)StableDiffusion图片转文(wén)字。

再用Text2Prompt插件(jiàn)拓展找到(dào)对应的(de)关键词;最后(hòu)用ControlNet插(chā)件绑定骨骼(gé)开始换关键词试效果。

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可(kě)控期,将洗牌科(kē)技行业?_黑料(liào)正能量

通过图片就可以看出来,效果十(shí)分惊艳(yàn)。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正(zhèng)能量

ChatGPT之后又一应用杀疯了,AIGC或进入可控期(qī),将(jiāng)洗(xǐ)牌科(kē)技行业?_黑料正能量

更厉害的(de)是(shì),除了真实的照片,草图也可以(yǐ)加上“魔法”,知乎(hū)大牛(niú)“DevPoint”和“逗砂”介绍(shào)到(dào)ControlNet还(hái)能实现(xiàn)线稿转全(quán)彩图。大神张吕敏其本尊也(yě)亲自回应(yīng)。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或(huò)进(jìn)入可控(kòng)期,将洗牌科技(jì)行业?_黑料正能量

不得不说当下AIGC已经变得越来越(yuè)强(qiáng)大,甚至输出的作品都已经(jīng)能以假乱(luàn)真了。

02

难辨虚实,AIGC技术力爆发

警惕安(ān)全问题

近日,“苏(sū)州(zhōu)金鸡湖有(yǒu)游艇party”的消息(xī)火(huǒ)遍(biàn)网(wǎng)络,而(ér)经过(guò)警方(fāng)辟谣这所谓的“party”可能是(shì)全国(guó)第一起(qǐ)AI绘图(tú)诈骗。

由(yóu)于这个活动里面(miàn)给出的美女照片(piàn)都是AI制作的(de)真(zhēn)人(rén)照片绘图(tú),因为太逼真,被(bèi)大家当成真事传播了

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控期,将洗牌(pái)科(kē)技行业?_黑料正能量

不(bù)过仔细观察可(kě)以发现(xiàn),活动发(fā)起者提供的照片(piàn)中有个很大的(de)漏洞可以(yǐ)发现(xiàn)并非真人,而是AI绘图(tú),那(nà)便是图片中女性(xìng)的(de)手(shǒu)指部(bù)分有的存在异(yì)常。

ChatGPT之后又一应用杀(shā)疯(fēng)了,AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑料正能量

有行(xíng)业人事(shì)表示:“现在(zài)因为(wèi)手指部(bù)分的(de)绘画算(suàn)法(fǎ)比较复(fù)杂,AI还不太会画人的手,但最新看到的图片(piàn)已(yǐ)经有越来越完美的AI模型出现,以后可能就完(wán)全(quán)没有漏洞了。

类(lèi)似(shì)的AI作图诈骗在(zài)国外(wài)也已(yǐ)有发生。据英(yīng)国广(guǎng)播(bō)公(gōng)司报道,土耳其地震期间(jiān),有(yǒu)Tiktok用户使用AI合(hé)成了儿童(tóng)受灾的假照(zhào)片发布到网络,以此诱骗善良(liáng)的(de)人打赏“捐(juān)助”从而实施诈骗。

目(mù)前随着技术发展,AIGC已经能做出真(zhēn)人照(zhào)片般的绘图效果,如果这样的(de)图片(piàn)被用来诈骗,将(jiāng)非常(cháng)可怕。

此外AIGC还引发了很多担忧,一(yī)方面,批判(pàn)者(zhě)认为AI在“学习”了(le)大(dà)量前人的作品之(zhī)后,其创作(zuò)没有任何情绪(xù)和(hé)灵魂,难以和人类的艺术创(chuàng)作(zuò)相提并论。

另一(yī)方(fāng)面,AIGC背后的版权、目前都并(bìng)没有得到有效的解决(jué),还有AIGC会不会代替人类“至高无上”的创意。

马斯克也强调(diào),人工智能的(de)安全问(wèn)题需要得到重(zhòng)视,太晚(wǎn)就来不及(jí)了。

03

AIGC下一(yī)站除了视频,还有(yǒu)远(yuǎn)方

技术都是有(yǒu)两(liǎng)面(miàn)性的(de),潜在的危(wēi)害(hài)并不能掩盖其光辉的贡(gòng)献。现在看来,人工智能技术将是第四次工业(yè)革命的核心(xīn)驱(qū)动力量(liàng),将创(chuàng)造新(xīn)的增长奇迹。

过(guò)去(qù)一年,人工智能在技术(shù)和商业层面都有了巨大进展,AI绘画(huà)就是人工(gōng)智能技术(shù)发生方(fāng)向(xiàng)性改变的一(yī)个代表。其下一站或许就是视频。

此前(qián),Meta和谷歌先(xiān)后发布了几条(tiáo)引(yǐn)爆科技圈(quān)的(de)短视(shì)频。这些视频引发关注并非(fēi)内容做得多优秀,反(fǎn)而都非常(cháng)简单,比如一匹正在喝水的(de)马,一只画(huà)画的玩具(jù)熊,或者一(yī)段骑摩托车的第一视角录(lù)像,随便一个有手机的人都可以随手录(lù)下(xià)一(yī)段。

ChatGPT之后(hòu)又一应用杀疯(fēng)了,AIGC或(huò)进入可(kě)控期,将(jiāng)洗牌科(kē)技(jì)行业?_黑料正能量

但(dàn)这些短视频(pín)的(de)创作方式非常简(jiǎn)单,创作(zuò)者仅仅需要向AI输入一段(duàn)话(huà),甚至只是说一下(xià)要求,AI就可(kě)以根据需要生成一段(duàn)视频。

谷歌发布的两个AI生成视频分别来自于(yú)Imagen Video和Phenaki,前(qián)者主要突出(chū)的是高清,与Meta的Make-A-Video没有太多的差别。

在Make-A-Video公布了(le)AI生成(chéng)的视频后(hòu),AI圈(quān)就(jiù)已经玩了一波梗,一个能(néng)够做出更高清视频的AI还不足(zú)以在短时间(jiān)内戳中(zhōng)兴奋点。

Phenaki更加令人震(zhèn)惊的地(dì)方在于,它可以制作(zuò)出超过2分钟的连贯的也有确切(qiè)内容的视频,这才是真正让人们(men)感到惊喜的(de)地方。因为无论AI生(shēng)成的视频(pín)多么高清,也只能是(shì)为内容生产者提供一个灵感(gǎn),一个(gè)素材,一(yī)个过场动画。

不(bù)过(guò)能够(gòu)制作出有(yǒu)具(jù)体剧情内容的视频就意味(wèi)着(zhe),一些视频创作由AI代替人(rén)工完成已经(jīng)初步有了(le)可能。

当下AI的(de)发(fā)展速度已经超过大部分人的想象。内(nèi)容产业的本质是(shì)供给创造需(xū)求,AIGC作为全新的内容生产方式,可以为(wèi)内容产(chǎn)业带来(lái)更新(xīn)的内(nèi)容风格、更(gèng)快的生(shēng)产速度,更低的生产成本,这无疑会(huì)驱动(dòng)内容(róng)产业(yè)的(de)大爆发。

除(chú)了AI绘图(tú)、视(shì)频,AIGC技术(shù)还(hái)能应(yīng)用于(yú)音乐、代码、机器人(rén)动作等多种(zhǒng)内容(róng)形式的生(shēng)成。不难发现该(gāi)项技术(shù)不仅在游(yóu)戏等行业(yè)能得到(dào)有效应用,对于下一代互(hù)联网各种元素的构建亦有关键意(yì)义。

从(cóng)商业化的角(jiǎo)度来看,文化娱乐(lè)、教育、传(chuán)媒等诸多领域,本(běn)身就对基于AI的(de)可视化内容有强烈需(xū)求。

因此,AI绘画及视频或不是结果,而只是AI进程中的(de)一块(kuài)重要拼图(tú),有望在技术更新(xīn)的加持下实(shí)现更(gèng)大的应(yīng)用价值(zhí)。

AI从理解内容,走(zǒu)向了可以生(shēng)成内容,甚至能够创造出独立价(jià)值和独立视(shì)角的内(nèi)容。AIGC的再次出圈,更代表着未来的先进生产力即将到(dào)来。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌(pái)科技行业(yè)?_黑料正能(néng)量

04

紧(jǐn)抓大模型与算(suàn)力,牢固AIGC底(dǐ)座

从(cóng)技术的发展也可以看出,在语(yǔ)言大模型、图(tú)像大模(mó)型之后(hòu),多(duō)模态大模型已经成为了新的趋势(shì)。

大(dà)模(mó)型(xíng)被(bèi)誉为当前人(rén)工智能(néng)发展的(de)智(zhì)能底(dǐ)座,是全球竞(jìng)争最(zuì)激(jī)烈的研究方(fāng)向之一(yī),包括谷歌、亚马(mǎ)逊(xùn)、百度(dù)、阿里、腾讯等众多头部(bù)企业都在(zài)竞相(xiāng)发(fā)力。

不过训练(liàn)大模型的(de)确价格(gé)不菲,以国盛证券发(fā)布的《ChatGPT需(xū)要多少算力》报告估算,GPT-3训练一(yī)次的成本约为140万美元。而对于一些(xiē)更(gèng)大的LLM(大型语言模型),训练成本(běn)则介于200万美(měi)元至1200万美元高价之间。

以ChatGPT在2023年1月的独立访(fǎng)客平均(jūn)数1300万计算,其对应芯(xīn)片需求为3万多片英伟(wěi)达(dá)A100 GPU,初始投入(rù)成本约为8亿(yì)美元(yuán),每日仅(jǐn)电费就在5万美(měi)元(yuán)左右。

ChatGPT之后又一应(yīng)用(yòng)杀(shā)疯了,AIGC或进入可控期,将洗牌科(kē)技(jì)行业?_黑料正能(néng)量

此外不论是ChatGPT还是AIGC,都离不开庞大算力支(zhī)持。在关注各(gè)类大模型的发展同时,更应该(gāi)关注(zhù)算力网(wǎng)络的建设。

算力网络正驱动AI产业发(fā)展(zhǎn)进(jìn)入史诗级(jí)加速(sù)进(jìn)程,让AIGC及通(tōng)用AI这(zhè)一人工智(zhì)能发展的终极目标离(lí)得更近。

因为算力可以对突破性技(jì)术创新提(tí)供(gōng)大力的支持。这方面,多模态(tài)大模(mó)型(xíng)是典型。作(zuò)为面(miàn)向未来(lái)强(qiáng)人工智能、通用人工智能的重要技术(shù)创新,多模态大模型已(yǐ)经(jīng)在(zài)人工智能领域提出了很多(duō)年,业界也有不少技术(shù)突(tū)破,但是,多模态大模型进一步往(wǎng)下(xià)走(zǒu),算力(lì)需求呈几(jǐ)何式上(shàng)升(shēng),一般的算力基础设施(shī)很快(kuài)将难以胜任(rèn)。

从图像、文字、语(yǔ)音单独一项的训练,到双(shuāng)模态(tài)、三(sān)模(mó)态的跃迁(qiān),让人工(gōng)智(zhì)能可以灵活应(yīng)对不同(tóng)模态的转化、像人(rén)与世界交互一样自然,这方面,由算力网络来驱动将(jiāng)有(yǒu)明显(xiǎn)优势。

ChatGPT之后又(yòu)一(yī)应用杀疯(fēng)了(le),AIGC或进(jìn)入可控期,将洗(xǐ)牌科技行业?_黑料正能量(liàng)

此(cǐ)外(wài),还(hái)有很多需要爆发式(shì)增长的算力来支撑(chēng)的技(jì)术创新,将在人(rén)工智能算力网(wǎng)络(luò)支撑下快(kuài)速推(tuī)进(jìn)。

AIGC已(yǐ)经露出曙光,期(qī)待在大模型和大算力的支持下AIGC能持续颠覆(fù)内容生产的方式(shì),将创造的边际成本(běn)降低,让万(wàn)众受(shòu)益。

未经允许不得转载:橘子百科-橘子都知道 武汉市有多少人口2023年,武汉市有多少人口2022总人数

评论

5+2=