首页 > 技术 > AI/人工智能

一文讲透Ai热门概念,消除Ai焦虑! | ai感念

人阅读 2023-11-09 06:32:03

【一文讲透Ai热门概念,消除Ai焦虑! | ai感念】lot物联网小编为你整理了的相关内容,希望能为你解答。

今年初,随着GPT-4和文心一言相继面世,我们也迎来了人工智能元年。

如今国内遍地都是各种AI学习课程、社群,每天网络上不断刷新关于AI的讨论。

有人跟风讨论,也有人嗤之以鼻,但更多人,还处于对AI一知半解的阶段,面对每天轮番轰炸的国内外信息,无法辨别真伪,也无法知晓全貌。

作为一个AI深度使用者,今天我给大家简明扼要、通俗易懂地把目前AI领域的一些热门名词、概念解释清楚,并且也揭露这些概念背后的猫腻以及生意。

数字人OpenAIChatGPT3.5ChatGPT-4百度飞桨文心一言文心一格Ai绘画Stable Diffusionmidjourneyprompt

01 数字人

最近数字人概念炒的很火,但是这并不是什么新技术,并且早在2-3年前就非常成熟了。可是有没有想过为什么现在还没普及?因为成本!

目前炒得比较火的是所谓的数字人直播,其基础原理并不复杂,说白了就是提前制作好一段数字人的视频,然后在直播间循环播放形式。而所谓的24小时直播,就是1小时的视频变着法循环24次,那你说为什么不能直接做一个24小时数字人视频呢?当然可以,但是我给你们透个底,所谓的数字人视频生成,一分钟行业报价在XX元区间(不砸行业饭碗,价格用XX替代),假设1分钟20元,一天 1440 分钟,成本差不多3万,你觉得你卖的货能回本吗?

而且真正懂直播运营的人应该知道,直播间最怕的就是封播,你一个视频24小时循环播放,你觉得平台会坐着看你破坏平台生态?

而且数字人直播的互动和表情较为生硬,声音不真实(当然你可以用声音克隆来解决),影响观看体验和转化。此外,它无法解决信任问题,所以不必担心数字人取代主播,更不用担心数字人会让谁谁谁下岗。

当然,这并不代表我否认数字人,因为我自己以及在给客户提供的数智营销解决方案里就有这块的内容,作为矩阵流量的信息分发,数字人是有一定优势的。

懂得底层逻辑,搭好营销框架,和其他技术和运营做好嫁接,然后再去使用数字人,才能真正利用它、用好它,而不是被黑科技噱头所诱惑。

02 OpenAI

ChatGPT之母——OpenAI公司,由一些最知名的科技领袖于2015年共同创立:Elon Musk(据称已退出)、Sam Altman、Greg Brockman等。最初是一家非营利性研究机构,目标是通过开发和推广AI技术来促进人工智能的安全和发展,后转型为营利公司,与谷歌、微软、亚马逊、Facebook等公司有密切合作关系。

OpenAI在人工智能领域取得了一系列重要突破,尤其是在自然语言处理(NLP)方面。其主要成果之一就是在全球大火的GPT系列模型,从GPT、GPT-2、GPT-3到GPT-4。这些模型展示了强大的语言生成能力,可以用于聊天机器人、内容创作、翻译、问答系统等多种应用场景。

除了GPT系列模型,OpenAI还成功研发了DALL-E(用于生成图像)、CLIP(用于图像识别和生成)以及Codex(用于代码生成和程序理解)等其他创新技术。

最近OpenAI 投资了一家人形机器人公司1X technologies,不仅是资金支持,ChatGPT这样的大型语言模型也会加持机器人产品的开发进程。

03 ChatGPT3.5和GPT-4的区别

ChatGPT3.5是一个自然语言处理模型,它通过使用大量的训练数据来模拟人类的语言行为,可以根据上下文和语境提供回答,像人类一样聊天交流,完成撰写脚本、文案、翻译、代码等任务。

而最新迭代的GPT-4升级为多模态模型,具有5000亿参数,远超GPT-3.5的1750亿参数,能理解多种形式的信息,具备图文识别能力,文字输入限制和记忆大幅提升,确保了更高的准确度和逻辑性,被认为是目前最强的AI。

●ChatGPT3.5可以通过免费注册账号获得,如果要使用ChatGPT-4,就必须在ChatGPT的账号上进行升级,目前是20一个月。

●从使用者角度说,ChatGPT-4拥有更好的生成能力,可以处理非常复杂的逻辑提问,较ChatGPT3.5提升非常多,但GPT4版本比3.5处理速度要慢,并且设定了每3小时25次提问的上限。

04 百度飞桨

飞桨是百度开发的开源深度学习平台,于2016年正式宣布开源,支持多种硬件环境,包括CPU、GPU和ASIC,具有良好的扩展性和并行计算能力,可以广泛应用于计算机视觉、自然语言处理、语音识别、推荐系统等领域。

文心大模型是飞桨重要的基础模型库,也是“文心”系列产品的基础模型。主要面向开发者,一般人暂时用不到。

05 文心一言

百度对标ChatGPT推出的知识增强大语言模型、生成式AI产品,也具备多模态生成能力,咱们自己的国产AI。

虽然在编程、算力和应用生态方面文心一言确实不如GPT-4,不过目前 GPT-4 尚未开放图像生成外部测试,而基于文心一格,文心一言已经具备了图像生成能力。但生成还处于“轻度智障”水平,之前有一些网友输出特定关键词测试,发现文心一言在生成图片时,疑似先把中文转化成英文,然后AI会根据英文语意生成对应的画面,不过这个问题在后续被修复。

此外,我在使用文心一言的时候,发现其在演绎推理、逻辑推理等领域表现略逊于GPT系列模型,并且通过“搜索引擎”做了生成弥补,这和ChatGPT无需通过搜索即可生成答案的技术有较大差异。

06 AI绘画

AI绘画并不是什么新技术,前几年就有了,只是在ChatGPT带动的Ai热潮下,再次被推向了前台。

AI绘画原来用的是对抗生成网络(GANs),GANs包括两个相互竞争的神经网络:生成器和判别器。生成器负责创建新的图像,而判别器负责评估生成的图像与真实图像之间的相似程度。在训练过程中,这两个网络不断地相互竞争,提高生成图像的质量。最终,生成器可以创作出逼真且具有艺术价值的作品。

2020年后,AI绘画的算法升级成了扩散模型(diffusion model),生成的图像质量高了许多,当下的主流AI绘画工具都是运用这个模型搭建的。

目前大家朋友圈和社群讨论最多的AI绘画,主要是Stable Diffusion和Midjourney。

07 Stable Diffusion

Stable Diffusion是一款由Stability AI开发的文本到图像的神经网络模型。简单来说,Stable Diffusion能够将一段描述性文本转化为一幅生动的图片。现在朋友圈流传的各种以假乱真的早期美女图,基本都是出于SD里LORA模型的训练。

Stable Diffusion在应用上的优点包括快速生成高质量的图像,只要给的参数恰当,可以生成和摄影照片匹敌的真实感图片。

然而,SD对机器的性能要求很高,这对普通人是一个巨大的门槛,并且参数指令(prompt)只接受英文,国人在使用的时候一般会借助翻译工具来实现指令录入,中西方语意理解上的偏差会是一个不小的障碍。

要下载Stable Diffusion,请访问Hugging Face官网(https://huggingface.co/)并搜索“Stable Diffusion”。

对于初学者,推荐使用预训练版本。安装方面,你可以参考Hugging Face上的文档,按照教程逐步完成安装(https://huggingface.co/transformers/installation.html)。

Stable Diffusion 训练图

08 Midjourney

Midjourney和Stable Diffusion是目前最热门的AI绘画软件,它们都能够通过输入文本生成惊艳的AI图像。Midjourney是一个在线服务,相较于可以本地部署的Stable Diffusion,只能在互联网上使用且需要付费。

● 门槛上,Midjourney属于共享服务器频道作图,需科学上网且收费(有25张免费体验限制,不过最新消息,由于中国用户大量的免费测试,MJ创始人今天发推暂时关闭了免费体验权限)。而Stable Diffusion需要本地安装部署,对显卡要求较高(N卡,8g显存入门)。付费版目前30/月的标准版性价比较好。

● 玩法方面,Midjourney通过大量学习和训练图像特征与风格,生成多风格作品,适合提供创作灵感来源。Stable Diffusion则通过大规模模型迭代图像,生成高质量图像,可更精确地生成自己想要的图像内容并调整。

● 优劣势上,Midjourney适合全行业艺术工作者,上手方便,提供灵感素材来源,但无法细节微调,商用性值得商榷。Stable Diffusion适合项目制艺术工作者协作,提高效率,但有一定学习成本。

总体来说,Midjourney操作效率较高,Stable Diffusion时间成本较高但可玩性更高。

想体验AI生成可尝试Stable Diffusion,追求效率可选择Midjourney。作为插画师,可以先用Midjourney获得灵感和风格,再用Stable Diffusion高效完成作品。

09 文心一格

百度依托飞桨、文心大模型的技术创新于2022年推出的首款“AI作画”产品,文心一言的“好姐妹”。

输入文字,选择作画风格(国风、油画、水彩、水粉、动漫、写实),文心一格就可以根据数据模型快速做出一幅画。

如果你不知道如何更好地描述图片,还可以使用“联想”功能,平台将会给推荐可能满足你的图片描述,同时文心一格还支持上传参考图功能。

如前所述,不少网友发现文心一格似乎对某些成语的理解还十分不到位,被网友怀疑是采用了英文标注的开源图片素材进行训练,因此需要中翻英来当prompt(提示词)。

百度对此作出了回应,表示完全自研模型,训练中使用的是全球互联网公开数据,会快速调优迭代。根据之后网友的测试,确实进行了优化。

不过可以预见的是,在很长一段时间内,“不完美”仍然还会是百度AI的关键词。

10 prompt

无论是与ChatGPT对话,还是用Stable diffusion作画,提示词(prompt)都是得到准确结果的关键。

prompts就像AI的驯“兽”师,不会使用prompt,AI对你来说,可能就是一个说车轱辘话的智障对话框。而学会prompt,就能引导AI真正发挥它的超强算力,生成水平极高的内容,真正让AI为我们所用。

以前需要编程语言,现在通过prompt就可以实现,大大降低了人类创造和AI之间的门槛。

写了那么多基础的热门Ai科普,无非是想让大家正确的了解AI,正确地使用AI,将AI应用到我们工作、学习场景,提高效率,而不是被朋友圈和媒体渲染的各种AI黑科技淹没,形成所谓的AI焦虑和恐慌。

作者 | 甄妙 Ai-Prompt Engineer,话题营销专家,Ai指令研究院(AICRI)院长. 「超级数智营销、超级话题营销」理论开创者。

以上内容为【一文讲透Ai热门概念,消除Ai焦虑! | ai感念】的相关内容,更多相关内容关注lot物联网。

LOT物联网

iot产品 iot技术 iot应用 iot工程

Powered By LOT物联网  闽ICP备2024036174号-1

联系邮箱:support1012@126.com