完蛋!我被“AI”包围了!
众所周知,我是一个什锦区的AI博主,每天都在各种AI领域之间反复横跳,然后努力的分享一些很酷的AI干货。
但是每天也都被各种朋友问:“大佬,有没有能XXX的AI工具?大佬,这个东西是什么XXXAI做的?大佬,我能请教一下XXX不”
我真怕啥时候给我来一句:“大佬,你能用AI给我生个猴子🐒不”
…
所以,这篇文章,我想好好盘点一下从ChatGPT出现到现在,真正实用且主流的AI工具。
包含大语言模型、AI PPT、AI 绘图、AI音频、AI数字人、AI视频这6个部分。
这近半年我作为AI什锦区博主的高强度的输出,做这种盘点,应该还算是有点说服力的对吧。
所以你们想要最全最实用的AI工具大全,真的看我这一篇,就够了。
我选出来17个,基本上涵盖了我自己也是99%以上的AI工具使用时间,全文也不含任何广告,放心食用吧。
大语言模型
Top1. ChatGPT
https://chat.openai.com/
整个AI行业无可争议的No.1,现在估值都翻到600亿美刀了。引领整个行业变革的大哥,无需多言,我自己绝大多数时间都是在用GPT去处理各种东西。目前支持多模态(识别图片),传文件,写代码,跑程序,画图片。马上又可以原生的支持ChatPDF了,更能将各类工具混合在一起形成AI Tools,这是真的通用AGI的雏形了。
教程我也写了太多太多,在我公众号里搜索ChatGPT就能看到。但是我还是想放两篇天天被问的最多的教程∶
(PS∶虽然都是几个月前写的,但是至今也没失效!刚刚亲测,能用)
Top2. Claude
https://claude.ai/
AI大语言模型领域的万年老二,我已经用的很少了,但是他支持100K的超长文本输入还是目前独一档,很多超长的会议纪要、论文等等,我还是会用Claude来去做整理和总结的。
Top3. 智谱清言
https://chatglm.cn/
国产替代。很多人其实因为种种原因,比如单位、网络限制,魔法限制等等,只能用国产,那还是推荐智谱清言,我心中的国产大模型No.1,基本上就是ChatGPT的国产平替,多模态写代码画图什么都有,而且效果都不错,毕竟大名鼎鼎的ChatGLM在国际上还是有很强的影响力的。
AI PPT
Top1. MotionGo
https://motion.yoo-ai.com/
大家经常问我的另一个问题就是,大佬,做PPT有什么AI工具?MotionGo还是可以的,毕竟大部分的PPT都是演示,再做PPT之前基本上都会有一个脑图或者文档(不要说你没有。。。),MotionGo支持传word、txt、Xmind之类的直接生成PPT,这点还是很香的。
AI 绘图
Top1. Midjourney
https://midjourney.com/
目前AI绘图领域综合效果最好、审美最强、最适合小白的产品,大部分直出的图都可以直接拿来用,直接集成在了Discord里,操作傻瓜,目前也在急速迭代中,正在All in 3D。
Top2. Stable Diffusion
AI绘图的奠基者之一,生态的起点。虽然本身的模型质量和审美都挺拉的,但是架不住它是开源的。百万级别的开发者和艺术家,基于源SD1.5模型,微调并训练了无数的优质模型。不仅如此,还有无数的插件应运而生,比如鼎鼎大名的ControlNET、AnimateDiff、Defourm等等。超强的自定义特征也使他最容易嵌入工作流中,上限极高。
对着公众号私信”SD”,就有秋叶大佬的SD整合包链接了,可以直接下载,同时再附上我写过的几期模型推荐:
AI绘图StableDiffusion最强大模型盘点 – 诸神乱战
AI绘图StableDiffusion最棒LoRA模型盘点 – 小样也能出奇迹
Top3. Dalle3
OpenAI出的AI绘图,集成在了ChatGPT上,NewBing也可以白嫖。拥有目前最强的语义理解能力,很多很复杂的画面,MJ画不了,SD可以靠草图勉强实现,但是Dalle3可以靠提示词硬生生画出来,语义理解目前碾压式的领先。同时可以支持在画面上生成文字,除了审美差一点画风少一点,其他几乎无短板。
Top4. Clipdrop
https://clipdrop.co/
Stable Diffusion母公司Stability出的应用,集成了很多有趣的AI功能,包括去人去物体、增强、扣背景、重新打灯等等,方便快捷。很久之前也写过一篇文章介绍过:
AI 音频
Top1. 11Labs
https://elevenlabs.io/
目前我认为在TTS(文字转音频)这个领域,当之无愧的“最强”AI音频。仅需30秒到5分钟左右的极少的数据集,就可以直接克隆任何一个人的声音,完美复刻他的说话方式、他的音色,甚至连他的情绪都复刻过来。之前我也写过文章介绍过:
仅需30秒完美复刻任何人的声音 – 最强AI音频11Labs
Top2. So-Vits-SVC
SVC,你就把它简单的理解成一个特定人物声音的变成器,你自己先录一段音频,然后把这个音频扔给AI,AI就自动产出另一个人声音的音频了。目前最主流效果最好的就是这个 So-Vits-SVC了。对着公众号私信”S”,就有羽毛大佬做的这个项目的本地整合包。我也写过两篇教程(分别是4.0和4.1版本)介绍过:
Top3. Stable Audio
https://stableaudio.com/generate
同样是Stable Diffusion母公司Stability出的AI音乐应用,目前在所有AI音乐生成里面质量最高,但是同时上手难度也挺大,毕竟那些乐理、乐器的专业名词真的很难写…
AI 数字人
Top1. Heygen
https://app.heygen.com/
作为最近最炙手可热的AI热门应用,Heygen用霉霉讲中文、郭德纲讲音域之类的视频出尽了风头。提供了照片驱动(直接让照片动起来说话)、数字人训练(上传5分钟的视频)、一键翻译视频等等。目前最全能的AI数字人六边形战士,除了贵(1个月最低29美刀15分钟),什么都好。
偷偷说一句,Heygen的声音技术是由11Labs提供的。
Top2. 奇妙元
https://www.weta365.com/
AI照片驱动的国产替代,在照片驱动领域跟Heygen不相上下,我用的也非常多,之前我视频号的几个乔布斯、特朗普、巴菲特的视频就是用11Labs+奇妙元做的:
Top3. 商汤如影
http://senseavatar.sensetime.com/
国内定制数字人领域的王者,毕竟商汤就是做人像出身,在数字人定制这块是Top级的,很多需要直播的群友在体验了市面上一些数字人产品后,甚至给我反向安利商汤如影…目前支持PC和APP端。
AI 视频
Top1. Runway
https://app.runwayml.com/
AI视频领域的王者,前几天生成模型Gen2更新以后,画质和稳定性大幅提升,配合MJ效果直逼电影级画质。而且Runway是一个综合站,不仅可以生成视频,还可以视频抠像、删背景、运动追踪啥都行。。我之前也用Runway做了两个作品:
Top2. PIKA
https://www.pika.art/
同样是AI视频领域的佼佼者,Runway的竞品,但是只专注于AI视频生成,集成进了Discord里,对语义理解很好,你的文字prompt真的是会起作用的,不像RunwayGen2油盐不进,但是目前画质跟RunwayGen2相比还是差了一个世代,等他们更新2.0版本。不过优点嘛,就是免费。
如果你跟我一样成为PIKA的超级合作者的话,生成的视频也没水印,还有专线嘿嘿…
Top3. Topaz Viedo AI
目前视频画质增强、修复的最强AI。在超分领域属实万金油。软件我也整合好了,对着我公众号私信”T”就有下载链接了。后面我也会写一篇Topaz Vide AI的教程和参数选用,敬请期待~
写在最后
以上就是我选出来的大语言模型、AI PPT、AI 绘图、AI音频、AI数字人、AI视频这6个部分的17个应用。
当然还有很多或新或旧的其他的应用,比如做动捕的WonderStudio、做3D的Luma AI、AI视频领域的两个新秀Genmo和Moonvalley、SD上现在很火的AI视频框架AnimateDiff、照片驱动D-ID、PPT的Gamma等等等等。太多太多了。
但是我觉得或多或少泛用性都有点问题,要么打不过上面的这17个,要么应用领域太窄,要么上手门槛太高,对普通AI玩家意义不是很大。
上面这17个,足够支撑你在现在的AI时代,混的风生水起了。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,并给我个星标⭐~感恩。