对于AI行业的发展,认知空白的填补是一件花费很大精力、周期很长的一件事情,好在这件事情你可以当作一个习惯慢慢培养,不断地与未来的自己握手,回看当下,每一步的认知认知填补都是如此地沁人心脾。

自身基础能力的掌握-对自己有一个明确定位
有无资金体量-自己的发展方向-公司深耕/自主创业
AI时代的刚需的AI岗位有哪些,对业务能力和思维考量的要求是怎样的?要拿到月薪1万以上的offer,需要具备怎样的能力,包括业务能力、项目策划、行业视野等多角度?

第一部分:国外“杀手级”工具深度剖析与落地场景

工具本身没有价值,工具带来的“杠杆率”商业闭环才有价值。

1.cursor-基于VS Code改造的Ai代码编辑器

集成了GPT-4/Claude 3.5 Sonnet等多个AI大模型(cursor-基于VScode改造的AI IDE,AI+产品,AI赋能的工具)

应用场景:早期产品原型验证(MVP,即Minimum viable product 最小可行性产品)开发、老旧屎山代码的重构、写单元测试。
解决的实际需求:极大地降低了试错成本。以前需要5人开发组干2周的活,现在只需要1个(only one)资深程序员带Cursor 3天搞定。它解决的不是“写代码”这个问题,而是“通过代码快速验证商业模式”的速度问题。

深度点评:如果你还在找人来写增删改产(CRUD)的业务代码,你在烧钱。Cursor让我们能将昂贵的工程师精力释放到架构设计和核心算法上。


2. claude(Anthropic,OpenAI最大的竞争对手,企业级“大脑”)

Anthropic公司旗下的AI大模型,公司创始人为前OpenAI公司的人

应用场景:复杂的合同审核、几百页的行业研报分析提炼、需要高上下文逻辑的代码库理解。
解决的实际需求:信息不对称的消除。相较于chatgpt而言,Claude懂得幻觉相对较少,逻辑更清晰。

深度点评:它是目前很多投行、律所和高智密度企业首选的Copilot。对于我们,它是用来做“高层决策辅助”的,而不是用来写营销文案的。

(不同的AI大模型产品专注的业务场景不同,故而每个产品的强项不同,例如“用豆包玩抖音梗”可能就比”用腾讯元宝玩抖音梗“更有梗。)


3. ChatGPT(OpenAI):通用的“万能瑞士军刀”

AI行业上的标杆,齐全的生态

应用场景:客服智能问答、营销文案的头脑风暴、多语言翻译、日常办公自动化。
解决的实际需求:基础人力成本的替代。以前需要一个庞大的运营团队回复用户咨询、写推广软文,而现在只需要chatgpt加一套RAG(检索增强生成)系统(嵌入专业知识库),就能干80%以上的活。

深度点评:AI行业的基座。如果不知道用什么,先用TA。它的生态插件最丰富,能串联起飞书/钉钉/邮箱,形成自动化工作流。

附:飞书-字节跳动公司,如果你不了解字节跳动,你肯定知道抖音、豆包,都是它家旗下的产品。

钉钉-阿里巴巴公司,毫无疑问的是,淘宝、通义千问、阿里巴巴货源平台这些想必都是了解的,哪怕不知道,那年初的“千问免费喝奶茶”的活动你肯定错过了,不过现在也不晚,现在用手机上的千问APP点外卖仍然有福利。

邮箱,比如Gmail邮箱(Google公司-自己旗下也出了AI大模型,Gemini),QQ邮箱,网易邮箱等等。】

不同的AI大模型产品专注的业务场景不同,故而每个产品的强项不同。

例如“用豆包玩抖音梗”可能就比”用腾讯元宝玩抖音梗“更有梗。


4. Stable Diffusion(SD):可控的“视觉工厂”

它是什么:开源的文生图模型,部署在本地,高度可定制。

应用场景:电商模特图换脸(不用请真模特,节省成本开销)、游戏资产生成(批量生成贴图、背景,当前影视制作、数字资产,如漫画2D人物建模、数字藏品等)、Logo设计迭代。
解决的实际需求:视觉生产力的规模化与版权私有化。Midjourney虽然画得好,但不可控且版权归属不明。SD配合ControlNet,可以精准控制人物的姿势、构图,这对商业落地至关重要。We don't need “艺术”,what we want is “精准的工业级素材”。(解决实际的需求,如网络上的AI短剧,部分是用AI工具生成的图片-视频,人物建模也是。)

深度点评:电商和游戏行业如果不拥抱SD,就是在浪费预算。它把一张图的边际成本降到了接近零。


5. Something want to talk with sb.

真正的趋势:端侧AI(Edge AI)/小型化模型

应用场景:手机端运行的修图、离线语音助手、隐私要求极高的数据本地处理。
解决的实际需求:隐私与速度。把数据传给GPT有泄露风险,而且有网络延迟。未来的趋势是把大模型蒸馏成小模型,直接跑在你的笔记本电脑甚至手机里。

深度点评:“最后一公里”的隐私触达。大厂在云端(Cloud),小机会在边缘(Edge)。


第二部分:国内外AI工具对比

个人觉得这是需要重点认知的部分。很多人觉得国内的AI不行,或者觉得只要套个壳就是AI。那真实的对比情况是怎样的呢?实践是检验真理的唯一标准!

维度 国外AI (US-based) 国内AI (China-based)
核心能力 强在逻辑推理、原创造力。GPT-4和Claude 3.5在处理复杂任务时,依然领先。 强在中文语境理解、应用层落地。中文成语、梗、政策文件的解读,国内模型更懂。
代表性工具 ChatGPT, Claude, Midjourney, Cursor, Notion AI 文心一言、通义千问、Kimi(月之暗面)、豆包、Coze(扣子)
落地侧重 工具属性强。他们更喜欢做生产力工具(如Cursor, Midjourney),让个人变强。 社交/平台属性强。国内更喜欢把AI嵌入到IM(如钉钉、微信)或内容分发平台里。
企业级应用 API生态成熟,适合做底层构建,但数据出海有合规风险。 私有化部署能力强。国内厂商更愿意派驻实施团队帮你把模型部署在你的内网,解决大企业的“安全焦虑”。
价格战 较贵,按Token收费,价格相对稳定。

极度内卷。阿里、百度、字节几乎是在“送”模型。国内企业用AI的调用成本极低。

深度总结(认知升级)

1. 不要迷信“最强模型”,要迷信“最适合的模型”。

180小帅很好,但175的顶帅也是香饽饽。

举个例子,如果你是做跨境电商的,用CHATGPT写英文邮件,用Midjourney做海报。

倘若,你是做国内政务或国企项目,可以用国内的文心一言(百度)、通义千问(阿里)、腾讯元宝(腾讯-投资公司)、豆包、deepseek(字节)、kimi(月之暗面)、智谱轻言(清华研究团队)等等国产大模型,并且要私有化部署。这时候“好用”不重要,“合规”和“数据不出域”才是命门。

2. 应用层的机会在国内。

国外像        Cursor这种改变工作流的工具很厉害,但国内像Coze(扣子)这种零代码搭建AI Bot的平台也非常火。国内有庞大的客服、运营、销售需求,用Coze或Dify(工作流搭建,早期是做搭建RAG的chatbot)这种工具快速搭建一个“销售数字分身”,落地变现的速度比国外还快。

3. 真正的壁垒不是工具,是“数据+工作流”

正如,ChatGPT谁都能用,凭什么有人就能赚到钱?
清洗好的行业数据(投喂给AI,让它变成专家),SOP化的业务流程(如把AI嵌入到审计、设计、代码的每一个环节)。【SOP,即standard operation procedure,标准操作程序/规范】


第三部分:给我的建议

如果想在AI行业填补认知并寻找机会,不要试图去做一个更好的"ChatGPT"或者"Midjourney",那是巨头的游戏,资金量级、试错成本、研发周期、技术迭代等等。

我应该关注这几个方向:

1. 垂直行业的Agent(智能体):比如专门做“跨境电商法律咨询”的Agent,或者专门做“中医辅助开方”的Agent。用Claude或GPT的底座,挂在私有的专业知识库,匹配自己的业务能力,放大自己的能力。正如常说的,自媒体是流量杠杆,现如今的AI工具是能力放大杠杆。

2. 利用信息查做出海服务:国外的AI工具生态非常发达,但很多国内中小企业不懂怎么用Cursor、怎么用Make.com做自动化。做一个“工具使用指南”或“代部署服务”也是一种生意。

(当下较火的token出海,本质是国内外的能源问题,电力成本国内几毛钱的电力可以有的几百万token,对等到国外可能需要的电力成本就更高了。国内目前的电力资源比起美国更为庞大。暂不考虑token的同等使用场景下的产出效果。)

3. 电商与营销内容的自动化工厂:利用stable Diffusion批量生成素材,配合Kimi生成长文案,实现“一键生成1k条小红书/抖音内容并自动分发”。(kimi在Ai一键生成PPT上比较火,可能对于图像处理的产出效果会更好)


最后的警戒-于己而言

AI不是来替代你的,它是来替代那些“不用AI的人”。

每一次革命都伴随着一次同样的底层逻辑,增量-存量博弈/技术革命-新一轮增量,不同视角下的辩证看待时代发展。AI会淘汰很多很多的岗位,同时也会出现很多新岗位。未来,AI、机器人、脑机接口都会出现,未来的路很长,你要坚定地、健康地、顺其自然地走下去,回头看,这不再是一次“落花有意随流水,流水无意恋落花”的场景。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐