请大神来锐评ai应用和agent开发相关技术啊!第二弹! #ai #agent开发 #程序员 #编程 #锐评
✅ 已完成任务ID: 1194
30秒速读
核心摘要
本次内容锐评AI应用与Agent开发相关技术的学习必要性及掌握程度。
可执行建议
- 入门阶段优先吃透Transformer核心原理、常用设计模式,结合自身业务场景按需学习RAG技术
- 基础了解JVM问题排查方法、K8s基础操作,无需死磕冷门八股知识点
高价值评论洞察
- 覆盖零基础小白、在校生、转岗程序员三类受众,不同群体对AI/Agent开发的学习路径诉求差异明确
- 出现多个实战向补充观点和争议点,比如bash替代传统RAG、大模型上下文拉长后RAG必要性争议、小公司无需K8s的落地反馈,和视频内容形成互补
用户关注点
- 技术选型疑问:AI开发主流语言选Python还是Java、RAG和微调的性价比对比
- 学习适配性疑问:相关技术知识点是面向入行新人还是在职开发者、学完Agent开发的就业前景
- 落地实操疑问:情感类RAG的大数据量难题、零基础入门第一步该学什么
可复用选题/回应建议
- 产出分层学习指南,针对零基础、在校生、转岗程序员分别给出适配的Agent开发学习路径
- 做一期争议点答疑内容,回应上下文拉长后RAG价值、小公司部署要不要学K8s等用户关心的问题
代表性评论
- 用户梳理个人学习清单:设计模式要学、Transformer架构要了解、用bash替代传统RAG、K8s和Docker了解即可,获321赞,是资深从业者的实战经验总结,补充了视频未覆盖的轻量化落地方案
- Java后端转Agent项目到底做Java还是Python有无推荐,精准击中大量转岗程序员的核心痛点,受众覆盖广
标签与备注
标签
备注
暂无备注
转录文本
今天依旧是大神局,依旧是AI应用Agent的开发相关技术,依旧是瑞萍,我们是否应该学,以及学到什么程度? 第一个,NLP的基础,尤其是Transformer这个架构。 Transformer就是这一轮AI热潮的一个旗舰,基本上肯定是要了解Transformer是什么,注意力机制的原理是什么。 你面试的时候怎么吹,对吧?别人问你,你连这个机制都不知道,那你怎么去了解大模型的能力边界呢? 比如说我的上下文边界,为什么我的内容快打满,模型的上下文快打满的时候,大模型的幻觉就会增加呢?《Attention Is All You Need》那篇论文可以看一遍。 什么《Attention Is All You Need》?那下一个问题,设计模式你感觉还有必要学吗? 有的,有的。其实你在用Copilot之类的AI工具去编程的时候,你的思路应该是自顶向下的,设计模式也正好就是自顶向下的。 你跟AI聊的时候拆模块,以及这个东西该怎么做,思路上你要判断AI做的是否正确,那我觉得设计模式是非常重要的一个点,能让你的代码在未来的某个节点耦合没那么严重,具体效果就看你自己对设计模式的理解。 所以我个人觉得设计模式还是非常重要的,常用的你肯定得会。 但是我平常工作的时候,现在真的都不关心这些,我现在只要AI能给我写出来就行。 那确实是,你要是做一个小Demo,或者是你的用户量不大,其实也没有太大关系。但是如果你想要长久迭代某个项目,就比如说你可以去拉一下Keyhub,看那些每日全热度的项目,看他们的设计模式是怎么样的。现在其实有很多代码堆成了屎山,但是设计模式还是有助于改善这个情况的,代码堆到最后全是屎山。 哦,那下一个,RAG,就是向量数据库,又分词、又涉及各类相关处理的这部分内容。 当初提出这个思想,就是因为大模型没有办法去记忆一些特定领域的数据或者内容,它的上下文容量可能也不太够,所以才会有RAG这个东西出现。 你说它要不要学,那肯定是要学的,像我们做很多企业化的项目,RAG是必不可少的,因为每个企业都有自己的数据,可能都要去做一些分块切片、数据清洗的工作。 但是你说未来趋势,RAG这一套东西,是不是一定要先去做数据清洗,然后再过Embedding,再过Rerank,然后再取TopK之类的这一套流程,是不是还是朝这个方向去发展,很难说。 就是这一套东西非常重。包括像Claw Code的源码泄露之后,其实你可以看到他们用大量Agenting Reg的思路,就是他用很多batch的命令去替代传统的Reg思路,其实对模型的理解来说是更快更准的。可能还是要看业务场景,但是这一块还是很重要的,因为你聊项目的时候肯定会聊到你的Reg系统嘛,包括你怎么设计的,对吧?包括你的评测集是怎么做的。如果你要做更多垂类行业相关的一些项目的话,Reg还是很有必要深入把它吃透的。 比如说我要做一个金融行业的数据库,我要去检索那个数据召回率准不准,对吧?然后我要去怎么做这个召回,怎么做数据的清洗。比如说我要去做一个汽车销售的客服的系统,我的客服要怎么回答得更加准确。对,就这一类东西还是需要上比较重的,因为我数据量比较大的话。但是如果你数据量很小的话,没有必要,有很多轻量化的方案嘛。就比如说有一个叫LightReg的东西,还有很多,还有人直接像Claw Code的源码那样直接用mini查,这些挺快的。就是可能这个技术 远行还是要根据实际的场景来做区分的,Java虚拟机相关的知识,还是有必要去了解的。如果真的碰到线上的事故,很多时候问题都是由内存泄漏引起的,JVM相关的参数可能要去做调整。如果碰到一些高并发的场景,我们还是要去看JVM的一些日志去排查的。 对,包括你要怎么去调试,这个肯定都是要知道的。其实坦白来说,换做是我我也不太懂对吧,我就直接问AI,但是你也要知道该怎么做,就是那些AI,它跟你说的话,你大概都能懂是什么意思。对对对,我感觉如果你是要入门的话,到这一步差不多。 我现在就有一个问题啊,就是学这个Java虚拟机,你一般都是怎么学?就像我的话,可能看个视频背背八股文,坦白的讲,我的重点没有在Java上,而且我其实被别人问到最多的也就是什么垃圾回收器,然后全是八股文。 确实,然后最后就排查一下内存泄漏,还有那几个火焰图之类的。 最后一个啊,就是k8s的踩坑,还有大模型部署之类的内容,这个其实是一个新的方向吧。就是如果你看招聘信息的话,像阿里云,或者硅谷就有很多这类岗位,叫推理部署工程师,他们会去到客户那里部署自己的模型和服务,然后呢。 就会需要去搭建很多K8s的集群,然后踩坑的一些内容,他们就需要对这些东西非常精通了,包括怎么把一个虚拟机的集群搭起来,还帮我商议决定要怎么配置。但是对于普通程序员来说,也是需要去了解的,90%的公司的服务都是跑在K8s上的,对吧?然后你要知道它的隔离级别是什么,如果你的服务遭到网络攻击了,你的K8s哪个版本有什么漏洞,什么提权的漏洞,那你怎么解决?虽然说大公司有运维去帮你审查,但是小公司可能就得靠你自己了,这些内容还是要了解的。而且其实你会K8s、会Docker,可玩性很高,你可以部署很多服务,又不影响自己电脑的配置。以后你要了解很多的源码,你可以直接用Docker跑起来,也很方便。或者说你自己想写小玩意,对吧?你前后端让AI去写个Docker的样例文件,然后Docker直接跑起来,就很方便了,对吧?行,那今天就先问这么多,咱们以后再问。