感知生成式 AI。

AI 是啥

和很多朋友聊天的时候，我发现即使是很多软件行业从业者，对生成式 AI 的原理其实也几乎完全没有感知。人们一直都知道机器学习，神经网络这类词汇，但这玩意究竟如何工作，其实很难一言蔽之。

当前是 2023 年，实际上，虽然很多人把 2022 年作为 AI 元年，如今并不长的一段时间后，大模型的热度已经逐渐冷却，人们意识到大模型的局限，算力的匮乏，以及对应的落地场景竟然比想象中的少而困难，创业团队们也开始把风口逐渐的转向专精的小模型们，专精的场景。

但大模型终究还是出来了，也真的产生了不可估量的价值，但由于其运行原理的特殊性，竟然诞生出了 Prompt 工程师这样神奇的岗位。Prompt 工程师本质上就是比你更懂模型原理的人，用看起来啰嗦而反复的「咒语」，让愚笨的大模型吐（生成）出更精确的答案。

所以，我始终觉得，如何你希望更好的使用这些已经存在模型，你并不需要是 AI 行业的直接从业者，定性（区分于定量）的理解仍然可以很有用。

我个人推荐的路径大概是这样的，难度由难到简，其实符合很多知识的学习曲线，入个大门槛有点辛苦，但之后的路会特别开阔。

看图就知道，如果肝一点，甚至一天就可以学完这门课。而你只需要会一点点 Python 基础，就可以跟着做完一整套练习。

这门课让你用最浅显上手的方式，跨入机器学习的门槛，让你知道机器学习根本不是什么高深莫测的技术，不过是最简单的递归和算法形成的数学设计，是人类智慧的一点点系统性实现。

跨过这道门槛，图像，语音，自然语言识别到数据模型之间的转换，你就不会觉得多莫遥不可及了。

说白了，就是用最简单的现成的框架，去实现最简单的机器学习的场景。

这里推荐 Sklearn，这是最即开即用的 Python 封装，配合下面这张 CheatBook，初步的了解一下所有机器学习的模型，算法和对应的使用场景，也许脑子里就能够建立最完整的（虽然粗糙的）地图 MOC（Map of Content）。

我自己在生活里的入门的场景是两个：

项目1：基于监督学习的算法去计算股票价格的走势（当然不赚钱，但是不方案你练习必要的技能，和理解从显示生活的数据到模型数据的转换思路）

项目2：基于非监督学习的知识案例库建设：把历史上的上万生产事故单，用 NLP（自然语言处理）向量化以后，放入非监督学习的模型中，形成自动去重，具有基本语意检索能力的小模型。

由此，你就有了自己的实践经验，虽然里商用的工程化的实践经验仍然有 9999 年的距离，但不妨碍你可以定量的思考所有 AI 背后的原理，也更容易看懂相关的论文一些。毕竟大部分目前的 AI，也不过是算力，参数和数据量突破的某一个奇点以后，形成的所谓涌现。

学习，终究还是应该回到正途的。没有什么比看论文的学习效率更高了。

推荐已经存在的相关论文和知识点的大合集：

每次最后都要写个然后，其实也没有什么然后。

如果你对一个新的技术感兴趣，扎实一些的做法，还是把手弄脏一些，亲自下场摸一摸。

风口真不应该只是人们口里的风。