如何学习人工智能？

学习人工智能就像走进一座巨大的图书馆，每本书都在喊着“从这里开始”。一半的书架上都写着“数学”，这……有点儿不礼貌😅

好处在于：你不需要了解所有事情就能创造出有用的东西。你需要一条合理的路径、一些可靠的资源，以及愿意经历一段时间的困惑（困惑基本上是入门的门槛）。

您可能还想阅读以下文章：

🔗 人工智能如何检测异常情况？
阐述了利用机器学习和统计学进行异常检测的方法。

🔗 为什么人工智能对社会有害
探讨人工智能的伦理、社会和经济风险。

🔗 人工智能用水量是多少？
分析人工智能的能源消耗和隐性用水影响。

🔗 什么是人工智能数据集
定义数据集、标签及其在人工智能训练中的作用。

“人工智能”在日常生活中究竟意味着什么🤷♀️

人们提到“人工智能”时，可能指的是几种不同的东西：

机器学习（ML） ——模型从数据中学习模式，并将输入映射到输出（例如，垃圾邮件检测、价格预测）。[1]
深度学习（DL） ——机器学习的一个子集，它使用大规模神经网络（视觉、语音、大型语言模型）。[2]
生成式人工智能——能够生成文本、图像、代码、音频的模型（聊天机器人、副驾驶、内容工具）。[2]
强化学习——通过尝试和奖励进行学习（游戏智能体、机器人学）。[1]

你不必一开始就做出完美的选择。但不要把人工智能当成博物馆。它更像厨房——边做边学。有时候你会把面包烤焦。🍞🔥

一个小故事：一个小团队开发了一个“很棒”的客户流失模型……直到他们发现训练集和测试集里有相同的ID。典型的泄露。一个简单的管道加上清晰的数据拆分，就把可疑的0.99变成了一个可信的（更低的！）分数，并且模型也真正具备了泛化能力。[3]

好的“如何学习人工智能”计划应该具备哪些要素？✅

一个好的计划有一些听起来很枯燥的特点，但却能为你节省数月时间：

边做边学（早期做小项目，后期做大项目）。
先学习最基本的数学知识，然后再深入学习。
解释一下你做了什么（用橡皮鸭擦拭你的工作；这可以纠正思维混乱）。
一段时间内坚持使用一个“核心技术栈” （Python + Jupyter + scikit-learn → 然后是 PyTorch）。
衡量进展应以产出为准，而不是以观看时长为准。

如果你的计划只有视频和笔记，那就好比试图通过阅读有关水的知识来学习游泳一样。

（现在）选好你的路——三条常见路线🚦

你可以通过不同的“方式”学习人工智能。以下三种方式行之有效：

1）实用型建造者路线🛠️

如果您想要快速取得成果并获得动力，这是最佳选择。
重点：数据集、训练模型、发布演示。
入门资源：谷歌机器学习速成课程、Kaggle Learn、fast.ai（链接见下方“参考资料和资源”）。

2）先掌握基本功的方法📚

如果你喜欢清晰易懂的理论，这门课最适合你。
重点：回归、偏差-方差、概率思维、优化。
参考教材：斯坦福大学 CS229 课程资料、麻省理工学院深度学习导论。[1][2]

3）人工智能应用开发者路线✨

如果您想构建助手、搜索、工作流以及其他类似“代理”的功能，那么这款产品是您的最佳选择。
重点在于：提示、检索、评估、工具使用、安全基础知识和部署。
需要重点关注的文档：平台文档（API）、HF 课程（工具）。

你可以稍后再换车道。起步才是最难的。

对比表格——最佳学习方法（附带真实小瑕疵）📋

工具/课程	观众	价格	它为何有效（简述）
谷歌机器学习速成课程	初学者	自由的	视觉辅助+动手实践；避免过于复杂
Kaggle Learn（机器学习入门+中级）	喜欢练习的初学者	自由的	简短精炼的课程 + 即时练习
fast.ai 实用深度学习	懂一些编程的建筑师	自由的	你很早就开始训练真正的模型——就像，马上就开始😅
深度学习.人工智能机器学习专业化	结构化学习者	有薪酬的	清晰地阐述机器学习核心概念
DeepLearning.AI 深度学习规范	机器学习基础知识已掌握	有薪酬的	对神经网络和工作流程有深入的理解
斯坦福 CS229 笔记	理论驱动	自由的	严肃的基本原理（“为什么这种方法有效”）
scikit-learn 用户指南	机器学习从业者	自由的	表格/基线的经典工具包
PyTorch教程	深度学习构建器	自由的	从张量到训练循环的清晰路径[4]
拥抱脸 LLM 课程	NLP + LLM 构建者	自由的	实用LLM工作流程+生态系统工具
NIST人工智能风险管理框架	任何部署人工智能的人	自由的	简单易用的风险/治理框架[5]

补充说明：网上“价格”的概念很奇怪。有些东西是免费的，但却要花费注意力……而注意力有时反而更糟糕。

你真正需要的核心技能组合（以及学习顺序）🧩

如果你的目标是“如何在不被人工智能淹没的情况下学习它”，请按照以下步骤进行：

Python基础知识

函数、列表/字典、轻量级类、读取文件。
必须养成的习惯：写一些小剧本，而不仅仅是记笔记。

数据处理

NumPy 式的思维方式、pandas 的基础知识、绘图。
你得在这里待很长时间。这份工作并不光鲜亮丽，但这就是工作内容。

经典机器学习（被低估的超级大国）

训练/测试集划分、泄漏、过拟合。
线性/逻辑回归、决策树、随机森林、梯度提升。
评价指标：准确率、精确率/召回率、ROC曲线下面积、平均绝对误差/均方根误差——要知道何时使用哪个指标才有意义。[3]

深度学习

张量、梯度/反向传播（概念上）、训练循环。
CNN 用于图像处理，Transformer 用于文本处理（最终）。
掌握一些 PyTorch 的基础知识非常重要。[4]

生成式人工智能 + LLM 工作流程

分词、嵌入、检索增强生成、评估。
微调与提示（以及何时两者都不需要）。

您可以按照以下步骤操作🗺️

A阶段——快速搭建你的第一个模型⚡

目标：训练某项技能，测量其效果，并加以改进。

先做一个简短的入门课程（例如，机器学习速成课程），然后再做一个实践性微课程（例如，Kaggle 入门课程）。
项目构想：利用公开数据集预测房价、客户流失率或信用风险。

简短的“成功”清单：

您可以加载数据。
您可以训练一个基准模型。
你可以用通俗易懂的语言解释过拟合现象。

第二阶段——熟悉真实的机器学习实践🔧

目标：不再对常见的故障模式感到惊讶。

学习中级机器学习主题：缺失值、泄漏、管道、计算机视觉。
浏览一下 scikit-learn 用户指南的几个章节，然后实际运行一下其中的代码片段。[3]
项目构想：一个简单的端到端流程，包含保存的模型和评估报告。

C阶段——深度学习不再像魔法般神秘莫测🧙♂️

目标：训练神经网络并了解训练循环。

按照 PyTorch 的“学习基础知识”路径进行操作（张量 → 数据集/数据加载器 → 训练/评估 → 保存）。[4]
如果您想要速度和实用性，可以选择搭配 fast.ai 使用。
项目构想：图像分类器、情感模型或小型Transformer微调。

第四阶段——真正有效的生成式人工智能应用✨

目标：打造人们使用的产品。

参加实用的 LLM 课程，并参考供应商的快速入门指南，即可连接嵌入、检索和安全生成。
项目构想：文档问答机器人（分块 → 嵌入 → 检索 → 带引用的回答），或者一个带有工具调用的客户支持助手。

关于“数学”部分——要像学习调味料一样去学习它，而不是学习整道菜🧂

数学固然重要，但时机更重要。

最基本的数学运算：

线性代数：向量、矩阵、点积（嵌入的直观理解）。[2]
微积分：导数直观理解（斜率→梯度）。[1]
概率：分布、期望、基本的贝叶斯思想。[1]

如果以后想要更系统地学习基础知识，可以参考 CS229 的笔记，学习基础知识，以及参考麻省理工学院的深度学习入门教材，学习现代主题。[1][2]

让你看起来很专业的项目😄

如果只在玩具数据集上构建分类器，你会感到束手无策。尝试一些更接近真实工作的项目：

基线优先机器学习项目（scikit-learn）：清洗数据 → 强大的基线 → 误差分析。[3]
LLM + 检索应用程序：摄取文档 → 分块 → 嵌入 → 检索 → 生成带引用的答案。
模型监控迷你仪表盘：记录输入/输出；跟踪漂移信号（即使是简单的统计数据也有帮助）。
负责任的人工智能小型审计：记录风险、极端情况、故障影响；使用轻量级框架。[5]

负责任且务实的部署（是的，即使是单人开发者也可以做到）🧯

现实是：令人印象深刻的演示很容易，但可靠的系统却很难做到。

保留一份简短的“模型卡”式 README 文件：数据来源、指标、已知限制、更新频率。
添加基本防护措施（速率限制、输入验证、滥用监控）。
对于任何面向用户或具有重大影响的应用，都应采用基于风险的方法：识别危害、测试极端情况并记录缓解措施。NIST AI RMF 正是为此而设计的。[5]

常见陷阱（方便你避开它们）🧨

频繁更换学习课程——“再上一门课就好”成了你的全部性格。
先从最难的话题开始——变形金刚很酷，但基础知识才是谋生之道。
忽略评估——单凭准确性就能掩盖真相。要用对指标。[3]
不要把事情写下来——只做简短记录：哪些失败了，哪些发生了变化，哪些有所改进。
没有部署实践经验——即使是一个简单的应用程序封装器也能学到很多东西。
忽略风险思考——在产品发布前，只列出两点潜在危害。[5]

最后总结——太长了，我没看完😌

如果你想知道如何学习人工智能，以下是最简单的成功秘诀：

动手实践机器学习基础知识开始（简明入门 + Kaggle 式练习）。
使用scikit-learn学习真实的机器学习工作流程和指标。[3]
迁移到PyTorch来进行深度学习和训练循环。[4]
通过实践课程和 API 快速入门，提升您的 LLM 技能
构建3-5 个项目，展示：数据准备、建模、评估和一个简单的“产品”包装。
将风险/治理视为“已完成”工作的一部分，而不是可有可无的附加项。[5]

没错，你有时会感到迷茫。这很正常。人工智能就像教烤面包机读书——成功的时候令人惊叹，失败的时候有点可怕，而且需要的迭代次数比任何人承认的都要多😵💫

参考

[1] 斯坦福大学 CS229 课程讲义。（机器学习核心基础、监督学习、概率框架）。https
://cs229.stanford.edu/main_notes.pdf

[2] MIT 6.S191：深度学习导论。（深度学习概述，包括LLM在内的现代主题）。https
://introtodeeplearning.com/

[3] scikit-learn：模型评估及指标。（准确率、精确率/召回率、ROC曲线下面积等）。https
://scikit-learn.org/stable/modules/model_evaluation.html

[4] PyTorch 教程 – 学习基础知识。（张量、数据集/数据加载器、训练/评估循环）。https
://docs.pytorch.org/tutorials/beginner/basics/intro.html

[5] NIST 人工智能风险管理框架（AI RMF 1.0）。（基于风险的可信赖人工智能指南）。https
://nvlpubs.nist.gov/nistpubs/ai/nist.ai.100-1.pdf

商品已加入购物车

如何学习人工智能？

“人工智能”在日常生活中究竟意味着什么🤷♀️

好的“如何学习人工智能”计划应该具备哪些要素？✅

（现在）选好你的路——三条常见路线🚦

1）实用型建造者路线🛠️

2）先掌握基本功的方法📚

3）人工智能应用开发者路线✨

对比表格——最佳学习方法（附带真实小瑕疵）📋

你真正需要的核心技能组合（以及学习顺序）🧩

您可以按照以下步骤操作🗺️

A阶段——快速搭建你的第一个模型⚡

第二阶段——熟悉真实的机器学习实践🔧

C阶段——深度学习不再像魔法般神秘莫测🧙♂️

第四阶段——真正有效的生成式人工智能应用✨

关于“数学”部分——要像学习调味料一样去学习它，而不是学习整道菜🧂

让你看起来很专业的项目😄

负责任且务实的部署（是的，即使是单人开发者也可以做到）🧯

常见陷阱（方便你避开它们）🧨

最后总结——太长了，我没看完😌

参考

更多资源（可点击）

在官方人工智能助手商店查找最新人工智能产品

关于我们

国家/地区

“人工智能”在日常生活中究竟意味着什么🤷♀️

好的“如何学习人工智能”计划应该具备哪些要素？✅

（现在）选好你的路——三条常见路线🚦

1）实用型建造者路线🛠️

2）先掌握基本功的方法📚

3）人工智能应用开发者路线✨

对比表格——最佳学习方法（附带真实小瑕疵）📋

你真正需要的核心技能组合（以及学习顺序）🧩

您可以按照以下步骤操作🗺️

A阶段——快速搭建你的第一个模型⚡

第二阶段——熟悉真实的机器学习实践🔧

C阶段——深度学习不再像魔法般神秘莫测🧙♂️

第四阶段——真正有效的生成式人工智能应用✨

关于“数学”部分——要像学习调味料一样去学习它，而不是学习整道菜🧂

让你看起来很专业的项目😄

负责任且务实的部署（是的，即使是单人开发者也可以做到）🧯

常见陷阱（方便你避开它们）🧨

最后总结——太长了，我没看完😌

参考

更多资源（可点击）

在官方人工智能助手商店查找最新人工智能产品

关于我们