如何学习人工智能?

如何学习人工智能?

学习人工智能就像走进一座巨大的图书馆,每本书都在喊着“从这里开始”。一半的书架上都写着“数学”,这……有点儿不礼貌😅

好处在于:你不需要了解所有事情就能创造出有用的东西。你需要一条合理的路径、一些可靠的资源,以及愿意经历一段时间的困惑(困惑基本上是入门的门槛)。

您可能还想阅读以下文章:

🔗 人工智能如何检测异常情况?
阐述了利用机器学习和统计学进行异常检测的方法。

🔗 为什么人工智能对社会有害
探讨人工智能的伦理、社会和经济风险。

🔗 人工智能用水量是多少?
分析人工智能的能源消耗和隐性用水影响。

🔗 什么是人工智能数据集
定义数据集、标签及其在人工智能训练中的作用。


“人工智能”在日常生活中究竟意味着什么🤷♀️

人们提到“人工智能”时,可能指的是几种不同的东西:

  • 机器学习(ML) ——模型从数据中学习模式,并将输入映射到输出(例如,垃圾邮件检测、价格预测)。[1]

  • 深度学习(DL) ——机器学习的一个子集,它使用大规模神经网络(视觉、语音、大型语言模型)。[2]

  • 生成式人工智能——能够生成文本、图像、代码、音频的模型(聊天机器人、副驾驶、内容工具)。[2]

  • 强化学习——通过尝试和奖励进行学习(游戏智能体、机器人学)。[1]

你不必一开始就做出完美的选择。但不要把人工智能当成博物馆。它更像厨房——边做边学。有时候你会把面包烤焦。🍞🔥

一个小故事:一个小团队开发了一个“很棒”的客户流失模型……直到他们发现训练集测试集里有相同的ID。典型的泄露。一个简单的管道加上清晰的数据拆分,就把可疑的0.99变成了一个可信的(更低的!)分数,并且模型也真正具备了泛化能力。[3]


好的“如何学习人工智能”计划应该具备哪些要素?✅

一个好的计划有一些听起来很枯燥的特点,但却能为你节省数月时间:

  • 边做边学(早期做小项目,后期做大项目)。

  • 先学习最基本的数学知识,然后再深入学习。

  • 解释一下你做了什么(用橡皮鸭擦拭你的工作;这可以纠正思维混乱)。

  • 一段时间内坚持使用一个“核心技术栈” (Python + Jupyter + scikit-learn → 然后是 PyTorch)。

  • 衡量进展应以产出为准,而不是以观看时长为准。

如果你的计划只有视频和笔记,那就好比试图通过阅读有关水的知识来学习游泳一样。


(现在)选好你的路——三条常见路线🚦

你可以通过不同的“方式”学习人工智能。以下三种方式行之有效:

1)实用型建造者路线🛠️

如果您想要快速取得成果并获得动力,这是最佳选择。
重点:数据集、训练模型、发布演示。
入门资源:谷歌机器学习速成课程、Kaggle Learn、fast.ai(链接见下方“参考资料和资源”)。

2)先掌握基本功的方法📚

如果你喜欢清晰易懂的理论,这门课最适合你。
重点:回归、偏差-方差、概率思维、优化。
参考教材:斯坦福大学 CS229 课程资料、麻省理工学院深度学习导论。[1][2]

3)人工智能应用开发者路线✨

如果您想构建助手、搜索、工作流以及其他类似“代理”的功能,那么这款产品是您的最佳选择。
重点在于:提示、检索、评估、工具使用、安全基础知识和部署。
需要重点关注的文档:平台文档(API)、HF 课程(工具)。

你可以稍后再换车道。起步才是最难的。

 

如何学习人工智能

对比表格——最佳学习方法(附带真实小瑕疵)📋

工具/课程 观众 价格 它为何有效(简述)
谷歌机器学习速成课程 初学者 自由的 视觉辅助+动手实践;避免过于复杂
Kaggle Learn(机器学习入门+中级) 喜欢练习的初学者 自由的 简短精炼的课程 + 即时练习
fast.ai 实用深度学习 懂一些编程的建筑师 自由的 你很早就开始训练真正的模型——就像,马上就开始😅
深度学习.人工智能机器学习专业化 结构化学习者 有薪酬的 清晰地阐述机器学习核心概念
DeepLearning.AI 深度学习规范 机器学习基础知识已掌握 有薪酬的 对神经网络和工作流程有深入的理解
斯坦福 CS229 笔记 理论驱动 自由的 严肃的基本原理(“为什么这种方法有效”)
scikit-learn 用户指南 机器学习从业者 自由的 表格/基线的经典工具包
PyTorch教程 深度学习构建器 自由的 从张量到训练循环的清晰路径[4]
拥抱脸 LLM 课程 NLP + LLM 构建者 自由的 实用LLM工作流程+生态系统工具
NIST人工智能风险管理框架 任何部署人工智能的人 自由的 简单易用的风险/治理框架[5]

补充说明:网上“价格”的概念很奇怪。有些东西是免费的,但却要花费注意力……而注意力有时反而更糟糕。


你真正需要的核心技能组合(以及学习顺序)🧩

如果你的目标是“如何在不被人工智能淹没的情况下学习它”,请按照以下步骤进行:

  1. Python基础知识

  • 函数、列表/字典、轻量级类、读取文件。

  • 必须养成的习惯:写一些小剧本,而不仅仅是记笔记。

  1. 数据处理

  • NumPy 式的思维方式、pandas 的基础知识、绘图。

  • 你得在这里待很长时间。这份工作并不光鲜亮丽,但这就是工作内容。

  1. 经典机器学习(被低估的超级大国)

  • 训练/测试集划分、泄漏、过拟合。

  • 线性/逻辑回归、决策树、随机森林、梯度提升。

  • 评价指标:准确率、精确率/召回率、ROC曲线下面积、平均绝对误差/均方根误差——要知道何时使用哪个指标才有意义。[3]

  1. 深度学习

  • 张量、梯度/反向传播(概念上)、训练循环。

  • CNN 用于图像处理,Transformer 用于文本处理(最终)。

  • 掌握一些 PyTorch 的基础知识非常重要。[4]

  1. 生成式人工智能 + LLM 工作流程

  • 分词、嵌入、检索增强生成、评估。

  • 微调与提示(以及何时两者都不需要)。


您可以按照以下步骤操作🗺️

A阶段——快速搭建你的第一个模型⚡

目标:训练某项技能,测量其效果,并加以改进。

  • 先做一个简短的入门课程(例如,机器学习速成课程),然后再做一个实践性微课程(例如,Kaggle 入门课程)。

  • 项目构想:利用公开数据集预测房价、客户流失率或信用风险。

简短的“成功”清单:

  • 您可以加载数据。

  • 您可以训练一个基准模型。

  • 你可以用通俗易懂的语言解释过拟合现象。

第二阶段——熟悉真实的机器学习实践🔧

目标:不再对常见的故障模式感到惊讶。

  • 学习中级机器学习主题:缺失值、泄漏、管道、计算机视觉。

  • 浏览一下 scikit-learn 用户指南的几个章节,然后实际运行一下其中的代码片段。[3]

  • 项目构想:一个简单的端到端流程,包含保存的模型和评估报告。

C阶段——深度学习不再像魔法般神秘莫测🧙♂️

目标:训练神经网络并了解训练循环。

  • 按照 PyTorch 的“学习基础知识”路径进行操作(张量 → 数据集/数据加载器 → 训练/评估 → 保存)。[4]

  • 如果您想要速度和实用性,可以选择搭配 fast.ai 使用。

  • 项目构想:图像分类器、情感模型或小型Transformer微调。

第四阶段——真正有效的生成式人工智能应用✨

目标:打造人们使用的产品。

  • 参加实用的 LLM 课程,并参考供应商的快速入门指南,即可连接嵌入、检索和安全生成。

  • 项目构想:文档问答机器人(分块 → 嵌入 → 检索 → 带引用的回答),或者一个带有工具调用的客户支持助手。


关于“数学”部分——要像学习调味料一样去学习它,而不是学习整道菜🧂

数学固然重要,但时机更重要。

最基本的数学运算:

  • 线性代数:向量、矩阵、点积(嵌入的直观理解)。[2]

  • 微积分:导数直观理解(斜率→梯度)。[1]

  • 概率:分布、期望、基本的贝叶斯思想。[1]

如果以后想要更系统地学习基础知识,可以参考 CS229 的笔记,学习基础知识,以及参考麻省理工学院的深度学习入门教材,学习现代主题。[1][2]


让你看起来很专业的项目😄

如果只在玩具数据集上构建分类器,你会感到束手无策。尝试一些更接近真实工作的项目:

  • 基线优先机器学习项目(scikit-learn):清洗数据 → 强大的基线 → 误差分析。[3]

  • LLM + 检索应用程序:摄取文档 → 分块 → 嵌入 → 检索 → 生成带引用的答案。

  • 模型监控迷你仪表盘:记录输入/输出;跟踪漂移信号(即使是简单的统计数据也有帮助)。

  • 负责任的人工智能小型审计:记录风险、极端情况、故障影响;使用轻量级框架。[5]


负责任且务实的部署(是的,即使是单人开发者也可以做到)🧯

现实是:令人印象深刻的演示很容易,但可靠的系统却很难做到。

  • 保留一份简短的“模型卡”式 README 文件:数据来源、指标、已知限制、更新频率。

  • 添加基本​​防护措施(速率限制、输入验证、滥用监控)。

  • 对于任何面向用户或具有重大影响的应用,都应采用基于风险的方法:识别危害、测试极端情况并记录缓解措施。NIST AI RMF 正是为此而设计的。[5]


常见陷阱(方便你避开它们)🧨

  • 频繁更换学习课程——“再上一门课就好”成了你的全部性格。

  • 先从最难的话题开始——变形金刚很酷,但基础知识才是谋生之道。

  • 忽略评估——单凭准确性就能掩盖真相。要用对指标。[3]

  • 不要把事情写下来——只做简短记录:哪些失败了,哪些发生了变化,哪些有所改进。

  • 没有部署实践经验——即使是一个简单的应用程序封装器也能学到很多东西。

  • 忽略风险思考——在产品发布前,只列出两点潜在危害。[5]


最后总结——太长了,我没看完😌

如果你想知道如何学习人工智能,以下是最简单的成功秘诀:

  • 动手实践机器学习基础知识开始(简明入门 + Kaggle 式练习)。

  • 使用scikit-learn学习真实的机器学习工作流程和指标。[3]

  • 迁移到PyTorch来进行深度学习和训练循环。[4]

  • 通过实践课程和 API 快速入门,提升您的 LLM 技能

  • 构建3-5 个项目,展示:数据准备、建模、评估和一个简单的“产品”包装。

  • 风险/治理视为“已完成”工作的一部分,而不是可有可无的附加项。[5]

没错,你有时会感到迷茫。这很正常。人工智能就像教烤面包机读书——成功的时候令人惊叹,失败的时候有点可怕,而且需要的迭代次数比任何人承认的都要多😵💫


参考

[1] 斯坦福大学 CS229 课程讲义。(机器学习核心基础、监督学习、概率框架)。https
://cs229.stanford.edu/main_notes.pdf

[2] MIT 6.S191:深度学习导论。(深度学习概述,包括LLM在内的现代主题)。https
://introtodeeplearning.com/

[3] scikit-learn:模型评估及指标。(准确率、精确率/召回率、ROC曲线下面积等)。https
://scikit-learn.org/stable/modules/model_evaluation.html

[4] PyTorch 教程 – 学习基础知识。(张量、数据集/数据加载器、训练/评估循环)。https
://docs.pytorch.org/tutorials/beginner/basics/intro.html

[5] NIST 人工智能风险管理框架(AI RMF 1.0)。(基于风险的可信赖人工智能指南)。https
://nvlpubs.nist.gov/nistpubs/ai/nist.ai.100-1.pdf


更多资源(可点击)

在官方人工智能助手商店查找最新人工智能产品

关于我们

返回博客