人工智能无处不在——你的手机、你的邮箱、地图导航、帮你撰写你半途而废的邮件。但人工智能究竟是什么?简而言之:它是一系列技术的集合,使计算机能够执行我们通常认为只有人类智能才能完成的任务,例如识别模式、进行预测以及生成语言或图像。这并非夸张的营销宣传,而是一个扎实的领域,它融合了数学、数据以及大量的试错。权威文献将人工智能定义为能够学习、推理并以我们认为智能的方式朝着目标行动的系统。[1]
您可能还想阅读以下文章:
🔗 什么是开源人工智能?
了解开源人工智能、其优势、许可模式和社区协作。
🔗 人工智能中的神经网络是什么?
学习神经网络基础知识、架构类型、训练方法和常见用途。
🔗 人工智能中的计算机视觉是什么?
了解机器如何解读图像、关键任务、数据集和应用程序。
🔗 什么是符号人工智能?
探索符号推理、知识图谱、规则和混合神经符号系统。
什么是人工智能:简明版🧠➡️💻
人工智能是一系列使软件能够模拟智能行为的方法。我们通常不会编写每条规则的代码,而是通过训练模型,使其能够泛化到新的情境中——例如图像识别、语音转文本、路线规划、代码助手、蛋白质结构预测等等。如果你想在笔记中记住一个简洁的定义:可以把它想象成执行与人类智力过程相关的任务的计算机系统,例如推理、发现意义和从数据中学习。[1]
该领域中一个有用的思维模型是将人工智能视为目标导向系统,该系统能够感知环境并选择行动——这在思考评估和控制回路时非常有用。[1]
人工智能的真正用途是什么✅
为什么选择人工智能而不是传统规则?
-
模式识别能力——模型能够发现庞大数据集中的细微关联,而人类可能在午饭前都无法发现。
-
适应性——随着数据量的增加,无需重写所有代码即可提高性能。
-
规模化速度——一旦训练完成,模型就能快速稳定地运行,即使在数据量巨大的情况下也是如此。
-
生成性——现代系统不仅可以对事物进行分类,还可以生成文本、图像、代码,甚至是候选分子。
-
概率思维——与脆弱的 if-else 逻辑森林相比,它能更优雅地处理不确定性。
-
使用工具——您可以将模型连接到计算器、数据库或搜索,以提高可靠性。
-
它不好的地方在于——偏见、幻觉、过时的训练数据、隐私风险。我们会解决这些问题的。
说实话,有时候人工智能感觉像思维的自行车,有时候又像在碎石路上骑独轮车。两种说法都可能成立。
人工智能如何以人类的速度运行🔧
大多数现代人工智能系统都结合了以下要素:
-
数据——例如语言、图像、点击、传感器读数。
-
目标——损失函数,用来描述“好”的标准。
-
算法——训练模型以最小化损失的过程。
-
评估——测试集、指标、健全性检查。
-
部署——为模型提供监控、安全和防护措施。
两大传统:
-
基于符号或逻辑的人工智能——显式规则、知识图谱、搜索。非常适合形式化推理和约束。
-
统计或基于学习的人工智能——即从数据中学习的模型。深度学习正是基于此,也是近期最热门的研究领域;一篇被广泛引用的综述概述了从分层表示到优化和泛化的各个方面。[2]
在基于学习的人工智能领域,以下几个支柱至关重要:
-
监督学习——从标记的例子中学习。
-
无监督和自监督学习——从未标记数据中学习结构。
-
强化学习——通过尝试和反馈进行学习。
-
生成式建模——学习生成看起来很逼真的新样本。
你每天都会听到这两个富有创造力的家族的故事:
-
Transformer——大多数大型语言模型背后的架构。它利用注意力机制将每个词元与其他词元关联起来,从而实现并行训练并产生流畅的输出。如果你听说过“自注意力机制”,那就是其核心技巧。[3]
-
扩散模型——它们学习逆转噪声过程,从随机噪声逐步恢复到清晰的图像或音频。这就像用微积分缓慢而小心地将一副扑克牌重新洗牌一样;基础性工作展示了如何有效地进行训练和采样。[5]
如果这些比喻显得牵强,那也无可厚非——人工智能是一个不断变化的目标。我们都在学习这支舞,而乐曲却在中途变换。
你每天都能在这里遇到人工智能📱🗺️📧
-
搜索与推荐- 排名结果、信息流、视频。
-
电子邮件和文档- 自动完成、摘要、质量检查。
-
摄像头和音频- 降噪、HDR、转录。
-
导航——交通预测、路线规划。
-
支持与服务- 聊天客服人员负责分类和撰写回复。
-
编码——建议、重构、测试。
-
健康与科学——分诊、影像支持、结构预测。(将临床环境视为安全关键;采用人工监督和记录在案的局限性。)[2]
小例子:产品团队可能会对语言模型前的检索步骤进行 A/B 测试;错误率通常会下降,因为模型会基于更新鲜、更贴近任务的上下文进行推理,而不是靠猜测。(方法:预先定义指标,保留一组测试集,并比较完全相同的提示。)
优势、局限,以及两者之间的些许混乱⚖️
优势
-
能够优雅地处理大型、杂乱的数据集。
-
能够利用相同的核心机制完成各种任务。
-
学习我们未曾人工设计的潜在结构。[2]
限制
-
幻觉——模型可能会产生听起来合情合理但实际上不正确的输出。
-
偏见——训练数据可能编码社会偏见,而系统随后会复制这些偏见。
-
鲁棒性——极端情况、对抗性输入和分布偏移都可能导致系统崩溃。
-
隐私与安全——如果不小心,敏感数据可能会泄露。
-
可解释性——为什么会这样说?有时解释不清,这给审计工作带来了困难。
风险管理的存在是为了避免交付混乱的产品: NIST AI 风险管理框架提供了实用且自愿的指导,以提高设计、开发和部署过程中的可信度——例如,绘制风险图、衡量风险以及管理端到端的使用。[4]
道路交通规则:安全、管理和责任🛡️
法规和指导意见正在逐步跟上实践的步伐:
-
基于风险的方法——高风险用途面临更严格的要求;文档记录、数据治理和事件处理至关重要。公共框架强调透明度、人工监督和持续监控。[4]
-
行业细微差别——安全关键领域(如医疗健康)需要人为干预和仔细评估;通用工具仍然需要清晰的预期用途和局限性文档。[2]
这并不是要扼杀创新;而是不要把你的产品变成图书馆里的爆米花机……这听起来很有趣,但实际上却并非如此。
人工智能在实践中的类型及示例🧰
-
感知——视觉、语音、传感器融合。
-
语言——聊天、翻译、摘要、提取。
-
预测——需求预测、风险评分、异常检测。
-
规划与控制——机器人技术、物流。
-
生成——图像、音频、视频、代码、结构化数据。
其底层数学原理依赖于线性代数、概率论、优化和计算栈,这些都保证了整个系统的流畅运行。如需更深入地了解深度学习的基础理论,请参阅权威综述。[2]
对比表格:热门AI工具一览🧪
(故意略有瑕疵。价格会变动。实际效果可能因人而异。)
| 工具 | 最适合 | 价格 | 为什么它效果很好 |
|---|---|---|---|
| 聊天式法学硕士 | 写作、问答、构思 | 免费 + 付费 | 强大的语言建模;工具接口 |
| 图像生成器 | 设计、情绪板 | 免费 + 付费 | 扩散模型在视觉效果方面表现出色 |
| 代码副驾驶 | 开发者 | 付费试用 | 基于代码语料库训练;快速编辑 |
| 向量数据库搜索 | 产品团队,支持 | 因情况而异 | 检索事实以减少偏差 |
| 语音工具 | 会议,创作者 | 免费 + 付费 | ASR + TTS 清晰得令人惊讶 |
| 分析人工智能 | 运营、财务 | 企业 | 无需200个电子表格即可进行预测 |
| 安全工具 | 合规与治理 | 企业 | 风险映射、日志记录、红队演练 |
| 设备上的微型设备 | 移动端、隐私人士 | 相对自由 | 低延迟;数据保留在本地 |
如何像专业人士一样评估人工智能系统🧪🔍
-
明确工作内容——用一句话描述工作任务。
-
选择指标——准确率、延迟、成本、安全触发。
-
制作一个测试集——具有代表性、多样化、独立存在。
-
检查故障模式——系统应拒绝或升级的输入。
-
检验是否存在偏差——在适用情况下,检验人口统计切片和敏感属性。
-
人工参与——明确何时需要人工审核。
-
日志和监控- 漂移检测、事件响应、回滚。
-
文档——数据来源、局限性、预期用途、风险提示。NIST AI RMF 为您提供了这方面的通用语言和流程。[4]
我经常听到的一些常见误解🙃
-
“这只是复制。”训练过程学习统计结构;生成过程则根据该结构构建新的输出。这可能具有创造性——也可能是错误的——但它不是复制粘贴。[2]
-
“人工智能像人一样理解事物。”它进行建模。有时这看起来像是理解;有时则像是一种自信的模糊状态。[2]
-
“越大越好。”规模固然重要,但数据质量、对齐方式和检索效率往往更为关键。[2][3]
-
“一个AI就能统治一切。”真正的技术栈是多模型的:事实检索、文本生成、设备上的小型快速模型,以及经典的搜索。
更深入地了解一下:变形金刚和扩散,一分钟搞定⏱️
-
Transformer通过计算词元之间的注意力分数来决定关注点。堆叠层可以捕捉长程依赖关系而无需显式递归,从而实现高并行性和在各种语言任务中的出色性能。这种架构是大多数现代语言系统的基础。[3]
-
扩散模型通过逐步学习消除噪声,就像擦拭模糊的镜子直到人脸显现一样。其核心训练和采样思想引发了图像生成的蓬勃发展,现在也扩展到了音频和视频领域。[5]
您可以保存的微型词汇表📚
-
模型——一个参数化函数,我们对其进行训练以将输入映射到输出。
-
训练——优化参数以最大限度地减少样本损失。
-
过拟合——在训练数据上表现出色,但在其他数据上表现平平。
-
幻觉——流畅但内容与事实不符的表达。
-
RAG——检索增强生成,它参考最新的信息源。
-
一致性训练——塑造行为以遵循指令和规范。
-
安全——防止有害输出并管理整个生命周期中的风险。
-
推理——使用训练好的模型进行预测。
-
延迟——从输入到得到结果所需的时间。
-
护栏——围绕模型的策略、过滤器和控制。
太长了,没看完——结语🌯
什么是人工智能?一系列技术的集合,使计算机能够从数据中学习并智能地朝着目标行动。现代人工智能浪潮的核心是深度学习——尤其是用于语言的Transformer算法和用于媒体传播的Transformer算法。如果运用得当,人工智能可以扩展模式识别能力,加快创造性和分析性工作,并开启新的科学领域。但如果使用不当,它可能会误导他人、排斥异己或削弱信任。理想的人工智能发展路径是将强大的工程技术与治理、评估以及谦逊的态度相结合。这种平衡不仅是可能的——而且在合适的框架和规则下,它是可教授、可测试和可维护的。[2][3][4][5]
参考
[1]大英百科全书 - 人工智能 (AI) :了解更多
[2] 《自然》杂志 - “深度学习”(LeCun、Bengio、Hinton) :了解更多
[3] arXiv - “注意力机制就是你所需要的一切”(Vaswani 等人) :了解更多
[4]美国国家标准与技术研究院 (NIST) - 人工智能风险管理框架:了解更多
[5] arXiv - “扩散概率模型去噪”(Ho 等人) :了解更多