什么是人工智能？

人工智能无处不在——你的手机、你的邮箱、地图导航、帮你撰写你半途而废的邮件。但 人工智能究竟是什么？简而言之：它是一系列技术的集合，使计算机能够执行我们通常认为只有人类智能才能完成的任务，例如识别模式、进行预测以及生成语言或图像。这并非夸张的营销宣传，而是一个扎实的领域，它融合了数学、数据以及大量的试错。权威文献将人工智能定义为能够学习、推理并以我们认为智能的方式朝着目标行动的系统。[1]

您可能还想阅读以下文章：

🔗 什么是开源人工智能？
了解开源人工智能、其优势、许可模式和社区协作。

🔗 人工智能中的神经网络是什么？
学习神经网络基础知识、架构类型、训练方法和常见用途。

🔗 人工智能中的计算机视觉是什么？
了解机器如何解读图像、关键任务、数据集和应用程序。

🔗 什么是符号人工智能？
探索符号推理、知识图谱、规则和混合神经符号系统。

什么是人工智能：简明版🧠➡️💻

人工智能是一系列使软件能够模拟智能行为的方法。我们通常不会编写每条规则的代码，而是通过训练模型，使其能够泛化到新的情境中——例如图像识别、语音转文本、路线规划、代码助手、蛋白质结构预测等等。如果你想在笔记中记住一个简洁的定义：可以把它想象成执行与人类智力过程相关的任务的计算机系统，例如推理、发现意义和从数据中学习。[1]

该领域中一个有用的思维模型是将人工智能视为 目标导向系统， 该系统能够感知环境并选择行动——这在思考评估和控制回路时非常有用。[1]

人工智能的真正用途是什么✅

为什么选择人工智能而不是传统规则？

模式识别能力 ——模型能够发现庞大数据集中的细微关联，而人类可能在午饭前都无法发现。
适应性 ——随着数据量的增加，无需重写所有代码即可提高性能。
规模化速度 ——一旦训练完成，模型就能快速稳定地运行，即使在数据量巨大的情况下也是如此。
生成性 ——现代系统不仅可以对事物进行分类，还可以生成文本、图像、代码，甚至是候选分子。
概率思维 ——与脆弱的 if-else 逻辑森林相比，它能更优雅地处理不确定性。
使用工具 ——您可以将模型连接到计算器、数据库或搜索，以提高可靠性。
它不好的地方在于 ——偏见、幻觉、过时的训练数据、隐私风险。我们会解决这些问题的。

说实话，有时候人工智能感觉像思维的自行车，有时候又像在碎石路上骑独轮车。两种说法都可能成立。

人工智能如何以人类的速度运行🔧

大多数现代人工智能系统都结合了以下要素：

数据 ——例如语言、图像、点击、传感器读数。
目标 ——损失函数，用来描述“好”的标准。
算法 ——训练模型以最小化损失的过程。
评估 ——测试集、指标、健全性检查。
部署 ——为模型提供监控、安全和防护措施。

两大传统：

基于符号或逻辑的人工智能 ——显式规则、知识图谱、搜索。非常适合形式化推理和约束。
统计或基于学习的人工智能 ——即从数据中学习的模型。深度学习正是基于此，也是近期最热门的研究领域；一篇被广泛引用的综述概述了从分层表示到优化和泛化的各个方面。[2]

在基于学习的人工智能领域，以下几个支柱至关重要：

监督学习 ——从标记的例子中学习。
无监督和自监督 学习——从未标记数据中学习结构。
强化学习 ——通过尝试和反馈进行学习。
生成式建模 ——学习生成看起来很逼真的新样本。

你每天都会听到这两个富有创造力的家族的故事：

Transformer—— 大多数大型语言模型背后的架构。它利用 注意力机制 将每个词元与其他词元关联起来，从而实现并行训练并产生流畅的输出。如果你听说过“自注意力机制”，那就是其核心技巧。[3]
扩散模型 ——它们学习逆转噪声过程，从随机噪声逐步恢复到清晰的图像或音频。这就像用微积分缓慢而小心地将一副扑克牌重新洗牌一样；基础性工作展示了如何有效地进行训练和采样。[5]

如果这些比喻显得牵强，那也无可厚非——人工智能是一个不断变化的目标。我们都在学习这支舞，而乐曲却在中途变换。

你每天都能在这里遇到人工智能📱🗺️📧

搜索与推荐 - 排名结果、信息流、视频。
电子邮件和文档 - 自动完成、摘要、质量检查。
摄像头和音频 - 降噪、HDR、转录。
导航 ——交通预测、路线规划。
支持与服务 - 聊天客服人员负责分类和撰写回复。
编码 ——建议、重构、测试。
健康与科学 ——分诊、影像支持、结构预测。（将临床环境视为安全关键；采用人工监督和记录在案的局限性。）[2]

小例子： 产品团队可能会对语言模型前的检索步骤进行 A/B 测试；错误率通常会下降，因为模型会基于更新鲜、更贴近任务的上下文进行推理，而不是靠猜测。（方法：预先定义指标，保留一组测试集，并比较完全相同的提示。）

优势、局限，以及两者之间的些许混乱⚖️

优势

能够优雅地处理大型、杂乱的数据集。
能够利用相同的核心机制完成各种任务。
学习我们未曾人工设计的潜在结构。[2]

限制

幻觉 ——模型可能会产生听起来合情合理但实际上不正确的输出。
偏见 ——训练数据可能编码社会偏见，而系统随后会复制这些偏见。
鲁棒性 ——极端情况、对抗性输入和分布偏移都可能导致系统崩溃。
隐私与安全 ——如果不小心，敏感数据可能会泄露。
可解释性 ——为什么会这样说？有时解释不清，这给审计工作带来了困难。

风险管理的存在是为了避免交付混乱的产品： NIST AI 风险管理框架提供了实用且自愿的指导，以提高设计、开发和部署过程中的可信度——例如，绘制风险图、衡量风险以及管理端到端的使用。[4]

道路交通规则：安全、管理和责任🛡️

法规和指导意见正在逐步跟上实践的步伐：

基于风险的方法 ——高风险用途面临更严格的要求；文档记录、数据治理和事件处理至关重要。公共框架强调透明度、人工监督和持续监控。[4]
行业细微差别 ——安全关键领域（如医疗健康）需要人为干预和仔细评估；通用工具仍然需要清晰的预期用途和局限性文档。[2]

这并不是要扼杀创新；而是不要把你的产品变成图书馆里的爆米花机……这听起来很有趣，但实际上却并非如此。

人工智能在实践中的类型及示例🧰

感知 ——视觉、语音、传感器融合。
语言 ——聊天、翻译、摘要、提取。
预测 ——需求预测、风险评分、异常检测。
规划与控制 ——机器人技术、物流。
生成 ——图像、音频、视频、代码、结构化数据。

其底层数学原理依赖于线性代数、概率论、优化和计算栈，这些都保证了整个系统的流畅运行。如需更深入地了解深度学习的基础理论，请参阅权威综述。[2]

对比表格：热门AI工具一览🧪

（故意略有瑕疵。价格会变动。实际效果可能因人而异。）

工具	最适合	价格	为什么它效果很好
聊天式法学硕士	写作、问答、构思	免费 + 付费	强大的语言建模；工具接口
图像生成器	设计、情绪板	免费 + 付费	扩散模型在视觉效果方面表现出色
代码副驾驶	开发者	付费试用	基于代码语料库训练；快速编辑
向量数据库搜索	产品团队，支持	因情况而异	检索事实以减少偏差
语音工具	会议，创作者	免费 + 付费	ASR + TTS 清晰得令人惊讶
分析人工智能	运营、财务	企业	无需200个电子表格即可进行预测
安全工具	合规与治理	企业	风险映射、日志记录、红队演练
设备上的微型设备	移动端、隐私人士	相对自由	低延迟；数据保留在本地

如何像专业人士一样评估人工智能系统🧪🔍

明确工作内容 ——用一句话描述工作任务。
选择指标 ——准确率、延迟、成本、安全触发。
制作一个测试集 ——具有代表性、多样化、独立存在。
检查故障模式 ——系统应拒绝或升级的输入。
检验是否存在偏差 ——在适用情况下，检验人口统计切片和敏感属性。
人工参与 ——明确何时需要人工审核。
日志和监控 - 漂移检测、事件响应、回滚。
文档 ——数据来源、局限性、预期用途、风险提示。NIST AI RMF 为您提供了这方面的通用语言和流程。[4]

我经常听到的一些常见误解🙃

“这只是复制。” 训练过程学习统计结构；生成过程则根据该结构构建新的输出。这可能具有创造性——也可能是错误的——但它不是复制粘贴。[2]
“人工智能像人一样理解事物。” 它 进行建模 。有时这看起来像是理解；有时则像是一种自信的模糊状态。[2]
“越大越好。” 规模固然重要，但数据质量、对齐方式和检索效率往往更为关键。[2][3]
“一个AI就能统治一切。” 真正的技术栈是多模型的：事实检索、文本生成、设备上的小型快速模型，以及经典的搜索。

更深入地了解一下：变形金刚和扩散，一分钟搞定⏱️

Transformer 通过计算词元之间的注意力分数来决定关注点。堆叠层可以捕捉长程依赖关系而无需显式递归，从而实现高并行性和在各种语言任务中的出色性能。这种架构是大多数现代语言系统的基础。[3]
扩散模型 通过逐步学习消除噪声，就像擦拭模糊的镜子直到人脸显现一样。其核心训练和采样思想引发了图像生成的蓬勃发展，现在也扩展到了音频和视频领域。[5]

您可以保存的微型词汇表📚

模型 ——一个参数化函数，我们对其进行训练以将输入映射到输出。
训练 ——优化参数以最大限度地减少样本损失。
过拟合 ——在训练数据上表现出色，但在其他数据上表现平平。
幻觉 ——流畅但内容与事实不符的表达。
RAG—— 检索增强生成，它参考最新的信息源。
一致性训练 ——塑造行为以遵循指令和规范。
安全 ——防止有害输出并管理整个生命周期中的风险。
推理 ——使用训练好的模型进行预测。
延迟 ——从输入到得到结果所需的时间。
护栏 ——围绕模型的策略、过滤器和控制。

太长了，没看完——结语🌯

什么是人工智能？ 一系列技术的集合，使计算机能够从数据中学习并智能地朝着目标行动。现代人工智能浪潮的核心是深度学习——尤其是用于语言的Transformer算法和用于媒体传播的Transformer算法。如果运用得当，人工智能可以扩展模式识别能力，加快创造性和分析性工作，并开启新的科学领域。但如果使用不当，它可能会误导他人、排斥异己或削弱信任。理想的人工智能发展路径是将强大的工程技术与治理、评估以及谦逊的态度相结合。这种平衡不仅是可能的——而且在合适的框架和规则下，它是可教授、可测试和可维护的。[2][3][4][5]

参考

[1] 大英百科全书 - 人工智能 (AI)：了解更多
[2] 《自然》杂志 - “深度学习”（LeCun、Bengio、Hinton）：了解更多
[3] arXiv - “注意力机制就是你所需要的一切”（Vaswani 等人）：了解更多
[4] 美国国家标准与技术研究院 (NIST) - 人工智能风险管理框架：了解更多
[5] arXiv - “扩散概率模型去噪”（Ho 等人）：了解更多

在官方人工智能助手商店查找最新人工智能产品

关于我们

返回博客