什么是人工智能?

什么是人工智能?

人工智能无处不在——你的手机、你的邮箱、地图导航、帮你撰写你半途而废的邮件。但人工智能究竟是什么?简而言之:它是一系列技术的集合,使计算机能够执行我们通常认为只有人类智能才能完成的任务,例如识别模式、进行预测以及生成语言或图像。这并非夸张的营销宣传,而是一个扎实的领域,它融合了数学、数据以及大量的试错。权威文献将人工智能定义为能够学习、推理并以我们认为智能的方式朝着目标行动的系统。[1]

您可能还想阅读以下文章:

🔗 什么是开源人工智能?
了解开源人工智能、其优势、许可模式和社区协作。

🔗 人工智能中的神经网络是什么?
学习神经网络基础知识、架构类型、训练方法和常见用途。

🔗 人工智能中的计算机视觉是什么?
了解机器如何解读图像、关键任务、数据集和应用程序。

🔗 什么是符号人工智能?
探索符号推理、知识图谱、规则和混合神经符号系统。


什么是人工智能:简明版🧠➡️💻

人工智能是一系列使软件能够模拟智能行为的方法。我们通常不会编写每条规则的代码,而是通过训练模型,使其能够泛化到新的情境中——例如图像识别、语音转文本、路线规划、代码助手、蛋白质结构预测等等。如果你想在笔记中记住一个简洁的定义:可以把它想象成执行与人类智力过程相关的任务的计算机系统,例如推理、发现意义和从数据中学习。[1]

该领域中一个有用的思维模型是将人工智能视为目标导向系统,该系统能够感知环境并选择行动——这在思考评估和控制回路时非常有用。[1]


人工智能的真正用途是什么✅

为什么选择人工智能而不是传统规则?

  • 模式识别能力——模型能够发现庞大数据集中的细微关联,而人类可能在午饭前都无法发现。

  • 适应性——随着数据量的增加,无需重写所有代码即可提高性能。

  • 规模化速度——一旦训练完成,模型就能快速稳定地运行,即使在数据量巨大的情况下也是如此。

  • 生成性——现代系统不仅可以对事物进行分类,还可以生成文本、图像、代码,甚至是候选分子。

  • 概率思维——与脆弱的 if-else 逻辑森林相比,它能更优雅地处理不确定性。

  • 使用工具——您可以将模型连接到计算器、数据库或搜索,以提高可靠性。

  • 它不好的地方在于——偏见、幻觉、过时的训练数据、隐私风险。我们会解决这些问题的。

说实话,有时候人工智能感觉像思维的自行车,有时候又像在碎石路上骑独轮车。两种说法都可能成立。


人工智能如何以人类的速度运行🔧

大多数现代人工智能系统都结合了以下要素:

  1. 数据——例如语言、图像、点击、传感器读数。

  2. 目标——损失函数,用来描述“好”的标准。

  3. 算法——训练模型以最小化损失的过程。

  4. 评估——测试集、指标、健全性检查。

  5. 部署——为模型提供监控、安全和防护措施。

两大传统:

  • 基于符号或逻辑的人工智能——显式规则、知识图谱、搜索。非常适合形式化推理和约束。

  • 统计或基于学习的人工智能——即从数据中学习的模型。深度学习正是基于此,也是近期最热门的研究领域;一篇被广泛引用的综述概述了从分层表示到优化和泛化的各个方面。[2]

在基于学习的人工智能领域,以下几个支柱至关重要:

  • 监督学习——从标记的例子中学习。

  • 无监督和自监督学习——从未标记数据中学习结构。

  • 强化学习——通过尝试和反馈进行学习。

  • 生成式建模——学习生成看起来很逼真的新样本。

你每天都会听到这两个富有创造力的家族的故事:

  • Transformer——大多数大型语言模型背后的架构。它利用注意力机制将每个词元与其他词元关联起来,从而实现并行训练并产生流畅的输出。如果你听说过“自注意力机制”,那就是其核心技巧。[3]

  • 扩散模型——它们学习逆转噪声过程,从随机噪声逐步恢复到清晰的图像或音频。这就像用微积分缓慢而小心地将一副扑克牌重新洗牌一样;基础性工作展示了如何有效地进行训练和采样。[5]

如果这些比喻显得牵强,那也无可厚非——人工智能是一个不断变化的目标。我们都在学习这支舞,而乐曲却在中途变换。


你每天都能在这里遇到人工智能📱🗺️📧

  • 搜索与推荐- 排名结果、信息流、视频。

  • 电子邮件和文档- 自动完成、摘要、质量检查。

  • 摄像头和音频- 降噪、HDR、转录。

  • 导航——交通预测、路线规划。

  • 支持与服务- 聊天客服人员负责分类和撰写回复。

  • 编码——建议、重构、测试。

  • 健康与科学——分诊、影像支持、结构预测。(将临床环境视为安全关键;采用人工监督和记录在案的局限性。)[2]

小例子:产品团队可能会对语言模型前的检索步骤进行 A/B 测试;错误率通常会下降,因为模型会基于更新鲜、更贴近任务的上下文进行推理,而不是靠猜测。(方法:预先定义指标,保留一组测试集,并比较完全相同的提示。)


优势、局限,以及两者之间的些许混乱⚖️

优势

  • 能够优雅地处理大型、杂乱的数据集。

  • 能够利用相同的核心机制完成各种任务。

  • 学习我们未曾人工设计的潜在结构。[2]

限制

  • 幻觉——模型可能会产生听起来合情合理但实际上不正确的输出。

  • 偏见——训练数据可能编码社会偏见,而系统随后会复制这些偏见。

  • 鲁棒性——极端情况、对抗性输入和分布偏移都可能导致系统崩溃。

  • 隐私与安全——如果不小心,敏感数据可能会泄露。

  • 可解释性——为什么会这样说?有时解释不清,这给审计工作带来了困难。

风险管理的存在是为了避免交付混乱的产品: NIST AI 风险管理框架提供了实用且自愿的指导,以提高设计、开发和部署过程中的可信度——例如,绘制风险图、衡量风险以及管理端到端的使用。[4]


道路交通规则:安全、管理和责任🛡️

法规和指导意见正在逐步跟上实践的步伐:

  • 基于风险的方法——高风险用途面临更严格的要求;文档记录、数据治理和事件处理至关重要。公共框架强调透明度、人工监督和持续监控。[4]

  • 行业细微差别——安全关键领域(如医疗健康)需要人为干预和仔细评估;通用工具仍然需要清晰的预期用途和局限性文档。[2]

这并不是要扼杀创新;而是不要把你的产品变成图书馆里的爆米花机……这听起来很有趣,但实际上却并非如此。


人工智能在实践中的类型及示例🧰

  • 感知——视觉、语音、传感器融合。

  • 语言——聊天、翻译、摘要、提取。

  • 预测——需求预测、风险评分、异常检测。

  • 规划与控制——机器人技术、物流。

  • 生成——图像、音频、视频、代码、结构化数据。

其底层数学原理依赖于线性代数、概率论、优化和计算栈,这些都保证了整个系统的流畅运行。如需更深入地了解深度学习的基础理论,请参阅权威综述。[2]


对比表格:热门AI工具一览🧪

(故意略有瑕疵。价格会变动。实际效果可能因人而异。)

工具 最适合 价格 为什么它效果很好
聊天式法学硕士 写作、问答、构思 免费 + 付费 强大的语言建模;工具接口
图像生成器 设计、情绪板 免费 + 付费 扩散模型在视觉效果方面表现出色
代码副驾驶 开发者 付费试用 基于代码语料库训练;快速编辑
向量数据库搜索 产品团队,支持 因情况而异 检索事实以减少偏差
语音工具 会议,创作者 免费 + 付费 ASR + TTS 清晰得令人惊讶
分析人工智能 运营、财务 企业 无需200个电子表格即可进行预测
安全工具 合规与治理 企业 风险映射、日志记录、红队演练
设备上的微型设备 移动端、隐私人士 相对自由 低延迟;数据保留在本地

如何像专业人士一样评估人工智能系统🧪🔍

  1. 明确工作内容——用一句话描述工作任务。

  2. 选择指标——准确率、延迟、成本、安全触发。

  3. 制作一个测试集——具有代表性、多样化、独立存在。

  4. 检查故障模式——系统应拒绝或升级的输入。

  5. 检验是否存在偏差——在适用情况下,检验人口统计切片和敏感属性。

  6. 人工参与——明确何时需要人工审核。

  7. 日志和监控- 漂移检测、事件响应、回滚。

  8. 文档——数据来源、局限性、预期用途、风险提示。NIST AI RMF 为您提供了这方面的通用语言和流程。[4]


我经常听到的一些常见误解🙃

  • “这只是复制。”训练过程学习统计结构;生成过程则根据该结构构建新的输出。这可能具有创造性——也可能是错误的——但它不是复制粘贴。[2]

  • “人工智能像人一样理解事物。”进行建模。有时这看起来像是理解;有时则像是一种自信的模糊状态。[2]

  • “越大越好。”规模固然重要,但数据质量、对齐方式和检索效率往往更为关键。[2][3]

  • “一个AI就能统治一切。”真正的技术栈是多模型的:事实检索、文本生成、设备上的小型快速模型,以及经典的搜索。


更深入地了解一下:变形金刚和扩散,一分钟搞定⏱️

  • Transformer通过计算词元之间的注意力分数来决定关注点。堆叠层可以捕捉长程依赖关系而无需显式递归,从而实现高并行性和在各种语言任务中的出色性能。这种架构是大多数现代语言系统的基础。[3]

  • 扩散模型通过逐步学习消除噪声,就像擦拭模糊的镜子直到人脸显现一样。其核心训练和采样思想引发了图像生成的蓬勃发展,现在也扩展到了音频和视频领域。[5]


您可以保存的微型词汇表📚

  • 模型——一个参数化函数,我们对其进行训练以将输入映射到输出。

  • 训练——优化参数以最大限度地减少样本损失。

  • 过拟合——在训练数据上表现出色,但在其他数据上表现平平。

  • 幻觉——流畅但内容与事实不符的表达。

  • RAG——检索增强生成,它参考最新的信息源。

  • 一致性训练——塑造行为以遵循指令和规范。

  • 安全——防止有害输出并管理整个生命周期中的风险。

  • 推理——使用训练好的模型进行预测。

  • 延迟——从输入到得到结果所需的时间。

  • 护栏——围绕模型的策略、过滤器和控制。


太长了,没看完——结语🌯

什么是人工智能?一系列技术的集合,使计算机能够从数据中学习并智能地朝着目标行动。现代人工智能浪潮的核心是深度学习——尤其是用于语言的Transformer算法和用于媒体传播的Transformer算法。如果运用得当,人工智能可以扩展模式识别能力,加快创造性和分析性工作,并开启新的科学领域。但如果使用不当,它可能会误导他人、排斥异己或削弱信任。理想的人工智能发展路径是将强大的工程技术与治理、评估以及谦逊的态度相结合。这种平衡不仅是可能的——而且在合适的框架和规则下,它是可教授、可测试和可维护的。[2][3][4][5]


参考

[1]大英百科全书 - 人工智能 (AI)了解更多
[2] 《自然》杂志 - “深度学习”(LeCun、Bengio、Hinton)了解更多
[3] arXiv - “注意力机制就是你所需要的一切”(Vaswani 等人)了解更多
[4]美国国家标准与技术研究院 (NIST) - 人工智能风险管理框架了解更多
[5] arXiv - “扩散概率模型去噪”(Ho 等人)了解更多

在官方人工智能助手商店查找最新人工智能产品

关于我们

返回博客