盘点人工智能十大经典应用领域、图解技术原理

本文将使用“算法”一词，以高度简化的方式来描述单个算法、模型或者使用多种算法的软件。在每个类别中，逐一讨论数据输入的类型、作为黑箱的算法以及输出（为了简便易行，即使真实算法不是黑箱也暂且把它当成黑箱）。

因为这是高层次的概述，所以我鼓励你深入研究感兴趣的具体应用，搞清楚它们究竟是如何应用于行业或者业务活动的。目前也有很多资源可供使用，以学习所涉及的技术细节和具体算法。

01 预测分析

预测是预测分析或者预测建模的同义词，这是根据有标签，以及有时甚至无标签的输入数据来判断输出数据的过程。在机器学习和人工智能中，预测分析可以进一步细分为回归和分类。

下面将对使用有标签数据（有监督）进行预测的两个子类进行讨论。

1. 回归

图1-1展示了在回归方法中输入有标签数据，经预测模型处理，然后从连续数列中生成数值的过程（例如股市的闭市价）。

▲图1-1：回归

应用包括客户全周期的股票价值和净利润、收入及其增长预测、价格变动、信贷违约风险以及股票交易计算。

2. 分类

分类指的是输入有标签数据，经过分类模型处理后，把输入数据分成一类或多类的过程，如图1-2所示。

▲图1-2：分类

垃圾邮件过滤器是二元分类应用的标准案例。电子邮件是经分类模型处理后的输入数据，输出数据是确定了的垃圾邮件或者非垃圾邮件，非垃圾邮件专指那些不含垃圾内容的好邮件。垃圾邮件会被送入垃圾箱，而非垃圾邮件则被送入收件箱。

假如引入第三个类别“不确定”，那么分类器现在就可以把输入的邮件分成三类。因为超过了两个类别，所以这是多元分类的例子。在该例子中，电子邮件的客户端可能有“疑似垃圾邮件”的文件夹供用户审查每封邮件，并以此训练分类器更好地区分垃圾与非垃圾邮件。

如果要把输入数据分成三类或更多类，那么算法可以为输入数据选择单一类别或者计算输入数据属于每个类别的概率。在后一种情况下，可以采用概率最大的类别作为选择的结果，或者采用所有类别的概率来按你自己定制的规则处理。

在这种情况下，假定一封刚收到的邮件被确定有85%的可能性是垃圾邮件，10%的可能性是非垃圾邮件，5%的可能性为不确定。因为是垃圾邮件的可能性最高，因此可以判定该邮件为垃圾邮件，或者以其他方式来使用计算出的概率。

最后，某些算法可以为同一输入分配多个标签。这里有一个与图像识别相关的例子，假设输入的数据是红苹果的图像，那么算法可以为该图像分配红色、苹果和水果等多个不同的标签。该案例为图像分配所有三个类别的做法是合适的。

应用包括信用风险、贷款审批和客户流失。分类可以与本文后续讨论的识别应用相结合。

02 个性化和推荐系统

推荐系统是依据现有信息进行推荐的一种个性化形式，其结果与各个用户甚为相关。其可以用来提高客户转化率、销售率、满意度和留存率。事实上，亚马逊就是通过增加这些引擎把营业收入提高了35%, 75%的Netflix观赏节目也来自于这样的推荐。

推荐系统是一种特别的信息过滤系统。也可以通过用户搜索、排名和评分的办法来完成个性化。推荐系统根据诸如商品或者用户等的输入数据，经过推荐模型或者引擎的处理来完成推荐（例如产品、文章、音乐、电影），如图2所示。

▲图2：推荐系统

值得一提的是与推荐系统相关的“冷启动问题”。冷启动是指智能应用尚未拥有足够的信息来为特定用户或者群体做出高度个性化和关联度的推荐。例如，用户尚未产生关于它们的偏好、兴趣或购买历史的信息。

另一个例子是当商品（例如衣服、产品、视频、歌曲）刚刚面世的时候。有几种技术有助于解决这个问题，但因篇幅所限就不深入讨论了。

推荐系统应用包括推荐产品、视频、音乐、歌曲、书籍和电视节目（例如亚马逊、Netflix、Spotify）。除了推荐以外，也包括个性化的内容，包括新闻、报道、电邮和定向广告（例如推特）。

其他的案例还包括个性化医疗计划、个性化图像和图标（例如YouTube、Netflix、Yelp）、葡萄酒推荐、个性化购物（例如完美的夹克衫搭配）、时尚穿搭（例如StitchFix）以及全套的自动化推荐。

03 计算机视觉

计算机视觉是一个广阔的领域，它包括涉及诸如图像和视频之类视觉信息的模式识别（下一节将讨论另外一种技术）。计算机视觉以照片、静止的视频图像和一系列图像（视频）作为输入，经过模型的处理，产生输出，如图3所示。

▲图3：计算机视觉

输出可以是识别、检测和发现某个目标、特征或者活动。视觉相关的应用隐含着一定程度的自动化，特别是自动化视觉，通常需要人在应用中参与（例如检查）。机器视觉一词用来描述在工业应用中的类似或者有一定重叠度的技术，诸如检查、过程控制、测量和机器人。

计算机视觉有许多有趣而且强大的应用，同时应用场景也在快速增加。例如，可以在下述场景中使用计算机视觉：

视频分析和内容筛选
唇读
指挥自动化机器（例如汽车和无人机）
视频识别和描述
视频字幕
识别像拥抱和握手之类的人际交互动作
机器人及其控制系统
人群密度估算
清点人数（例如排队、基础设施规划、零售）
检查与质量控制
零售客户步行路径分析以及参与度分析

无人航空器（UAV）经常被称为无人机。通过应用计算机视觉，无人机能够执行检查（例如石油管道、无线信号塔）、完成建筑和区域搜索、帮助制作地图和送货。计算机视觉现在正广泛应用于公安、安保和监控。当然，这类应用也要注意符合伦理道德，保护人们的利益。

计算机视觉还有最后一件事值得一提。通过看、闻、听、触和味五大感觉，人类能够感知环境和周围的世界。感官捕获信息，然后传递到神经系统进行转换，同时也决定应该采取什么行动或者应该做出什么样的反应。计算机视觉是对特定人工智能应用视觉的一种类比。

04 模式识别

模式识别涉及输入非结构化数据，经过模型处理，继而检测是否存在某种特定的模式（检测），然后为识别出的模式分配一个类别（分类），或者发现所识别模式的主题（识别），如图4-1所示。

▲图4-1：模式识别

这些应用的输入可以包括图像（包括视频——一系列静止的图像）、音频（例如讲话、音乐和声音）和文本�շ�,��。文本可以根据其特性进一步细分为电子、手写或者打印（例如纸、支票、车牌号）。

以图像为输入的目的可能是检测目标、识别目标、发现目标，或者三者皆有。人脸识别就是一个好例子。训练模型来检测图像中的人脸，并对检测到的目标进行分类，打上人的标签，这就是目标检测的例子，这里的目标是未经识别的人脸。

“检测”用来指代所发现的不同于背景的目标。其也包括对目标位置的测量和围绕被检测目标边际框的具体测量。识别是指为检测到的目标分类或打标签的过程（在本案例中是人脸），识别会更进一步，并为所识别的人脸分配一个身份。图4-2呈现了一些图像识别的案例。

▲图4-2：图像识别与检测

诸如人脸识别这样的生物特征识别技术可以用来为图中的人自动打标签。生物特征识别的另外一种形式是根据指纹来识别。

其他的应用包括：

读出视频和音频中的文字
在图像上打标签和分类
汽车保险中基于图像来评估汽车受损程度
从视频和音频中提取信息
基于面部和声音的情感识别
面部表情识别

音频识别的应用包括：

语音识别
将语音转换为文本
分离并识别出讲话者
基于声音、实时客服和销售电话的情感智能分析
伐木和森林砍伐声音检测
缺陷检测（例如制造过程中的缺陷或零配件失效）

最后，手写或打印的文本可以通过光学字符识别（OCR）和手写字符识别转换为电子文档。文档也可以转换为语音，但这被认为更可能是人工智能的生成性应用，而不是识别性应用。本文稍后会讨论生成性应用。

05 聚类和异常检测

图5中所示的聚类和异常检测是两种最常见的无监督机器学习技术。它们也被认为是模式识别技术。

▲图5：聚类和异常检测

上一篇：收集最全的工业软件大集合

下一篇：一款组学数据分析软件：GeneSpring GX

推荐资讯

推荐站点