什么是机器学习,机器学习与人工智能(二)机器学习的类型
机器学习是人工智能的一个分支,专注于开发模型和算法,让计算机从数据中学习并从以前的经验中改进,而无需为每项任务进行显式编程。简而言之,机器学习通过从数据中学习,教会系统像人类一样思考和理解。
机器学习 通常是一种从过去的经验中学习并随着时间的推移提高性能的培训系统。机器学习有助于预测大量数据。它有助于提供快速、准确的结果以获得盈利机会。
机器学习的类型
机器学习有多种类型,每种类型都有特殊的特征和应用。机器学习算法的一些主要类型如下:
- 监督机器学习
- 无监督机器学习
- 半监督机器学习
- 强化学习
![image-20240212173156660](/Users/oo7/Library/Application Support/typora-user-images/image-20240212173156660.png)
1.监督机器学习
监督学习的定义是模型在**“标记数据集”上进行训练。标记数据集具有输入和输出参数。在监督学习**中,算法学习在输入和正确输出之间映射点。它具有标记的训练和验证数据集。
我们通过一个例子来理解它。
示例: 考虑一个场景,我们构建图像分类器来区分猫和狗。如果将狗和猫标记图像的数据集提供给算法,机器将学习从这些标记图像中对狗或猫进行分类。当我们输入它以前从未见过的新的狗或猫图像时,它会使用学习到的算法并预测它是狗还是猫。这就是监督学习的 工作原理,尤其是图像分类。
监督学习主要有两类:
- 分类
- 回归
分类
分类: 涉及预测代表离散 类别或标签的分类目标变量。例如,将电子邮件分类为垃圾邮件或非垃圾邮件,或者预测患者是否患有心脏病的高风险。分类算法学习将输入特征映射到预定义的类之一。
以下是一些分类算法:
- 逻辑回归
- 支持向量机
- 随机森林
- 决策树
- K 最近邻 (KNN)
- 朴素贝叶斯
回归
另一方面,回归处理预测代表数值的连续目标变量。例如,根据房屋的大小、位置和便利设施来预测房屋的价格,或预测产品的销量。回归算法学习将输入特征映射到连续数值。
以下是一些回归算法:
- 线性回归
- 多项式回归
- 岭回归
- 套索回归
- 决策树
- 随机森林
监督机器学习的优点
- 监督学习模型可以具有很高的准确性,因为它们是根据标记数据进行训练的。
- 监督学习模型中的决策过程通常是可解释的。
- 它通常可用于预训练模型,这在从头开始开发新模型时可以节省时间和资源。
监督机器学习的缺点
- 它在了解模式方面存在局限性,并且可能会遇到训练数据中不存在的看不见或意外的模式。
- 由于它仅依赖于标记数据,因此可能非常耗时且成本高昂。
- 它可能会导致基于新数据的概括不佳。
监督学习的应用
监督学习有广泛的应用,包括:
- 图像分类:识别图像中的物体、人脸和其他特征。
- **自然语言处理:**从文本中提取信息,例如情感、实体和关系。
- 语音识别:将口语转换为文本。
- 推荐系统:向用户做出个性化推荐。
- 预测分析:预测结果,例如销售、客户流失和股票价格。
- 医疗诊断:检测疾病和其他医疗状况。
- 欺诈检测:识别欺诈交易。
- 自动驾驶车辆:识别环境中的物体并做出反应。
- 电子邮件垃圾邮件检测:将电子邮件分类为垃圾邮件或非垃圾邮件。
- 制造中的质量控制:检查产品是否存在缺陷。
- 信用评分:评估借款人拖欠贷款的风险。
- 游戏:识别角色、分析玩家行为并创建 NPC。
- 客户支持:自动化客户支持任务。
- 天气预报:预测气温、降水和其他气象参数。
- 体育分析:分析球员表现、做出比赛预测并优化策略。
2.无监督机器学习
无监督学习无监督学习是一种机器学习技术,其中算法使用未标记的数据发现模式和关系。与监督学习不同,无监督学习不涉及为算法提供标记的目标输出。无监督学习的主要目标通常是发现数据中隐藏的模式、相似性或聚类,然后将其用于各种目的,例如数据探索、可视化、降维等。
让我们通过一个例子来理解它。
**示例:**假设我们有一个数据集,其中包含有关从商店购买的信息。通过聚类,该算法可以将您和其他客户之间的相同购买行为分组,从而揭示没有预定义标签的潜在客户。此类信息可以帮助企业获得目标客户并识别异常值。
无监督学习主要有两类:
- Clustering (聚类)
- Association (关联分析)
Clustering
Clustering 是根据数据点的相似性将数据点分组为簇的过程。该技术可用于识别数据中的模式和关系,而无需标记示例。
以下是一些 Clustering 算法:
- K-均值聚类算法
- 均值漂移算法
- DBSCAN算法
- 主成分分析
- 独立成分分析
Association
Association 是一种发现数据集中项目之间关系的技术。它识别规则,指示一个项目的存在意味着以特定概率存在另一项目。
无监督机器学习的优点
- 它有助于发现隐藏的模式和数据之间的各种关系。
- 用于客户细分、异常检测和数据探索等任务。
- 它不需要标记数据,减少了数据标记的工作量。
无监督机器学习的缺点
- 如果不使用标签,可能很难预测模型输出的质量。
- 聚类的可解释性可能不清楚,并且可能没有有意义的解释。
- 它具有自动编码器和降维等技术,可用于从原始数据中提取有意义的特征。
无监督学习的应用
以下是无监督学习的一些常见应用:
- 聚类:将相似的数据点分组为聚类。
- 异常检测:识别数据中的异常值或异常值。
- 降维:降低数据的维度,同时保留其基本信息。
- 推荐系统:根据用户的历史行为或偏好向他们推荐产品、电影或内容。
- 主题建模:发现文档集合中的潜在主题。
- 密度估计:估计数据的概率密度函数。
- 图像和视频压缩:减少多媒体内容所需的存储量。
- 数据预处理:帮助完成数据预处理任务,例如数据清理、缺失值插补和数据缩放。
- 市场购物篮分析:发现产品之间的关联。
- 基因组数据分析:识别具有相似表达谱的模式或基因组。
- 图像分割:将图像分割成有意义的区域。
- 社交网络中的社区检测:识别具有相似兴趣或联系的社区或个人群体。
- 客户行为分析:发现模式和见解,以提供更好的营销和产品推荐。
- 内容推荐:对内容进行分类和标记,以便更轻松地向用户推荐相似的项目。
- 探索性数据分析 (EDA):在定义特定任务之前探索数据并获得见解。
3.半监督学习
半监督学习是一种介于监督学习和无监督学习之间的机器学习算法,因此它同时使用标记和未标记数据。当获取标记数据成本高昂、耗时或资源密集时,它特别有用。当数据集昂贵且耗时时,此方法非常有用。当标记数据需要技能和相关资源来训练或学习时,选择半监督学习。
当我们处理有一点标记的数据而其余大部分未标记时,我们会使用这些技术。我们可以使用无监督技术来预测标签,然后将这些标签提供给监督技术。该技术主要适用于通常所有图像都未标记的图像数据集的情况。
让我们通过一个例子来理解它。
示例:考虑到我们正在构建一个语言翻译模型,为每个句子对添加标签翻译可能会占用大量资源。它允许模型从标记和未标记的句子对中学习,使它们更加准确。这项技术显着提高了机器翻译服务的质量。
半监督学习方法的类型
有许多不同的半监督学习方法,每种方法都有自己的特点。一些最常见的包括:
- 基于图的半监督学习: 这种方法使用图来表示数据点之间的关系。然后使用该图将标签从标记的数据点传播到未标记的数据点。
- 标签传播: 这种方法根据数据点之间的相似性,迭代地将标签从标记的数据点传播到未标记的数据点。
- 协同训练: 这种方法在未标记数据的不同子集上训练两种不同的机器学习模型。然后使用这两个模型来标记彼此的预测。
- 自训练: 这种方法在标记数据上训练机器学习模型,然后使用该模型来预测未标记数据的标签。然后根据标记数据和未标记数据的预测标签重新训练模型。
- 生成对抗网络(GAN): GAN 是一种深度学习算法,可用于生成合成数据。GAN 可用于通过训练两个神经网络(一个生成器和一个判别器)来生成用于半监督学习的未标记数据。
半监督机器学习的优点
- 与监督学习相比,它具有更好的泛化能力,因为它同时采用标记数据和未标记数据。
- 可适用于广泛的数据。
半监督机器学习的缺点
- 与其他方法相比,半监督方法的实施可能更加复杂。
- 它仍然需要一些可能并不总是可用或容易获得的标记数据。
- 未标记的数据会相应地影响模型性能。
半监督学习的应用
以下是半监督学习的一些常见应用:
- 图像分类和对象识别:通过将一小组标记图像与大量未标记图像相结合来提高模型的准确性。
- 自然语言处理(NLP):通过将一小组标记文本数据与大量未标记文本相结合来增强语言模型和分类器的性能。
- **语音识别:**通过利用有限数量的转录语音数据和更广泛的未标记音频集来提高语音识别的准确性。
- 推荐系统:通过用大量未标记的用户行为数据补充一组稀疏的用户-项目交互(标记数据)来提高个性化推荐的准确性。
- 医疗保健和医学成像:通过利用一小组标记的医学图像和大量未标记的图像来增强医学图像分析。
4. 强化机器学习
强化机器学习算法是一种通过产生动作和发现错误来与环境交互的学习方法。尝试、错误和延迟是强化学习最相关的特征。在这种技术中,模型使用奖励反馈来学习行为或模式,不断提高其性能。这些算法针对特定问题,例如谷歌自动驾驶汽车、AlphaGo,其中机器人与人类甚至自身竞争,以在围棋游戏中获得越来越好的表现。每次我们输入数据时,他们都会学习并将数据添加到他们的知识中,即训练数据。因此,它学得越多,训练得越好,经验也就越丰富。
以下是一些最常见的强化学习算法:
- Q-learning:Q-learning 是一种无模型的 RL 算法,它学习 Q 函数,将状态映射到动作。Q 函数估计在给定状态下采取特定操作的预期奖励。
- SARSA(状态-动作-奖励-状态-动作): SARSA 是另一种学习 Q 函数的无模型 RL 算法。然而,与 Q 学习不同的是,SARSA 更新了实际采取的动作的 Q 函数,而不是最优动作。
- deep-q-learning:深度Q学习是Q学习和深度学习的结合。深度 Q 学习使用神经网络来表示 Q 函数,这使得它能够学习状态和动作之间的复杂关系。
让我们借助示例来理解它。
**示例:**假设您正在训练人工智能代理玩国际象棋等游戏。代理探索不同的动作,并根据结果接收积极或消极的反馈。强化学习还找到了一些应用,让他们通过与周围环境的交互来学习执行任务。
强化机器学习的类型
强化学习主要有两种类型:
正强化
- 奖励代理采取所需的行动。
- 鼓励代理人重复该行为。
- 示例:奖励坐下的狗,在游戏中回答正确答案即可得分。
负强化
- 消除不良刺激以鼓励期望的行为。
- 阻止代理重复该行为。
- 示例:按下控制杆时关闭响亮的蜂鸣器,通过完成任务来避免处罚。
强化机器学习的优点
- 它具有非常适合任务的自主决策能力,并且可以学习做出一系列决策,例如机器人和玩游戏。
- 这种技术是实现很难实现的长期结果的首选。
- 它用于解决传统技术无法解决的复杂问题。
强化机器学习的缺点
- 训练强化学习代理的计算成本可能很高且耗时。
- 强化学习并不比解决简单问题更可取。
- 它需要大量数据和大量计算,这使得它不切实际且成本高昂。
强化机器学习的应用
以下是强化学习的一些应用:
- 玩游戏:强化学习可以教智能体玩游戏,甚至是复杂的游戏。
- 机器人技术:强化学习可以教机器人自主执行任务。
- 自动驾驶汽车:强化学习可以帮助自动驾驶汽车导航和做出决策。
- 推荐系统:强化学习可以通过学习用户偏好来增强推荐算法。
- 医疗保健:强化学习可用于优化治疗计划和药物发现。
- 自然语言处理(NLP):强化学习可用于对话系统和聊天机器人。
- 金融和交易:RL 可用于算法交易。
- 供应链和库存管理:强化学习可用于优化供应链运营。
- 能源管理:RL 可用于优化能源消耗。
- 游戏人工智能:强化学习可用于在视频游戏中创建更智能、更具适应性的 NPC。
- 自适应个人助理:强化学习可用于改进个人助理。
- **虚拟现实 (VR) 和增强现实 (AR):**强化学习可用于创建身临其境的交互式体验。
- 工业控制:强化学习可用于优化工业流程。
- 教育:强化学习可用于创建自适应学习系统。
- 农业:RL 可用于优化农业运营。