九游官方网页版-九游(中国)





    1. 咨(zī)询(xún)热线:021-80392549

      九游官方网页版-九游(中国) QQ在线 九游官方网页版-九游(中国) 企(qǐ)业(yè)微信
      九游官方网页版-九游(中国)
      九游官方网页版-九游(中国) 资讯 > AI挖掘(jué)技术 > 正文

      常(cháng)见的(de)机器学(xué)习算法

      2020/06/01天极网3638

      常(cháng)见的机器学习算法(fǎ)

      诞生于1956年的人工智能,由于受到智能算法、计算速度、存(cún)储水平等因素的影响,在六十多年的(de)发展过程(chéng)中经历了(le)多次高潮和低谷。最近几年,得益(yì)于数据量的上涨、运算力的提升,特别是机器学(xué)习新算(suàn)法的(de)出现,人(rén)工智能迎来了(le)大爆发的时代。

      常见的(de)机器(qì)学习算法

      提到机器学(xué)习这(zhè)个词时,有(yǒu)些人首先想到的可能是科幻电影里的机器人(rén)。事实上,机器学习是一门多领域交叉(chā)学科,涉及概率论、统计学、算法复杂度理论等多(duō)门学科。专门研究(jiū)计算机如何模拟或(huò)实现人类的学习行(háng)为,利用数据或以往的经验,以此优(yōu)化计算机程(chéng)序的性能标准(zhǔn)。

      根据学习任务的不同,我们(men)可以将机器学习分为(wéi)监督学习、非监督(dū)学(xué)习、强化(huà)学习三种类型,而每种类型又(yòu)对应着一(yī)些算法。

      各种算法以及对应(yīng)的(de)任务类(lèi)型

      接下来就简单介绍几种(zhǒng)常用的机器学习算法及其应用场景,通过本篇文章大(dà)家可以对机器(qì)学习的常用算法有个常识性的认识。

      一(yī)、监督学习

      (1)支(zhī)持向量机(Support Vector Machine,SVM):是一类(lèi)按(àn)监督学习方式对数(shù)据进行二元分类的广义线性分类器(qì),其决策边界是对学习样本求解的最大(dà)边距超平(píng)面。例如,在纸(zhǐ)上有两(liǎng)类线性可分的(de)点,支持(chí)向量机会寻找一条直线将这两类点区分开来,并且(qiě)与这(zhè)些点的距离都尽可能远。

      常见的机器学习算法

      优点:泛(fàn)化错误率低(dī),结(jié)果(guǒ)易(yì)解释。

      缺(quē)点:对(duì)大规模训练样本(běn)难以实(shí)施,解(jiě)决多分(fèn)类问题存在困难,对参数(shù)调节和(hé)核函数(shù)的(de)选择敏感。

      应用场景:文本分类、人像识别、医学诊断等。

      (2)决(jué)策树(Decision Tree):是一个预(yù)测模型,代表的(de)是对象属性(xìng)与对象值之间的一(yī)种(zhǒng)映(yìng)射关(guān)系(xì)。下图(tú)是如何在决策树中建模的简单(dān)示例:

      常见(jiàn)的机器学习算法

      优点(diǎn):易于理解和解释,可以可视化分析,容易提取出规则(zé);能够处理不相(xiàng)关的特(tè)征。

      缺点:对缺失数据处理比较(jiào)困难。

      应(yīng)用场景:在决策过程(chéng)应用较多(duō)。

      (3)朴素贝叶(yè)斯分类(Naive Bayesian classification):对于给(gěi)出的待分类项,求(qiú)解此项出(chū)现的条件下(xià)各个类别出现的概率(lǜ),哪(nǎ)个最大,就认(rèn)为此(cǐ)待(dài)分类属于哪个类别。贝叶斯公式为:p(A|B)= p(B|A)*p(A/p(B),其(qí)中P(A|B)表(biǎo)示后验(yàn)概率,P(B|A)是(shì)似然值,P(A)是类别的先验概率(lǜ),P(B)代表预测器的先验概率。

      优点:在(zài)数据较少(shǎo)的情况下仍然有效,可(kě)以处理多(duō)类别问题。

      缺(quē)点:对输入数据的(de)准备(bèi)方式(shì)较为敏感。

      应用(yòng)场景:文本分类、人脸识别、欺诈检测。

      (4)k-近邻算法(K-Nearest Neighbor,KNN):是一(yī)种(zhǒng)基于实(shí)例(lì)的学习,采用测量不同特(tè)征(zhēng)值之间的距离(lí)方法进行分类。其(qí)基本思路是:给(gěi)定一(yī)个训练样(yàng)本(běn)集(jí),然后输(shū)入没有标签的新(xīn)数据,将新(xīn)数据的(de)每(měi)个特征与样本集中数(shù)据对应的特征(zhēng)进(jìn)行比较,找到最邻近(jìn)的k个(通常是(shì)不大(dà)于20的整(zhěng)数)实例,这(zhè)k个实例的多数(shù)属于某(mǒu)个(gè)类,就把该输入实例分类到这个类中。

      优点:简(jiǎn)单、易于(yú)理解(jiě)、易于实现(xiàn),无(wú)需估(gū)计参数。此外,与(yǔ)朴(pǔ)素贝叶斯之类的算(suàn)法比,无数(shù)据输入(rù)假定、准确度(dù)高、对(duì)异常数据值不敏感。

      缺点(diǎn):对于训练数(shù)据(jù)依赖程(chéng)度比较大,并且缺少训练阶段,无法应对多样本(běn)。

      应用场景:字符识别、文本(běn)分类、图像识别等领域。

      二、非监督学习

      (1)主成分分析(Principal Component Analysis,PCA):是一种统计方法(fǎ)。其主(zhǔ)要思想是将n维特(tè)征映射到k维上,这k维是(shì)全新的正交特征也被称为主成分(fèn),是在原有n维特征的基(jī)础上(shàng)重(chóng)新构造出来的k维特征。

      常见的机器学习算法

      优点:降(jiàng)低(dī)数据的复杂性,识别最重要的多个(gè)特(tè)征。

      缺点:主(zhǔ)成(chéng)分(fèn)各个特征维度的含义具有一定的模糊性,不如原(yuán)始(shǐ)样本特征的解释性强;有可能损失有用的信息。

      应用场(chǎng)景:语音、图像、通信(xìn)的分析(xī)处理。

      (2)奇异值分解(Singular Value Decomposition,SVD):可以将一个比较(jiào)复杂的矩阵用更小更简单的(de)几个子矩阵的相乘来表示,这些小矩阵描述的是矩阵的重要的特(tè)性(xìng)。

      优点(diǎn):简化数据,去除噪声(shēng)点(diǎn),提高算法的(de)结果。

      缺点:数据的转换可能(néng)难(nán)以(yǐ)理解。

      应用(yòng)场景:推荐系统、图(tú)片压缩等。

      (3)K-均值聚类(lèi)(K-Means):是一种迭代求解的聚类分析算法,采用距离(lí)作为相似性指(zhǐ)标。其(qí)工作流(liú)程(chéng)是随机确定K个对(duì)象作为初始的聚类中心,然后计算(suàn)每个对象与(yǔ)各个种(zhǒng)子聚类中心之间的距离,把每个(gè)对象分配给距离它最近的聚类(lèi)中心。

      常见的机器学习算法

      优点:算法简单容易实现。

      缺点:可能收敛到局部最小值,在大规模数据集上(shàng)收敛较慢。

      应用场(chǎng)景:图(tú)像处理、数据分析以及市场研究等。

      三、强化学习

      Q-learning:是一(yī)个(gè)基于值(zhí)的强化学习算法,它根据动作值函数评估应该选择哪个动(dòng)作,这个函(hán)数决定了处于某一个(gè)特定状态以及在该状态下采取特定动作的(de)奖(jiǎng)励期望值。

      优(yōu)点:可以接(jiē)收更广(guǎng)的(de)数据范围。

      缺点:缺乏通(tōng)用性(xìng)。

      应用(yòng)场景:游戏(xì)开发。

      以上就是(shì)文(wén)章的(de)全部内容,相(xiàng)信大家对常用的机器学习算法应该有了大致的(de)了(le)解。

      现如今,我们越来(lái)越多地看(kàn)到机器学习算(suàn)法为人类(lèi)带(dài)来的实际价值,如它们提(tí)供了关键(jiàn)的洞察力和(hé)信息来报告战略决(jué)策。可以肯定的是,随着机器学习越来越流(liú)行,未来还将出现越来越多能很(hěn)好(hǎo)地(dì)处理任务的(de)算法。

      关键词: AI挖掘技术




      AI人(rén)工智能(néng)网声(shēng)明(míng):

      凡资讯来源注明为(wéi)其他媒体来源的信息,均(jun1)为转载自其(qí)他(tā)媒(méi)体,并不代(dài)表本网(wǎng)站赞同其观点,也不代(dài)表(biǎo)本网站对其真实性负责。您若对该文(wén)章内容(róng)有任(rèn)何疑(yí)问或质(zhì)疑,请(qǐng)立即(jí)与(yǔ)网站(www.baise.yingtan.bynr.xinxiang.zz.pingliang.ww38.viennacitytours.com)联系,本网站将(jiāng)迅速(sù)给(gěi)您回应并(bìng)做处理。


      联(lián)系电(diàn)话:021-31666777   新(xīn)闻、技(jì)术文(wén)章投稿QQ:3267146135   投稿(gǎo)邮箱:syy@gongboshi.com

      工博士人(rén)工智能网
      九游官方网页版-九游(中国)
      扫(sǎo)描二维码关注微信
      扫码反馈(kuì)

      扫(sǎo)一扫,反馈当前页面

      咨(zī)询反馈
      扫码关注

      微信公众号(hào)

      返回顶部

      九游官方网页版-九游(中国)

      九游官方网页版-九游(中国)