-->

左耳听风_087_86_程序员练级攻略机器学习和人工智能

你好,我是陈浩网名做尔多house.我之前呢写过一篇机器学习的入门文章啊,因为我也是在入门和在学习的人,所以那篇文章和这一篇机器学习和人工智能方向的文章呢,可能都会有点太肤浅了。

那如果你有更好的学习方式或者资料,欢迎补充。

那我们先来介绍一下机器学习的基本原理。

机器学习呢主要有两种方式,一种是监督式学习啊,另一种呢是非监督式学习。

那接下来我简单说一下这两者的不同点。

首先我们来说监督式学习。

那所谓的监督式学习呢,也就是说我们需要提供一组学习样本啊,包括相关的特征数据和相应的标签。

那我们的程序呢就可以通过这组样本来学习相关的规律或者模式。

然后呢,通过得到的规律或者模式来判断没有被打过标签的数据是什么样的数据。

嗯,举个例子,假设我需要识别一些手写的数字,我们要找到尽可能多的手写体数字的图像样本,然后人工或者是通过某种算法来明确的标注上啊,哪些是这些手写体的图片,谁是一,谁是二,谁是三。

那这组数据呢就叫做样本数据,又叫训练数据。

然后呢,我通过机器学习的算法啊,找到每个数字在不同手写体下的特征,找到规律或者模式。

那通过得到的规律或者模式啊,来识别那些没有被打过标签的手写数据,以此来完成识别手写体数字的目的。

而对于非建筑式学习呢啊也就是说数据啊是没有被标注过的。

所以相关的机器学习算法需要找到这些数据中的共性啊,因为大量的数据是没有被标识过的,所以呢这种学习方式可以让大量的未标识的数据能够更有价值。

而且呢非监督式学习啊,可以帮我们找到人类很难发现的数据里的规律或者模型。

所以呢也有人把这种学习叫做特征点学习,它可以让我们自动的给数据进行分类,并找到分类的模型。

那一般来说呢非监度式学习会应用在一些交易性的数据当中,比如说你有一大堆的用户购买数据。

但是对于人类来说呢,我们很难找到用户属性和购买商品类型之间的关系。

所以说非限度式学习算法可以帮助我们找到他们之间的关系。

啊,比如说一个在某个年龄段的女性购买了某种肥皂啊,就有可能说明这个女性在怀孕期啊,或者说某个人购买儿童用品,就有可能说明这个人的关系链中有孩子啊等等。

于是这些信息呢会被用作一些所谓的精准市场营销活动,从而可以增加商品的销量。

我们这么来说吧,监督式学习呢是被告诉了正确答案之后的学习。

而非监督式学习呢是在没有被告诉正确答案时的学习。

所以说非监督式学习啊是在大量的非常乱的数据当中找寻一些潜在的关系,那这个成本呢也比较高。

非监督式学习经常被用来检测一些不正常的事情发生啊,比如说信用卡的诈骗或者盗刷也被用在推荐系统。

啊,比如说买了这个商品的人又买了别的什么商品,或者说如果某个人喜欢某篇文章、某个音乐、某个餐馆,那么他呢就可能喜欢某个车、某个明星或者某个地方。

在监督式学习算法之下呢,我们可以用一组狗的照片来确定某个照片中的物体是不是狗。

而在非监督式学习算法之下呢,我们可以通过一个照片来找到其中有跟它相似的事物的照片。

那这两种学习方式呢都有一些有用的场景。

那关于机器学习呢,你可以读一读machine learning is fn.那这篇文章恐怕是全世界最简单的入门资料了。

接下来啊我们需要比较专业的学习一下机器学习了。

在学习机器学习之前呢,我们需要学习数据分析。

所以说我们得先学一些大数据相关的东西啊,也就是data science相关的内容。

那这里呢有两个不错的和数据科学相关的课程和一个资源的列表。

那第一个呢是UC berclayace data eight, the foundations of data science和电子书computational and infrential drinking.那他们呢会讲述数据科学方面非常关键的概念,会教你在数据中呢找到数据的关联预测和相关的推断。

第二个教程是learn data science,这是github上面的一本电子书。

那主要呢是一些数据挖掘的算法,比如说线性回归啊,逻辑回归啊,随机森林,还有he means聚类的数据分析。

然后我还在文中呢给你了一个仓库的链接,这个代码仓库呢用TENOR flow. Thank it, learn pananas、南派,还有spark等等。

把这些经典的例子实现了一个变。

然后呢,有一个资源列表叫做data science resources list.这个网站上呢有一个非常长的和数据科学相关的资源列表,你可以从中得到很多你想要的东西。

那之后呢有几门机器学习的在线课程供你入门啊,也是非常不错的那第一个呢是吴恩达教授在cosra上的免费机器学习课程。

这个课程呢非常棒。

我强烈建议啊从这里入手。

对于任何拥有计算机科学学位的人,或者说还能记录一点点数学知识的人来说呢,都应该非常容易入门。

那这个斯坦福大学的课程想尽量拿满分。

当然啊你也可以在网易公开课中找到这一课程。

那除此之外啊,吴恩达教授还有一组新的和深度学习相关的课程,现在呢也可以在网易公开课上免费学习。

第二个是deep learning by google,他是google的一个关于深度学习的在线免费课程,它呢支持中英文。

那这门课呢会教授你如何训练和优化基本神经网络、卷积神经网络和长短期记忆网络,你将通过项目和任务来接触完整的机器学系统TEDRFOW.第三个呢是卡内基梅隆大学的汤米切尔的机忆学习英文原版视频与课件PDF.那第四个呢是二零一三年的learning from data课程视频以及课件PDF.他来自加利福尼亚理工学院,亚瑟拉布穆斯塔法,内容呢更适合进阶。

另外就是关于神经网络方面,youtube上面有一个非常火的课程视频是由宾夕法尼亚大学的与我拉罗希尔出品的教学课程。

除此之外啊,还有很多的在线大学课程可以供你学习啊,比如说斯坦福大学的统计学学习、机器学习、卷积神经网络,还有深度学习之自然语言处理啊等等,还有麻省理工大学的神经网络介绍、机器学习和预测等等。

此外呢还有一些值得翻阅的图书第一本书,叫做partty recognition and machine learning.这本书呢是机器学习领域的圣经之作。

那它呢也是众多高校机器学习研究生课程的教科书,goole上面啊有PDF版的下载。

这本书呢很经典,但并不适合入门来看。

那github上面呢有这本书的mata t lab,实现我的文中呢还列了两本比较经典的电子书,其中讲了很多机器学习的知识啊,可以当做手册或者字典。

那第四本书呢叫做第一个learning adaptive computation and machine learning serious中文翻译为深度学习。

那这本书呢是由全球知名的三位专家伊恩、古德、费洛有华本吉奥,还有亚伦考维尔撰写是深度学习领域奠基性的经典教材。

全书内容呢包括三个部分。

第一个部分呢介绍基本的数学工具和机器学习的概念啊,它们是深度学习的预备知识。

那第二部分呢系统深入的讲解了现在已经成熟的深度学习方法和技术。

第三部分呢讨论了某些具有前瞻性的方向和想法,他们被公认为是深度学习未来的研究重点。

那这本书的官网呢是deep learning到aug,在get home上面啊也有中文翻译。

第五本书呢是neural networks and deep learning.这是一本非常不错的神经网络的入门书,在豆瓣上评分是九点五。

他从理论讲到了代码啊,虽然有很多的数学公式,但是呢有代码相助就不难理解了。

这其中呢讲了很多,比如激活函数、代价,函数随机、梯度下降、反向传播、过度拟合和规范化权重。

初始化超参数、优化,卷积网络的局部感受,野混合层还有特征映射等等之类的东西。

第六本书呢是introduction to machine learning with python啊,算是一本不错的入门书啊,也是一本比较易读的英文书。

他是用sine k的learn框架来讲述的那如果你用过三k的这个框架,那么你学这本书还是很不错的。

最后呢第七本书叫做hands on machine learning with thanking learn and tenandor flow.这是一本以tann or flow为工具的入门书。

它用丰富的例子,从实战的角度来让你学习。

那这本书对于无基础的人啊也是很适合的。

对于小白来说啊,虽然略难,但是受益匪浅。

那除了上述的那些课程和图书之外呢,还有一些啊也很不错。

那第一个呢就是youtube上面google developers的machine learning recipe with jorge gordon这九集视频呢每集不到十分钟。

从hello word讲到如何使用teenphfloor啊,非常值得一看。

那第二个呢是practical machine learning tutorial with python introduction.这上面有一系列的用python带着你玩machine learning的教程,第三个是medium上面的machine learning one one讲述了好些我们前面提到过的经典算法。

第四个呢也是在medium上面叫做machine learning for humans.第五个是doctor jason browny的博客啊,也非常值得一读。

那其中呢有好多的蒿土会,让你有很多的收获。

第六个叫做rules of machine learning best practices for ML engineering是一些机器学习相关的最佳实践。

第七个叫做IM, trask啊,也是一个很不错的博客。

第八个呢是关于deep learning中的神经网络,youtube上面有介绍视频。

Neural networks.第九个是麻省理工学院的电子书,叫做deep learning.第十个呢是用python做自然语言处理natural language processing with python.那最后一个呢是machine learning和deep learning的相关教程列表。

Machine learning and deeper learning to tourists.那接着呢我想再来推荐一些和神经网络相关的不错的文章。

第一篇,they are reasonable effectiveness of recurrent neural networks.那这个呢是一篇必读的文章,告诉你为什么要学RNN.它还展示了最简单的NLP形式。

第二篇neural networks, manifeles and apology.这篇文章呢可以帮助你理解神经网络的一些概念。

第三篇understanding LSTM networks,它解释了什么是LSTM的内在工作原理。

第四篇attention and argumented recurrent neural networks,他用了好多图来说明RN的attention机制。

第五篇recommending music on spotify with deep learning.那他呢是一个spotify的实习生,分享的音乐聚类的文章。

然后呢我们来谈一谈十个非常经典的机器学习算法。

对于监督式学习呢经典算法有这么几个。

第一个呢是决策树,比如说自动化的放贷和风控。

那第二个呢是朴素贝叶斯分类器。

那它呢可以用于判断垃圾邮件啊,也可以对新闻的类别进行分类。

比如说是科技、政治还是运动,也可以用于判断文本表达的感情是积极的还是消极的,还有人脸识别啊等等。

那第三个呢是最小二乘法,它也是一种线性回归。

第四个呢是逻辑回归啊,是一种强大的统计学方法。

它可以用一个或者多个变量来表示一个二项式结果啊,它可以用于信用评分,计算营销活动的成功率,预测某个产品的收入。

那第五个呢是支持向量机SVM,那它呢可以用于基于图像的性别检测,还有图像分类啊等等。

第六个是集成方法啊,通过构建一组分类器,然后呢通过他们的预测结果进行加权投票,来对新的数据点进行分类。

那原始的集成方法呢是贝叶斯平均。

但是最近的算法呢也包括纠错输出编码、bagging和boosting.而对于无监督式学习呢,它也有一些经典的算法。

第一个呢就是聚类算法。

聚类算法有很多啊,目标呢就是给数据分类有五个比较。

著名的聚类算法呢也必须要知道,分别是key means mean shift DB scan EMGMMA lormative erarchical.第二个是主成分分析PCA.那PCA的一些应用呢,包括压缩、简化数据,便于学习和可视化等等。

第三个是其值分解SVD.那实际上呢PCA是SVD的一个简单应用。

在计算机视觉中,第一个人脸识别算法就是使用PCA和SVD来将面部表示为特征面的线性组合进行降维。

然后呢,通过简单的方法将面部匹配到身份啊,虽然现在的方法更为复杂,但是很多方面呢仍然依赖于类似的技术。

第四个是独立成分分析ICA ICA呢是一种统计技术,主要呢用于揭示随机变量、测量值或者信号集中的隐藏因素。

那如果你想了解更全的继器学习的算法列表啊,你可以看一下维基百科上面的list of machine learning hgorionms.另外呢a tour of machine learning hythm这篇文章带你概览了一些机器学习的算法。

其中呢还有一个脑图可以下载,并且呢还有一些how to的文章供你参考。

对于这些算法,thank you. Learn有一些文档供你学习,我在文稿中啊也给你列了出来。

最后呢还有一些相关的资源也值得一读。

那对于初学者来说啊,动手是非常非常重要的,不然呢你就会在理论的知识里迷失掉自己。

那这里呢有一篇文章就是eight five machine learning projects for beginners.这其中呢给初学者准备了八个很有趣的项目啊,你可以跟着练一练学习机器学习或者人工智能,你需要数据。

所以这里呢有一个非常足的列表啊,给你足够多的公共数据,名字叫做awesome public data sets.这其中包括农业、生物、天气、计算机网络、地球科学、经济、教育、金融、能源、政府健康、自然语言,还有体育啊等等。

此外呢给thhub上面还有一些awesome资源列表。

好了,我总结一下今天的内容。

我首先呢介绍了机器学习的基本原理,分别是监督式学习和非监督式学习。

然后呢,我给出了全世界最简单的入门资料。

Machine learning is fine.随后呢我给出了与机器学习密切相关的数据分析方面的内容和资料。

然后呢,我又推荐了深入学习机器学习知识的在线课程图书,还有文章等等,尤其呢列举了神经网络方面的学习资料。

最后呢我们描述了机器学习的十大经典算法和相关的学习资料。

在机器学习和人工智能领域呢,我也在学习啊,也处于入门的阶段。

所以说这节课推荐的内容啊,可能在你看来会有点肤浅。

那如果你有更好的信息和资料,欢迎补充。

目前在文章中给出来的是我在学习过程中认为很不错的内容,我从中呢受益良多。

所以说我希望他们也能为你的学习提供帮助。

从下节课开始呢,我们将进入前端知识的学习,包括基础和底层原理、性能优化、前端框架,还有UIUS设计等内容,敬请期待。