人工智能 英语(背背乐人工智能英语)
时间2018年12月2日,晚,开通了头条号,希望以后能坚持在这里写一些自己的关于机器学习、深度学习、自然语言处理的学习与研究笔记~~
拿到offer也有些日子了,回顾已经逝去的二年多的研究生生活,回忆里总感觉自己在不断的做项目,看paper,然后写paper,真是感觉时间飞快~~不过感觉自己也算够幸运的了,短短的不到二年时间内,高密度的知识摄入,现在总算也拿到了比较心仪的算法offer,而且还在硕士期间发了顶会文章。可能适应了这样的生活吧,看多了文章,也喜欢上了文字,从而也爱上了分享,所以想开通这个头条号一些人工智能的知识,包括自己的一些学习感悟、笔记、paper解读。由于本人主要在自然语言处理方面(NLP)学习较为深入,文章可能涉及NLP的知识会较多,当然随着我学习的深入会涉及机器学习、自然语言处理、机器视觉等等。我希望我的学习我的总结会对一些人有帮助。(作为一只入门级别的小萌新,同时非常欢迎大牛对我一些错误的理解进行指正,这也是我坚持写作的动力之一)。
此外,我也开设了个人公众号:小白人工智能入门学习(StudyForAI)
希望能给普及人工智能技术做出一些贡献~~
个人知乎专栏:https://www.zhihu.com/people/yuquanle/columns
另外,我前期会尽量总结一些非常好的入门学习资料,所以第一篇文章,干货满满,大家可以收藏。
由于本人硕士阶段主要是研究nlp相关问题的,所以这里整理的资料可能都是偏向nlp和机器学习的。这篇博客会根据博主的学习进度以及发现好的学习资源大陆而实时更新。希望大家互相学习一起进步!也以此督促自己勤学多思考。
书籍方面:
(大家需要具备相关的基本高数、线代、概率论等知识)
1.机器学习(周志华):这本书可以当作入门。
2.统计学习方法(李航):这本书是真的不错,里面也有不少的公式推导。
3.统计自然语言处理(宗成庆):中文版的自然语言处理书籍比较少,这本书最大的特点就是比较全方面,但是每个地方都是点到为止,大家可以当作地图使用。
4.Deep Learning(Ian Goodfellow, Yoshua Bengio and Aaron Courville):话不多说,几位大牛之作。
5.数学之美(吴军):推荐这本书的理由是因为我当小说看完感觉很不错(https://pan.baidu.com/s/1_lk4HDulAlEusvRoYgJ9tA)
6.Machine Learning Yearning(NG新书)
https://github.com/yuquanle/machine-learning-yearning
7.Deep Learning in Natural Language Processing(邓力、刘洋教授等人)
8.PRML(Christopher Bishop):有点偏Bayesian,这本书听说也不错,但是我还没看…
课程方面
(有些课程需要翻墙,其实强大的B站可以看)
1.Coursera上的Andrew Ng的机器学习课程可以当作入门。
B站链接:
https://www.bilibili.com/video/av14111147?from=search&seid=8596299097758793438
2.台湾大学的机器学习基石(林轩田)听说也不错。
B站链接:
https://www.bilibili.com/video/av12463015?from=search&seid=5018197974871318943
4.第三个是我力荐的,台大李宏毅老师的课程,真的是相当不错,主要是讲的很清晰而且简单。另外这个老师超爱看动漫,所以讲课经常穿插动漫人物,interesting。
李老师的个人主页:
http://speech.ee.ntu.edu.tw/~tlkagk/index.html
这里有他历年的课程视频以及课堂ppt。看不了的同学可以去B站上看17年的机器学习课程视频:https://www.bilibili.com/video/av10590361?from=search&seid=5018197974871318943
5.斯坦福CS224d:自然语言处理的深度学习[更高级的机器学习算法、深度学习和NLP的神经网络架构]http://link.zhihu.com/?target=http%3A//cs224d.stanford.edu/syllabus.html
CS224n:CS224n: Natural Language Processing with Deep Learning
6.Reddit超高赞免费NLP课程:有视频、PPT、作业:
https://github.com/yandexdataschool/nlp_course
7.网易云课堂有吴恩达的免费课程(微专业):
https://mooc.study.163.com/smartSpec/detail/1001319001.htm
深度学习框架:
Keras:Keras是一个高层神经网络API,Keras由纯Python编写而成并基Tensorflow、Theano以及CNTK后端。
中文文档:https://keras-cn.readthedocs.io/en/latest/
官方Github:https://github.com/keras-team/keras (有问题可以在这里开issue提问)
Keras例子:https://github.com/keras-team/keras/tree/master/examples
Pytorch:PyTorch 是一个 Python 优先的深度学习框架,能够在强大的 GPU 加速基础上实现张量和动态神经网络。
中文文档:http://pytorch.apachecn.org/cn/tutorials/index.html
官方github:https://github.com/pytorch/pytorch
互联网小常识:RPR技术的主要特点是:宽带利用率高:SDH(50%);FDDI数据帧由发送结点收回,RPR由接收结点收回。公平性好:相同优先级的数据帧分配相同的环通道访问能力,执行SRP公平算法。快速保护和回复能力强:50ms内,隔离出现故障的结点和光线段。保证服务质量。
Pytorch例子:https://github.com/yunjey/pytorch-tutorial
超全的Pytorch资源列表:https://github.com/bharathgs/Awesome-pytorch-list
Tensorflow:TensorFlow 是世界上用的人最多的开源机器学习框架,谷歌出品。
中文文档:http://www.tensorfly.cn/
教程:
https://www.tensorflow.org/tutorials/
https://github.com/yuquanle/TensorFlow-Chinese-Tutorial
https://tensorflow.google.cn/tutorials/?hl=zh-cn
官方github:https://github.com/tensorflow/tensorflow
Tensorflow例子:https://github.com/aymericdamien/TensorFlow-Examples
Python库:
Numpy:该库提供了NumPy数组类型的数学运算向量化。
Pandas:Pandas是数据整理的有效利器。
NLTK:NLTK旨在促进NLP及相关领域(语言学,认知科学人工智能等)的教学和研究,目前受到重点关注。
Scikit-learn:一个简单高效的数据挖掘和数据分析工具。
Gensim:分析纯文本文档的语义结构以及检索相似语义文档。
Snowp:SnowNLP是一个python写的类库,可以方便的处理中文文本内容。
Spacy:工业级nlp工具。
开源项目方面
(我fork了一些比较不错的github开源项目):
1. https://github.com//RedditSota/state-of-the-art-result-for-machine-learning-problems
该项目提供了很多机器学习问题的当前最优结果,并尽量保证该库是最新的。并且这个项目类似于众包,希望更多的小伙伴参与进来。如果你发现了一个数据集的当前最优结果,请提交并更新该 GitHub 项目。这是为所有类型的机器学习问题寻找当前最优结果的一次尝试。
2.清华老师刘知远组推荐30来项算法代码和工具包列表:
互联网小常识:DNS服务器和DHCP服务器都需要固定的IP地址。DHCP默认的租约期限设置为8天,最小单位为分钟,租约到期前客户端需要续订,续订工作由客户端自动完成,作用域激活后DHCP服务器才能为客户机分配IP地址。DHCP服务器中常用的选项有路由器选项和DNS服务器选项。
https://mp.weixin.qq.com/s?__biz=MzA4NzE1NzYyMw==&mid=2247496990&idx=1&sn=1a190f20a9c0876af7c48cecb361303b&chksm=903f0b06a7488210b56cac445fb1039a8e2d8d3ade217816ab9619431227705ce048c80e9030&mpshare=1&scene=23&srcid=0326i36NHdp0Tj8O6y0ZB5Fqrd
3. 跟踪自然语言处理(NLP)进度的存储库,包括数据集和最常见的NLP任务的当前最新技术:https://github.com/yuquanle/NLP-progress
4.2018/2019/校招/春招/秋招/算法/机器学习(Machine Learning)/深度学习(Deep Learning)/自然语言处理(NLP)/C/C++/Python/面试笔记:
https://github.com/yuquanle/Algorithm_Interview_Notes-Chinese
另外,求职的我还推荐一份数据结构算法资料:
https://github.com/CyC2018/CS-Notes/blob/master/notes/Leetcode%20%E9%A2%98%E8%A7%A3.md
5. 川大毕业极客创建项目《深度学习500问》:
https://github.com/yuquanle/DeepLearning-500-questions
6. 中文NLP资源,在GitHub上,有人收罗了一份资源,汇集了40个关于中文NLP词库,涵盖了各个方面:https://github.com/yuquanle/funNLP
7.西湖大学张岳博士在EMNLP2018 上做了《Joint Models for NLP 》的Tutorial。
下载:https://pan.baidu.com/s/1DxOqXxlK-1BCHqMCwr5_ZA
老师主页:https://frcchang.github.io/index.html
接下来的文章可能就是对这些知识的消化以及学习…
希望我能坚持下来~~~
写在后面: 可能现在是个浮躁的年代,但是这种浮躁千万不要带到学习中来,知识的积累绝不是半个月入门,三个月精通喊口号喊出来的,希望大家对一些培训机构口号有个理性认识。
网上这么多免费的优质资源足够让一个人成长,通过报班学习得到的知识反而没有让自己养成独立学习独立探索独立思考的能力,而这种能力我认为对于求职对于科研对于个人发展都是更为重要的东西。所以我们需要理智的认知以及勤奋的学习。这个交叉领域涉及的知识太多太广,公式背后的含义是无数人多年的汗水结晶,绝不是背背公式就能达到彼岸的。望大家互相监督,大家互相共勉,大家一起成长(嗯~也希望自己能坚持写作分享)~~
更多学习资料:
公众号:StudyForAI(小白人工智能入门学习)
知乎专栏:https://www.zhihu.com/people/yuquanle/columns
互联网小常识:网桥工作在数据链路层,作用主要是a实现异构网络的互联b通过接收、转发和地址过滤的方式实现互联网络的通信。
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186