人们在考试测验学习数据科学、人工智能或机器学习时所面临的最大拦路虎便是韶光和金钱。
自学是一门艺术,须要足够的自律、勤奋和专注。
利用得当的话,它能让你灵巧地将学习与事情结合起来。

若何自学成为数据科学家或AI工程师?你需要占领这九点_数据_机械 智能问答

然而,自学数据科学、人工智能或机器学习的开始阶段会非常困难,但请相信这统统都是值得的。
自学时取得良好进展的关键是按照自己的节奏学习。

本文将分享一条自学数据科学、人工智能和机器学习时可以遵照的道路,同时也能帮助大家在学习新事物上取得良好进展。

学习数学

学习数学听起来很烦人,但对这个领域来说是十分必要的。
阅读这篇文章的读者该当都从高中学到了一些初高等数学知识。
这是很好的开端,但仅有这些知识在数据科学、人工智能和机器学习领域还远远不足。
你须要更深入地学习一些统计学、代数和其他的数学观点。

必备数学知识资源列表,拜会:https://towardsdatascience.com/mathematics-for-data-science-e53939ee8306。

学习编程

作为初学者而言,不要直接开始学习编写机器学习代码,而是首先学习一样平常编程的核心观点。
先理解什么是编程、现有的编程措辞种类、如何精确地写代码等。
这些东西非常主要,由于你将学到许多主要的观点,而这些观点将一贯伴随着你。

以是这一步要逐步来,不要急于学习高等的东西,在这个过程中对事物的理解深浅将决定你在这个行业中的表现。

这个***先容了编程和打算机科学,可以帮你过一遍打算机科学和编程中的主要观点:https://www.youtube.com/watch?v=zOjov-2OZ0E。

闇练节制一种编程措辞

数据科学家、人工智能和机器学习工程师利用的措辞多种多样,个中最常用的措辞是 Python、R、Java、Julia 和 SQL。
当然还有很多其他的可用编程措辞,这里列出的是最常用的措辞,缘故原由如下:

只要投入足够的韶光进行学习并坚持下来,你可以比较随意马虎地学会这些措辞,并且它们的开拓速率很快。

可以利用更少的代码完成更多的功能。

社区和生态十分完善,任何时候碰着任何问题社区都能供应帮助和支持。

拥有数据科学家、人工智能或机器学习工程师所须要的险些所有库和软件包。

开源且免费利用。

学习多种措辞绝对没错,事实上这是一件很好的事。
然而,在学习每一门编程措辞时,你须要逐步来,只管即便不要同时学习多种措辞,由于这可能会让你感到困惑,并让你在一段韶光内迷失落方向。

逐步来,一次学一门措辞,确保只学习你职业生涯所须要的那部分措辞。
我建议先学 Python,由于它相比拟较随意马虎理解。
此外,我还建议大家按先后顺序学习以下资源:

https://www.youtube.com/watch?v=rfscVS0vtbw&t=5s

https://www.youtube.com/watch?v=r-uOLxNrNk8

学会如何获取数据

数据常日不会直接送到你手里,有时根本就没有现成的数据,但无论如何,你必须找到一种方法来得到能利用的数据。

你事情的地方可能有一不错的数据网络系统,如果这样那你就可以省心了。
如果没有的话,你必须找到一种方法来获取数据,不是任何数据都可以,而是可用来实现目标的有效数据。

获取数据并不完备等同于数据挖掘,它是数据挖掘的一个过程。
你可以在互联网上许多地方得到免费和开源的数据,有时你可能须要从网站上抓取数据。
网络爬虫非常主要,我希望每个人都能学习网络爬虫,由于你的职业生涯中可能会常常用到它。

网络爬虫教程:https://www.youtube.com/watch?v=0_VZ7NpVw1Y

数据有时会保存在数据库中,那么作为数据科学家、人工智能或机器学习工程师,你还须要理解一点数据库管理知识,以便在事情中直接连接和利用数据库。
在这个阶段,SQL 知识是非常主要的。

SQL 学习资源:https://www.youtube.com/watch?v=sTiWTx0ifaM&t=15s

学习如何处理数据

这常日被称为「数据整理」(Data Wrangling)。
该过程包括数据清理, 这可以通过对数据实行一些探索性数据剖析并删除数据中不须要的部分来完成。

数据整理过程还包括将数据构造化为可以利用的格式。
在数据科学、人工智能或机器学习项目中,这个阶段是最累人的部分。
在学习过程中,你将要利用的大多数样本数据都已经由预处理,但是现实天下中的数据可能还没有经由任何处理。
作为一个有志于在这个领域做好的人,你该当探求一些真实天下数据并进行处理。
真实天下的数据险些可以在任何地方找到,但是 Kaggle 仍是一个从环球公司获取真实数据的神奇地方。

数据整理或处理是一项非常累人的任务,但是如果有持续的奉献精神和专注,它也可能是件有趣的事。

数据整理干系课程:https://www.youtube.com/watch?v=sz_dsktIjt4

学习如何可视化数据

成为数据科学家、人工智能或机器学习工程师,并不虞味着你的事情场所或团队中的每个人都能够理解你所在领域的技能细节,或者能够从原始形式的数据中做出推断,因此我们须要对数据进行可视化。

数据可视化常日是指利用图表来展示数据,以便任何不具备数据科学、人工智能或机器学习知识的人也能理解这些数据。

数据可视化的方法有很多。
作为程序员,编写代码来可视化数据该当是首选方法,由于这种方法速率快,而且无需本钱。
编写代码来可视化数据可以通过我们利用的编程措辞供应的许多免费和开源库来完成。
Matplotlib、Seaborn 和 Bokeh 都是可用来可视化数据的 Python 库。

Matplotlib 数据可视化教程:https://www.youtube.com/watch?v=yZTBMMdPOww

可视化数据的另一种办法是利用 Tableau 之类的闭源工具。
很多闭源工具可用来制作更优雅和繁芜的可视化结果,但是须要付费。
Tableau 是最常用的工具,也是我个人常常利用的工具。
我推举大家学习利用 Tableau。

Tableau 利用教程:https://www.youtube.com/watch?v=aHaOIvR00So

人工智能与机器学习

人工智能和机器学习更像是数据科学的子集,由于它们都是由数据驱动的。
它们指通过向机器或其他无生命物体供应经由良好处理的数据,使它们的行为与人类相似的过程。
机器可以通过逐渐的教导和勾引来做很多人类能做的事情。
在这种情形下,我们可以把机器想象成一个完备没有知识的婴儿,他们逐渐学会识别物体、说话、从缺点中学习并变得更好。
我们也可以用同样的办法教机器做这些事。

人工智能和机器学习大体上是通过多种数学算法来给机器赋能。
人工智能和机器学习的全部潜力仍旧不为人知,由于它是一个不断发展的领域。
但目前人工智能和机器学习被广泛运用于认知功能,如目标检测和识别、面部识别、语音识别和自然措辞处理、敲诈和垃圾邮件检测等。

AI 和 ML 通用运用:https://www.youtube.com/watch?v=5hNK7-N23eU

深入理解机器学习:https://www.youtube.com/watch?v=GwIo3gDZCVQ&t=5s

不雅观看完以上***后,你该当能够大致理解机器学习初学者和中级知识,理解许多可用的机器学习算法及其浸染和利用过程。
现在, 你该当准备好构建第一个大略的机器学习模型了,你可以参考 Victor Roman 的这篇文章:https://towardsdatascience.com/machine-learning-general-process-8f1b510bd8af。

学习如何使自己的机器学习模型可在互联网上利用

通过机器学习演习得到的模型可以通过支配,让互联网上的每个人都可以利用。
要做到这一点,你须要对 web 开拓有很好的理解,由于你必须创建一个或一组网页来发布模型。

网站前端也须要与容纳模型的后端进行通信。
为此,你还须要知道如何构建和集成 API,以处理网站前后端之间的通信问题。

如果你打算通过 pipeline 或 docker 容器在云做事器上支配机器学习模型,那么你可能须要对云打算和运维有充分地理解。
支配机器学习模型的方法有很多,但首先,我建议你学习如何利用 python web 框架 Flask 来支配机器学习模型。

教程:https://www.youtube.com/watch?v=UbCWoMf80PY

师傅领进门

能够自学成才当然很棒,但没有什么比直接从行业专家那里学习效果更好。
有些知识通过学习现实生活中的观点就可以节制,而有些知识只有亲自体验才能学会。

有导师在方方面面都非常有帮助,但不是每个导师都能对你的职业生涯或生活产生影响,以是拥有精良的导师就显得非常主要了。
Notitia AI 是一个不错的平台,可以培训从初学者到专家水平的数据科学、人工智能和机器学习。
该平台会为你分配一个专属导师,在你选择的专业领域里给予个性化和专业的辅导。

请把稳,只参加课程和从在线资源中学习并不能使你成为一名真正的数据科学家、人工智能或机器学习工程师。
你还必须得到干系认证,有些事情岗位还哀求学位。
抓紧韶光学习来得到证书或学位,你终将为从事该行业做好准备。