数据挖掘工业界,R和python到底谁用的比较多?
这两个工具都很方便,不需要非常高深的编程能力,都适合算法开发,有大量的package供你使用。 Python入门简单,而R则相对比较难一些(纯个人感觉,依据每个人之前的经验,可能不同的体验)。R做文本挖掘现在还有点弱,当然它的优点在于函数都给你写好了,你只需要知道参数的形式就行了,有时候即使参数形式不对,R也能“智能地”帮你适应。这种简单的软件适合想要专注于业务的人。Python几乎都可以做,函数比R多,比R快。它是一门语言,R更像是一种软件,所以python更能开发出flexible的算法。 Python适合处理大量数据,而R则在这方面有很多力不从心,当然这么说的前提是对于编程基础比较一般的童鞋,对于大牛来说,多灵活运用矢量化编程的话,R的速度也不会太差。 论性能,Python介于C/C++/java这些高级语言与R语言之间,虽然性能不及那些高级语言,但是一般日常的数据用Python基本都能实现,对于性能要求不挑剔的人来说,足够了 python你需要安装numpy,pandas,scipy,cython,stat***odels,matplotlib等一系列的程序包,还需要安装ipython交互环境,单独用python直接做计量分析统计函数是没有函数支持的;R是基于统计分析的,性能和效率上要略逊于python。R的优势在于统计学和数据计算和分析上要优越于python。 Python语言编程的代码可读性高,整体美观,属于简单粗暴性质的,短时间内少量代码可实现复杂功能;R的语法很奇怪,各种包并不遵守语法规范,导致使用起来经常感觉***;R程序最终看起来没有Python那么简洁美观。 从全面性方面,我认为Python的确胜过R。无论是对其他语言的调用,和数据源的连接、读取,对系统的操作,还是正则表达和文字处理,Python都有着明显优势。毕竟,python本身是作为一门计算机编程语言出现的,而R本身只是源于统计计算。所以从语言的全面性来说,两者差异显著。 python是machinelearning领域的人用的较多。据我所知,做marketingresearch,econometrics,statistics的人几乎没有用python的参考自:blog.sina***.cn/s/blog_8813a3ae0101e631
控制方向的硕士想转码,该学习Java开发还是大数据开发?
首先,从学习的角度来说,大数据开发对于学习场景和实践场景的要求都相对比较高,需要的基础知识也相对比较多,如果自学的话,会遇到较多的障碍。
大数据开发有三个基础要求,其一是要熟练掌握一门编程语言,其二是要掌握大数据平台的使用,其三是要具有一定的场景知识。
目前大数据开发比较常用的编程语言包括J***a、Python、Scala、R、Go等,其中J***a和Python的应用会更多一些,这两门编程语言也是典型的全场景编程语言。
大数据平台可以分为两类,一类是开源平台,比如Hadoop、Spark就是典型的代表,这一类平台的优点是开放,对硬件的要求也并不高,所以很多自学者都会从开源平台开始学起。
另一类是商用大数据平台,这一类平台的优点是可用性比较强,对开发人员和运维人员更友好,但是这一类平台自学者往往接触不到,而且对于硬件的要求也相对比较高。
大数据开发一定不能脱离场景,不同的行业场景有不同的需求,所以在进入大数据开发领域之前,往往需要积累一定的行业场景知识,比如金融领域、电子商务领域、出行领域、政务领域等,这些领域都有很多大数据开发的需求。
相对于大数据开发来说,J***a开发对于初学者和非计算机专业的同学会更友好一些,一方面涉及到的知识量没有大数据开发那么多,另一方面J***a开发的场景要求也不高,自学也能够取得较好的学习效果。
在掌握了J***a开发之后,未来也可以进一步向大数据领域[_a***_],而且这个过程也会相对比较容易。
从就业的角度来看,目前J***a开发的岗位还是比较多的,而且人才需求类型也更加多元化,控制方向的硕士研究生也有机会拿到大厂的offer。