二、 数据介绍 (一) 数据来源 本文所取的数据源自 2018 年 3月51.job招聘网站发布的数据分析岗位招聘的相关信息;数据包含了 37440条岗位信息;涵盖了具
二、 数据介绍
(一) 数据来源
本文所取的数据源自 2018 年 3月51.job招聘网站发布的数据分析岗位招聘的相关信息;数据包含了 37440条岗位信息;涵盖了具有代表性的 8 个省市地区;即北京、上海、广州、深圳、武汉、西安、杭州、南京;采集到的所有招聘信息中包含了招聘的职位;例如招聘市场上大数据岗位最为常见的大数据分析师、大数据工程师等多种职位这类数据可以帮助我们在研究时了解到大数据岗位在招聘时的职位类型得出是什么类的职位在招聘大数据人才;公司名称数据例如上海云济信息科技有限公司等;这类公司名称的数据可以帮助研究了解到是什么类型的公司在招聘大数据岗位,也在后续帮助分析得出大数据岗位情况分析的公司类型分布;公司所在地共有8个例如上海、北京、深圳等城市,该类数据可帮助分析大数据岗位招聘的城市需求热门度,帮助求职者总结城市岗位条件下的需求量;公司类别共11种,分别是外资(欧美)、外资(非欧美)、合资、国企、民营公司、外企代表处、政府机关、事业单位、非营利组织、上市公司、创业公司;这类数据可以帮助本文分析是什么性质的企业在招聘大数据岗位,而这些性质的企业对大数据招聘的需求是多少;公司规模共有七类分别是少于 50 人,50-150 人、150-500人、500-1000 人、1000-5000 人、5000-10000 人、10000 人以上,该类数据评估了所需大数据岗位的各公司的规模大小,该类的分析对于求职者来说,帮助求职者在选择岗位时对该公司规模推测出的公司信息得到了解;经验要求有7种数据即无工作经验、1年工作经验、2年工作经验、3-4年工作经验、5-7年工作经验、8-9年工作经验、10年以上工作经验;这些数据对于本文的研究来说可以了解分析大数据岗位招聘时对求职的工作经验的要求分布;学历要求的数据共有8类,即初中及以下、高中、中技、中专、大专、本科、硕士、博士,这类数据的采集对研究了解大数据岗位所需求职者学历程度有帮助;岗位描述类的数据有很多,这类数据主要概述了大数据岗位招聘信息除罗列出来的学历、经验、公司规模等分类型数据公司对求职者的一些要求和岗位工作内容的描述。比如需要做哪些工作、工作时间等。个人能力类数据共有12个分别是R,SPSS,Excel,Python,Matlab,Java,SQL,SAS,Stata,Eviews,Spark,Hadoop,这类数据描述了各公司对大数据就业者的能力要求,简单一点说就是从业者的软件要求;招聘数量数据是数值型变量从零到无限的数量在数据中都有可能出现,这类数据可以在分析中帮助了解大数据岗位的招聘总需求和各公司的需求量分布。最后一个采集的数据是关于大数据岗位薪资类型的,共有12种,即2千以下、2-3千、3-4.5千、4.5-6千、6-8千、0.8-1万、1-1.5万、1.5-2万、2-3万、3-4万、4-5万、5万以上,为方便研究,在本文中出现的薪资都经过换算以元/月的形式为单位。薪资数据是较为重要的数据,该数据贯穿后续的回归分析研究,以上类型的数据都需要与薪资类型的数据相结合分析得出影响薪资的因素。