在《为什么人力资源数据分析落地难》文章中提到了HR数据收集难的问题,今天来聊一下到底应该如何收集数据。
本文章具有完全通用性,有E-HR系统和没有系统的都需要学习一下。
一、什么是数据
在收集数据前,要了解一下什么是数据。
在一些人的观念中,要进行数据分析,要收集数据,结果是预设一些表格收集数字。
如下图中的数据,是耗费了时间和精力统计出来的,结果对招聘数据分析的作用是非常小的。
来设想一下,要分析面试人员中带过超500人以上团队的销售总监有多少、融资过亿的融资主管有多少?会不会抓瞎?
要注意:数字只是数据的一部分。
数据是信息,可以从数据中提取各种信息,例如人的特征、事物的属性、动作的过程、时间节点等,这些可以让我们对客观世界有直接印象。
如统计招聘了1个人,是统计这个人的学历、年龄、身高、工作经历等内容,然后从这些信息中可以提取各种数字,招聘人数、学历人数、年龄范围等。
所以要注意:数据收集是收集各种信息,并非预设表格收集数字。
当然数据还不仅仅是前述的内容,它还包括文档、视频、图像、音频等形式。从数据结构化程序来划分,数据分为结构化数据、半结构化数据和非结构化数据。
结构化数据可以理解为数据库数据,数据是存储在二维中,用行和列来表示数据的情况,这在HR工作中接触最多的一种数字。
半结构化数据是结构化数据的一种形式,是数据的结构和内容混在一起,并没有明显的区分,例如邮件、HTML文档等。
非结构化数据是没有固定的数据结构,例如文档、视频、图像、音频等。
对于企业人力资源领域的数据分析,绝大多数还是以分析结构化数据为主,甚至说99.9%以上也不为过。
二、数据如何产生
了解了数据,那我们来看一下数据是如何产生的。
一句话概括:数据是从管理活动产生的。
如果再要细化,数据是从流程的各节点中产生的,每个流程结束,会有各种数据生成。
例如你要请假,填写请假单,经过了领导审批通过。在这个流程中,产生的数据包括请假人姓名、部门、职级、岗位、请假时间、请假类型、请假开始日期和结束日期、审批人姓名、职级、审批时间等内容,这些都是产生的各种数据。
如果请假的时候什么表单都不填写呢?只和领导打声招呼,领导口头同意了。这样也会产生数据,但是估计最多只是在考勤中标记了哪几天请假,是什么类型的假期,其它数据估计也不会有人再去收集了。
所以要想让更多的数据产生,需要规范制度、流程。HR规范公司制度、制定和梳理各种流程是必须的,如果不做这些,数据不会多,数据分析也就缺乏数据基础。
三、数据如何收集
了解了什么是数据,也了解了数据如何产生,是不是我们只需要将流程产生的数据收集起来就可以呢?
答案是否定的,因为涉及数据应该如何存储。
对于公司有E-HR系统的,按照E-HR系统的设定内容来收集数据即可。
但是对于E-HR系统之外的数据或者没有E-HR系统的公司该如何收集呢?这涉及到了数据表格的设计。
工作中的数据收集表格,只有两种,注意是两种。
一种是流水账式表格
流水账是按照时间顺序来记录金钱和货物的出入。
流水账式表格也是同样的情况,按照这种思路我们记录一下员工加班情况。
一种是信息式表格
信息式表格是指描述事物属性或特征的表格,一个事物的特征用一行表示。
例如我们使用的员工信息表。
使用这两种表格记录数据,要注意使用唯一编号,对于员工可以使用员工编号,通过员工编号把各种表格数据关联起来,也可以把E-HR系统的数据导出来和其它表格数据进行关联。
前述的两个表中,我们来统计男性加班总时长有多少?可以用VLOOKUP关联,然后再用数据透视表汇总数据即可。
具体操作层面的我不再讲解,如果对表格设计和Excel操作技能有学习需求,可以点击我的头像去我的主页报名学习课程。