数据分析是数学知识、统计知识和分析人员自身专业知识的融合及实际运用,其关键在于挖掘数据潜在的价值,解决实际问题。分析人员可使用一系列科学研究方法挖掘数据本身的意义及数据之间的关系,进而为实际研究提供有力的数据支撑。然而并非每个人都对数据感兴趣,但是没有数据结论作为支撑,论点就没有让人信服的依据。学生时代,我曾想是否可以有这样一本书,既可以让读者完全理解数据分析原理,又没有原理性书籍的一大堆数学公式。直到网络问卷调研兴起,我才找到了这样的切入口:使用问卷作为背景案例进行阐述,不仅可以将各类分析方法融入问卷研究,还可以将分析思路进行梳理,以“傻瓜”式的文字进行讲解,从而解决实际问题。
纵观我国当前教育现状,很多高校会开设统计理论课程,但这些课程大部分基于理论原理,以分析方法的计算公式讲解为主。例如,t检验的公式是什么,如何把t值计算出来,等等。一旦将课堂中的分析方法应用于实际数据分析,就会出现巨大的鸿沟:理论上讲数据需要服从正态分布,但实际数据一般无法完全服从正态分布;课程中使用的练习数据总是很“完美”,一旦自己收集数据进行分析,就会“面目全非”,无法继续进行分析,应该使用什么样的分析方法,以及分析方法的逻辑关系是什么,完全没有头绪。课堂上的分析方法是彼此独立的讲解,而在实际研究中,需要选择合适的分析方法对整份数据进行分析,并且完成研究报告。我很庆幸有机会将自己近10年的数据分析经验进行浓缩,写成一本有意义的书。
站在个人角度,我认为每个人都需要掌握一定的数据分析技能。因为在实际工作中,每个行业都会产生数据,并且需要根据数据分析的结论提供相关建议、措施,各行业涉及的专业名词术语较多,进行数据分析需要结合专业知识,不太可能让只懂统计的人员进行处理。希望本书让读者有不一样的体验,忘记一堆数学公式、理论原理,随心所欲地进行数据分析。
自本书第1版出版以来,我收到非常多读者的反馈,这些反馈对第2版的完善和改进有非常大的帮助。非常感谢各位读者的来信,同时也欢迎读者朋友继续在本书互动页面与我进行交流。在本书写作期间得到电子工业出版社张慧敏编辑的大力帮助,在此表示感谢。针对本书的第二部分内容,张文彤老师提供了非常多有价值的建议,在此一并表示感谢。同时,也把感谢送给我的父母,以及在写作过程中给予我支持的朋友们。
真心希望本书给各位读者带来一定的帮助,至少可以有所启迪。建议读者首先阅读第一部分内容,通过学习这部分内容,可以大致了解各类分析方法的功能及其使用要求,以及问卷与各类分析方法的匹配对应关系;针对第二部分内容,读者可以进行选读,阅读与自己的问卷相对应的分析思路框架及分析方法,并且结合第三部分操作指导,完成高质量的分析报告;如果在分析方法的使用过程中出现问题,可参考第四部分内容进行解决。
本书素材下载地址为:www.broadview.com.cn/38198。
序言
从啤酒和尿布的故事开始,我们发现简单的数据中可能存在无穷的奥秘,好奇心驱使越来越多的人投身到枯燥的数据中。已经没有人会否认这是一个数据的时代,或者一个大数据的时代。但相比后者,我还是更倾向于认为目前仅是一个数据的时代。诚然,大数据的概念火热,但具体到某个领域或某个研究,获取和存储海量数据都远远超出了绝大多数研究者的能力范围,更遑论随后的研究。退而求其次,如果不谈大数据,那么目前已有足够的研究方法和数据分析方法可供我们选择使用。
在浩如烟海的数据中,不论是科学研究还是商业调查,很大一部分数据是通过调查问卷的方式获取的。在问卷星平台上,每天都会产生上万份问卷和过百万份答卷。但在运营过程中,我们也发现大部分用户的数据分析仅仅停留在简单的频率分析上,数据中隐藏的巨大价值还在默默“沉睡”,等待被人挖掘。造成这种窘境的原因可能是我们在关注各种数据概念的同时,并没有以科学的研究方法来处理这些数据。
如何挖掘这些“沉睡”在问卷数据中的价值,正是本书作者周俊老师想要与广大读者分享的。周俊老师专注于数据研究近10年,同时也是问卷星数据研究部的专家顾问。在同周老师一起工作的时间里,我们不仅领会了他在问卷数据分析方面的独到见解,也感受到他一丝不苟的工作态度,这些都深深融入了本书的创作过程中。
本书同其他数据分析方面的专著相比,特点鲜明:首先,作者专注于问卷来源的数据分析,对数据分析方法的介绍更加专业、详细和深入;其次,作者没有讲解任何数据分析背后的数学原理,着重介绍的是数据分析方法的实际应用;最后,本书内容深入浅出,适合所有对问卷数据分析有需求的读者随时翻看查阅。
截至目前,用户在问卷星上发布的问卷已超过4000万份,累计回收答卷超过27亿份。让更多人挖掘到问卷数据中隐藏的无限价值——我想这正是周老师和问卷星共同的愿景。