基于数据挖掘技术的大学生班级QQ用户信息行为探析


基于数据挖掘技术的大学生班级QQ用户信息行为探析

李娟,李英杰,唐宏炳

湖南环境生物职业技术学院,湖南衡阳 421005

 

摘要:在移动互联网飞速发展的今天,传统的大学生管理体系已无法跟上时代的步伐。本文利用腾讯互联网技术,采集学生的发言频次、社会网络关系、情感分析三个方面信息,对用户数据进行分类归纳,挖掘社交网络中用户的信息与用户行为,从中获得隐含的价值与关联性,以期为同类研究提供一定的参考。

关键词:数据挖掘技术;大学生班级;QQ用户信息与行为

 

A Study on University Classes of QQ Users Information Behavior Analysis Based on Data Mining

Li Juan  Li Yingjie  Tang Hongbing

(Hunan Polytechnic of Environment and Biology,Hunan Hengyang 421005)

 

Abstract: With the rapid development of the mobile Internet, the traditional management system of college students cannot keep pace with the times. Utilizing Tencent internet technology to collect three aspects of information including the speaking times of college students, social networks relationship and sentiment analysis, this paper classifies and summarizes the users’ data, excavates the information and behavior of users in the social network to acquire the implicit value and relevance so as to provide some reference to the similar research.

Key words:  Data Mining,University Classes,Users’ Information Behaviors

 

随着高校的政策调整,高等院校不断扩大规模,学生数量急剧增加,关于学生的各种信息量也成倍增长,这给高等院校的教学和学生日常的管理方面都带来不少的冲击[1]。在此背景下,数据挖掘技术应运而生。本研究试图通过班级QQ 群聊天记录,运用数据挖掘技术对隐含在聊天记录中的信息进行分析,以窥测该群在线交流的情况,并归纳学生行为的发展趋势,进一步探索了用户信息与行为产生的内在机制,为数据挖掘技术的应用提供资料。

1 数据采集和研究方法

1.1 数据采集

本文的数据来自湖南环境生物职业技术学院2015级养老护理班QQ群组,该群组于2015年9月份申请成立,共有15 位群成员。群聊天记录选取时间段为:大一上学期(20159月-201512月),大二上学期(20169月-201612月),大三上学期(20179月-201712月)。

1.2研究方法及其工具

1)文本挖掘

本文利用文本挖掘的工具,对 QQ群的聊天记录的文本信息挖掘,统计分析该群的情感状态。工具是Excel统计软件。

2)社会网络分析

社会网络分析是指对社会行动者及其间关系的分析。本文通过社会网络分析,挖掘该QQ群体的核心参与者、边缘参与者以及旁观者的分布状况。工具是 UNICET6.0社会网络分析软件[2]

3)访谈法

本文主要对 QQ 群中的个体进行分别谈话,访谈所使用的方法是结构化访谈大纲。通过访谈以了解群成员参与QQ 群讨论的动机和想法等信息,弥补通过数据挖掘技术获取信息的不足。

2 统计与分析

2.1 用户在交流频次的分析

在线交流频次可反映群成员的活跃度,可以推测群成员的交互程度[3]。本文将养老班大学生三年的聊天记录数据分别导入到记事本文件中,得出了在线发言频次和内容。为了了解全成员总体发言的相对变化,本文利用EXCEL将最后的数据计算了频率,如表 1 所示。

1 在线发言情况演变表

序号

频次

频率分布

 

频次

频率分布

 

频次

频率分布

大一

 

大二

 

大三

1

80

10.19%

 

81

6.28%

 

71

16.21%

2

22

2.80%

 

24

1.86%

 

21

4.79%

3

88

11.21%

 

315

24.42%

 

38

8.68%

4

26

3.31%

 

27

2.09%

 

19

4.34%

5

115

14.65%

 

54

4.19%

 

28

6.39%

6

12

1.53%

 

30

2.33%

 

26

5.94%

7

140

17.83%

 

201

15.58%

 

92

21.00%

8

45

5.73%

 

147

11.40%

 

29

6.62%

9

36

4.59%

 

36

2.79%

 

32

7.31%

10

30

3.82%

 

90

6.98%

 

9

2.05%

11

45

5.73%

 

30

2.33%

 

16

3.65%

12

15

1.91%

 

3

0.23%

 

8

1.83%

13

46

5.86%

 

156

12.09%

 

20

4.57%

14

50

6.37%

 

33

2.56%

 

14

3.20%

15

35

4.46%

 

63

4.88%

 

15

3.42%

总计

785

100.00%

 

1290

100.00%

 

438

100.00%

 从三年的整体数据看,序号为1、3、5、7的群成员频率一直呈现较高值,说明他们在群里的发言较为积极,可推测这些群成员对于整个群的凝聚度有较大的影响力;序号为 12的群成员频率一直呈较低值,发言次数较少,可推测这些群成员可能有边缘趋势。从单个人物数据分析看,1大一大二信息频率较为持平,但在大三信息频率暴增,可推测改成肯能为通知的直接下达者;3在大二信息频率较大,5在大一信息频率较大,可推测该成员可能有特殊的身份职责;7在三年中一直保持频率最高值,且三年频率保持很稳定,可推测该成员为班级中核心成员。

通过访谈了解,1为辅导员,3为学习委员、5为卫生委员、7为班长,调查结果与用户在交流频次推测结果相似。10、12成员发言的次数很低, 但是在现实环境中这几位成员比较活跃,可以推测这几位群成员不喜欢在虚拟环境下交流。

2.2 用户在交流角色的分析

在一个虚拟社区互动中存在三种角色,中心参与者、边缘参与者和旁观者[4]。本文通过对该 QQ 群中集中的聊天片段中各成员的回复情况分析,构建社会网络关系图,如图 1 所示。

 

 

 

大一

大二

大三

1 社会网络关系图

三年的整体数据看,大一至大三社会网络关系的构建逐渐简单,可推测班级群成员的相互联系逐渐减少。从单个阶段数据分析看,中心参与者情况为:大一有三中心(分别为7、3、5),大二有两中心(分别为7、3),大三有两中心(分别为7、1),中心参与者的变化可能与大学生各学期不同任务有关。边缘参与者情况为:大一中1、7、6、11、12团体群员之间均有联系和2、3、4、5、8、9团体群员之间均有联系,大二中7、14变得更加紧密,大一中形成的两个团社会网络变稀疏,可推测这些人之间关系的变化。旁观者10三年期间与其他成员联系均不多。

通过访谈了解,10为男生,7、6、11、12属于一个宿舍,2、3、4、5、8、9属于一个宿舍。14成员发言频次高通过聊天记录发现该生关注的都是关于专业方面的学习,调查发现是该班级的三好学生。10在大三期间与他人的交流增加,其原因为10、4、8、13均在同一家医院实习。12认为虽然自己的发言频次不高,但对于所有的讨论话题,他是经过了自己的思考,并在线下给出了自己的意见。2、4、9发言频次一般,一般都是一起因为一件事情发言,在群里逗逗嘴聊聊天,在现实生活中她们一直是好朋友。

2.3 用户的情感分析

文本情感分析,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程[6]。本文归纳为积极情绪、中性情绪和消极情绪三个方面。本文将所搜集的2173条聊天记录导入到ROST.CM中进行情感分析,如图所示。

 

情感分析

三年的整体数据看,积极情绪百分比一直比较高,可以推测QQ 群成员之间的交流情况表现为具有较好的凝聚力,且群体的情感呈积极状态。从单个情绪数据分析看,积极情绪在大二期间所占比例较大,消极情绪在大三期间所占比例较大,可以推测大三QQ群成员面临很多问题,学生情绪比较低落。

通过访谈了解,大一刚进入大学,对一切事物都有好奇,想在大学好好学习,对各种事物都存在一定的新鲜感,勇于尝试各种群体新鲜事物,因此表现出比较高的积极情绪。大二即将出学校实习,QQ成员有积极的行动去面对即将走出学校怀抱,满腔热血。大三实习期间,上班辛苦,倒晚夜班生物钟紊乱,害怕出差错,即将走出学校,面临就业的压力,消极情绪直线上升。 

3 结论以及启示

虽然基于数据挖掘技术对用户信息与行为分析需要在一定的语境下进行,但利用该技术能够在一定程度上反映出当前 QQ 群的状态,对于监控和掌握该群动态、及时对用户行为进行适当的引导和支持方面具有重大的意义。基于数据挖掘技术对班级管理的启示:

其一,目前利用QQ进行日常办公、信息处理已成为趋势,然而在学生管理工作中,使用数据挖掘技术的人工智能平台较少,学生日常行为与学工管理系统对接不够,移动办公还存在困难,功能拓展还存在局限。因此,通过数据挖掘,分析在线参与者的交流频次,绘制社会网络关系图,把握群体交流动态,可实现网络在线管理,满足学院智慧化校园应用的长期持续发展。

其二,在互联网虚拟数据信息之中,由于环境的自由,大部分学生

微信二维码
扫码添加微信咨询
QQ客服:1663286777
电话:137-1883-9017
收到信息将及时回复