2020年国防科技大学数据挖掘考博大纲

 您现在的位置: 考博信息网 >> 文章中心 >> 院校信息 >> 招生简章 >> 正文 2020年国防科技大学数据挖掘考博大纲

考研试卷库
2020年国防科技大学数据挖掘考博大纲

国防科技大学2020年博士研究生入学考试自命题科目考试大纲

科目代码:3601   科目名称:数据挖掘

一. 考试要求

主要考查学生对数据挖掘基本概念的理解与掌握;对数据挖掘常用算法关联分析、分类、聚类等主要思想和主要方法的理解与掌握;以及运用数据挖掘算法解决问题的能力。

二、考试内容

1.数据挖掘概述

数据挖掘的概念、性质、分类以及数据挖掘的基本原理。数据挖掘的基本步骤。数据库、数据仓库、事务数据等基本概念。

2.认识数据

数据对象与属性类型,数据的基本统计描述,以及度量数据的相似性和相异性计算方法等。

3.数据预处理

数据清理方法、数据集成方法、数据规约方法、以及数据变换与数据离散化方法,具体包括:缺失值和噪声数据的处理、实体识别问题、冗余和相关性分析、元组重复、数据值冲突的检测与处理、主成分分析、直方图、抽样、规范化数据变换、分箱离散化、直方图离散化等。

4.关联分析

频繁模式基本概念,频繁项集、闭项集、关联规则,频繁项挖掘方法,Apriori以及改进方法、模式增长方法、垂直数据格式频繁项挖掘,挖掘闭模式和极大模式。

5.分类

分类基本概念,决策树归纳,贝叶斯分类方法,最近邻分类器,支持向量机,神经网络分类器,模型的评估与选择,评估分类器性能的度量、保持方法和随机二次抽样、交叉验证、自助法、使用统计显著性检验选择模型、基于成本效益和ROC曲线比较分类器,提高分类准确率的技术,组合分类方法、袋装、提升和AdaBoost,随机森林、提高类不平衡数据分类的准确率。

6.聚类

聚类基本概念,k-均值、k-中心点、层次方法、基于密度的方法、谱聚类、基于概率模型的聚类,聚类评估方法。

7.离群点检测

离群的基本概念,离群点检测方法,统计学方法,基于近邻性的方法,基于聚类的方法,基于分类的方法,挖掘情境离群点和集体离群点。

三、考试形式

考试形式为闭卷、笔试,考试时间为3小时,满分100分。

题型包括:选择题、判断题、简答题、分析应用题等。

四、参考书目

1.《数据挖掘概念与技术》. Jiawei Han(范明,孟小峰译). 北京:机械工业出版社,2012年,第3版.

 

考博咨询QQ 135255883 考研咨询QQ 33455802 邮箱:customer_service@kaoboinfo.com
考博信息网 版权所有 © kaoboinfo.com All Rights Reserved
声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载或引用的作品侵犯了您的权利,请通知我们,我们会及时删除!