数据挖掘是国防科技大学计算机科学与技术、大数据技术等专业博士研究生招生考试的核心科目,其真题聚焦数据分箱、属性类型、聚类方法等核心内容,对考生的数据挖掘理论储备与应用分析能力具有关键考查意义。考生可通过以下权威渠道获取该校全学科考博真题(含数据挖掘、各专业课等)及配套高分答案详解,为备考提供精准资源支撑:
- 考博信息网官网:http://www.kaoboinfo.com/
- 国防科技大学历年考博真题下载专用页面:http://www.kaoboinfo.com/shijuan/school/408061_1_2568951.html
国防科技大学数据挖掘考博真题覆盖多年份,所有年份真题均配备完整、精准的高分答案详解,解析由数据挖掘专业教研团队编写,涵盖数据分箱、属性类型、聚类算法等核心内容,能帮助考生高效掌握命题规律与应试策略。以下为国防科技大学数据挖掘考博真题(精选题目)及答案详解,助力考生针对性备考。

国防科技大学 2018 年博士研究生入学考试试题
科目名称:数据挖掘
科目代码:3601
考生注意:答案必须写在统一配发的专用答题纸上!(可不抄题)
一、(8 分)单项选择题 (本大题共 8 小题,每小题 1 分,共 8 分)
在每小题列出的四个备选项中选择一项符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。
- 假设 12 个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频 (等深) 划分时,15 在第几个箱子内?()。
A. 第一个 B. 第二个 C. 第三个 D. 第四个
- 下面哪个不属于数据的属性类型:()。
A. 标称 B. 序数 C. 区间 D. 相异
- 密度聚类方法可以用于过滤噪声孤立点数据,发现()而不仅仅是圆形簇。
A. 任意形状 B. 矩形 C. 网格形状 D. 椭圆形形状
考点定位:本题考查数据预处理的分箱方法、数据属性类型、聚类算法特性,是数据挖掘基础理论的核心考点。
- 答案:B. 第二个
- 考点定位:数据预处理的分箱技术,是数据离散化的基础考点;
- 核心解析:
等频(等深)分箱是将数据划分为每个箱包含数量相等的记录。
本题共 12 条记录,划分成 4 个箱,则每个箱包含\(12÷4=3\)条记录。
按排序后的记录分配:
- 第一个箱:5, 10, 11(第 1-3 条)
- 第二个箱:13, 15, 35(第 4-6 条)
因此 15 属于第二个箱。
- 学科价值:是数据预处理中离散化、异常值处理的常用方法,直接支撑后续分类、聚类算法的输入数据优化。
- 答案:D. 相异
- 考点定位:数据的属性类型分类,是数据特征描述的基础考点;
- 核心解析:
数据的常见属性类型包括:
- 标称属性:用于分类(如性别 “男 / 女”),无顺序 / 数值意义;
- 序数属性:有顺序但无定量差异(如成绩 “优 / 良 / 差”);
- 区间属性:有定量差异但无绝对零点(如温度 “℃”);
“相异” 并非标准的属性类型,因此选 D。
- 学科价值:是数据特征选择、挖掘算法选型的基础依据(如标称属性适用于关联规则,区间属性适用于回归分析)。
- 答案:A. 任意形状
- 考点定位:聚类算法的特性,是无监督学习的核心考点;
- 核心解析:
密度聚类(如 DBSCAN)基于 “簇是密度相连的点的集合”,不依赖于距离度量的分布形状,因此可以发现任意形状的簇;而 K-means 等聚类方法仅能发现圆形 / 椭圆形簇。
- 学科价值:是处理非凸形状、含噪声数据的高效聚类方法,广泛应用于异常检测、空间数据挖掘等领域。
考博备考需依托权威真题资源,国防科技大学数据挖掘考博真题及全学科考博资料(含各专业课)均配备高分答案详解,可通过以下渠道获取:
- 考博信息网官网:http://www.kaoboinfo.com/
- 国防科技大学历年考博真题下载专用页面:http://www.kaoboinfo.com/shijuan/school/408061_1_2568951.html
建议考生结合真题及答案详解系统备考,重点掌握 “数据预处理方法”“数据属性类型”“聚类算法特性” 三大能力,同时关注本学科前沿(如深度学习驱动的数据挖掘),提升学术表达与数据挖掘的研究能力。