Across a wide variety of fields, data are being collected and accumulated at a dramatic pace. There is an urgent need for a new generation of computational theories and tools to assist humans in (96) useful information (knowledge) from the rapidly growing (97) of digital data. These theories and tools are the subject of the emerging field of knowledge discovery in database (KDD). At an abstract level, the KDD field is concerned with the development of methods and techniques for making (98) of data. The basic problem addressed by the KDD process is one of mapping low-level data(which are typically too voluminous to understand and digest easily) into other forms that might be more (99) (for example, a short report), more (100) (for example, a descriptive approximation or model of the process that generated the data), or more useful (for example, a predictive model for estimating the value of future cases). At the core of the process is the application of specific data-mining methods for pattern discovery and extraction.
A.theoretical
B.meaningful
C.sophisticated
D.abstract
参考答案:D
解析:[译文] 跨越多个不同的领域,数据以惊人的速度被收集和积聚。急需新一代的计算理论和工具以帮助人们从快速增长的大量数字数据中抽取有用信息(知识)。这些理论和工具是正在升起的数据库知识发掘(KDD)的研究主题。从抽象层次来看,KDD关心的是如何搞清数据的含义的方法和技术的开发。KDD过程所强调的基本问题是一种把低级数据(通常十分庞大,难以理解和消化)映射到其他形式,这些形式可能更加简洁(例如,一个简短的报告)、更加抽象(例如,一个数据产生过程的近似描述和模型),或者更有用(例如,一个用来评估将来案例的预测模型)。这个过程的核心是用于模式发现和抽取的特定的数据挖掘方法。
[分析]: 随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。
从技术上来看,数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。从商业上来看,数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。
数据挖掘与传统的数据分析(如查询、报表、联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先未知,有效和可实用三个特征。