1.10 数据挖掘与信息检索
1.10 数据挖掘与信息检索
数据挖掘简介
数据挖掘(data mining
)这个术语指半自动地分析大型数据库并从中找出有用的模式的过程。
和人工智能中的知识发现(也称为机器学习( machine learning)
或者统计分析一样,数据挖掘试图从数据中寻找规则或模式。
但是,数据挖掘和机器学习、统计分析不一样的地方在于:据挖掘处理的主要是存储在磁盘上的大量数据。也就是说,数据挖掘就是在数据库中发现知识。
通常在数据挖掘中还需要人参与,现实中的数据挖掘是一个半自动的过程。
信息检索系统简介
信息检索系统和数据库系统很大程度上是相同的——特别是基于辅助存储器的数据存储和检索。但是信息系统领域与数据库系统所强调的重点是不同的,信息系统重点强调基于关键词的查询,文档与查询的相似度,以及文档的分析、分类和索引。