导读:文本挖掘(text mining)是对自然语言正文中所包含数据的分析。文本挖掘将非结构化数据中的词和短语转化成数值,这些数值可以连接到一个数据库中的结构化数据并被传统数据挖掘技术分析。
关键词:文本挖掘 text mining
【TechTarget中国原创】文本挖掘(text mining)是对自然语言正文中所包含数据的分析。文本挖掘将非结构化数据中的词和短语转化成数值,这些数值可以连接到一个数据库中的结构化数据并且可被传统数据挖掘技术分析。
文本挖掘(text mining)在处理以下任务时尤其有用: • 给相关部门发邮件。 • 整理不同数据存储文本中有关产品满意度的信息。 • 分析开放式问题。
人们普遍认为,非结构式数据大多存在于文本文件中,它在一个组织数据中所占比例至少达八成。由于自然语言正文通常是矛盾的,所以文本挖掘工作很有挑战性。这些矛盾包含由语义、句法和俚语所引起的意义不明确。
翻译:徐艳