博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Mining 影响数据挖掘结果的 5 方面
阅读量:6608 次
发布时间:2019-06-24

本文共 334 字,大约阅读时间需要 1 分钟。

第一个:

         数据类型、

               对象的不同属性会用不同的数据类型来描述,如  年龄-->int; 生日 -->date;数据挖掘时也要对不同的类型有不同的对待。

第二个:

         数据质量、

              数据质量直接影响挖掘结果的质量、一般必须解决数据中的 噪点,离群点,数据遗漏,重复。

第三个:

         数据挖掘的预处理步骤、

               数据挖掘前要对数据进行处理,一来使得数据适应挖掘技术,二来提高数据的质量,如把连续值转变成

               离散值(把年龄 变成中年,老年,青年,少年)以适应挖掘技术,又如要减少对象属性的数目。

第四个:

         根据数据之间的关系分析数据、

               数据分析的一种方法就是找出数据之间的关系,而后使用这一关系而不是数据来进行后面分析,如微信附近的人:

               当得到用户之间的距离时,附近与否就根据这一距离来算了。              

 

转载地址:http://zuiso.baihongyu.com/

你可能感兴趣的文章
各高级语言特点与比较
查看>>
iOS地图 -- 区域监听的实现和小练习
查看>>
Spring Boot实现一个监听用户请求的拦截器
查看>>
Java多线程总结之线程安全队列Queue
查看>>
百度编辑器 Ueditor 下拉处增加字体
查看>>
WPF 虚拟化 VirtualizingWrapPanel 和 VirtualLizingTilePanel
查看>>
Redis快速入门
查看>>
nodejs 相关
查看>>
Diffie-Hellman密钥交换算法
查看>>
复制表结构和数据SQL语句
查看>>
JavaScript onkeydown事件入门实例(键盘某个按键被按下)
查看>>
免费开源的DotNet二维码操作组件ThoughtWorks.QRCode(.NET组件介绍之四)
查看>>
Unity进阶技巧 - 动态创建UGUI
查看>>
【简单易懂的AMV图文教程-2】VEGAS基础进阶——认识关键帧
查看>>
使用css打造形形色色的形状!
查看>>
Spring切面处理
查看>>
浅谈CPU和GPU的区别
查看>>
开源大数据利器汇总
查看>>
从知名外企到创业公司做CTO是一种怎样的体验?
查看>>
Oracle 表空间和用户权限管理【转】
查看>>