数据分析

数据分析日常学习

今天来学习一下ROC(灵敏度)的意义,ROC对模型模型评估有着重要意义。 我们以客户违约数量预测模型作为例子,灵敏度可判断正确的违约客户数,我定义为违约客户正确率(Y),误判率就是判断错误的正常的客户数(X)。ROC曲线以误判率(X)与违约客户数(Y)连接的一条曲线,范围0~1. ROC曲线中,越接近1,越说明模型或数据可靠,通俗来说就是点越靠近左上方越好。 以图中A、B两点举例说明,我们先通过ROC的理论知识得到A点优于B点,下面通过图例分析来验证理论。 A点坐标(0.3,0.7),X轴的误判率为0.3,Y轴的违约客户数0.

数据分析

汽车商圈划分-聚类分析

现基础数据是各品牌4S店网点坐标已经获取,要根据这些散点坐标进行商圈划分,商圈定义如下: 小商圈:三点及三点以上的彼此间距小于1KM的区域,形状可为多边形 大商圈:三点及三点以上的彼此间距小于3KM的区域,形状可为多边形 这个课题是我师父给我的春节礼物,让我以数据分析的角度去思考如何勾画出商圈范围。 由于每个汽车品牌的4S店全国数量平均在600家左右,如果仅按照2017年销量排名TOP25来划分商圈,1.5万个点来分析。 根据目前已有知识,我想到的方法是聚类分析(描述性数据分析方法)

数据分析

mysql 内联接 外联接

1、内联接 inner join on 使用比较运算符根据每个表共有的列的值匹配两个表中的行 2、外联接 1)左联接 left join on 返回符合连接条件和查询条件,如果左表的某行在右表中没有匹配行,则将为右表返回空值 2)右联接 right join on 返回符合连接条件和查询条件,如果右表的某行在左表中没有匹配行,则将为左表返回空值 3)全联接 left join union right join 左外连接和右外连接的数学合集(去重复)