信用卡账单负数是什么意思啊(招商银行信用卡账单负数是什么意思)

编辑导语:目前,各行各业都在寻找降本增效的有效途径,AI人工智能、机器学习等概念也广泛应用于业务;亚马逊云技术推出的0代码机器学习智能工具——Amazon SageMaker Canvas,它是一种可以应用于数据分析业务的工具。本文作者对该工具进行了经验评估。

信用卡账单负数是什么意思啊(招商银行信用卡账单负数是什么意思)

随着人工智能技术的发展和普及,人们对机器学习和数据分析的需求一直很高。很少有行业不涉及交易机器学习

与许多大型科技公司一样,亚马逊云科技也推出了无低代码机器学习平台——Amazon SageMaker Canvas,让我们今天试试吧。

一、评估说明

  • 评估师:B端产品经理,硕士,计算机专业,机器学习方向;
  • 测评对象:Amazon SageMaker Canvas(低代码机器学习平台);
  • 评价目的:评价产品的可操作性(使用方便)和预测准确性(好不好)。

二、使用体验评价

1. 对没有机器学习知识的人友好

作为一个具有机器学习专业知识背景的新用户,我从最初的账户注册到最终使用SageMaker Canvas建立一个模型只需要半天的时间。它不仅不需要在本地计算机上安装各种软件、数据库和包,而且还节省了数百行机器学习代码。整个过程可以构建机器学习模型,完成本地数据的预测和分析。

对比过去和现在,如果你想使用机器学习算法对手头上的数据进行分类、预测:

信用卡账单负数是什么意思啊(招商银行信用卡账单负数是什么意思)

表1 过去 VS. 现在

2. 界面风格简洁

从产品经理的角度来看,Amazon SageMaker Canvas每一页的排版风格、控件设计和交互效果都非常通俗易懂。

例如,登录Amazon SageMaker Canvas在工作台之后,您可以查看帐户下的所有创建模型和导入的数据集。其中,模型列表支持两种显示形式:卡列表和表格列表。

就我个人而言,我更喜欢卡片列表,因为与表格列表相比,卡片列表的风格要活泼得多,这可以使页面看起来不那么僵化和单调。然后进入模型后,您将看到选择数据>>模型构建>>模型分析>>这四个步骤可以引导用户更方便地完成模型构建。

信用卡账单负数是什么意思啊(招商银行信用卡账单负数是什么意思)

图1 模型列表-卡片式

信用卡账单负数是什么意思啊(招商银行信用卡账单负数是什么意思)

图2 训练模型的步骤

三、功能评估

低代码作为一种技术手段,自然有其独特的优势,但与传统相比,低代码机器学习平台的预测准确性python编程语言会下降吗?

下面将使用分类和预测两类场景Amazon SageMaker Canvas构建模型,并将Amazon SageMaker Canvas模型的准确性和构建python对比分析编程语言的结果。

1. 分类问题

1)数据集

我们通常接触到的大多数分类问题都是二分类问题,而不是一个或另一个。乳腺癌分类问题是机器学习中的一个经典的二分类问题。建立乳腺癌风险评估模型预测乳腺癌概率对乳腺癌的防治具有重要意义。

本文使用的数据集来自威斯康星州公开的乳腺癌诊断数据集,医务人员收集了患者乳腺肿块细针穿刺后的数字图像,从这些数字图像中提取32个特征,用这些特征描述图像细胞核呈现。

数据集共569行,每行数据有32个特征,第一行是id,第行为diagnosis诊断类型(良性/恶性),第3-32个特征实际上只包含10个属性,但每个属性从3个维度分析:平均值、标准差和最大值,因此共有30个特征。

信用卡账单负数是什么意思啊(招商银行信用卡账单负数是什么意思)

表2 乳腺癌数据集说明

2)对比分析

使用Amazon SageMaker Canvas乳腺癌分类的步骤如下:

① 登录Amazon SageMaker Canvas。

② 数据准备:导入本地数据到Amazon SageMaker Canvas。

③ 构建模型,选择数据集中的列作为模型预测的目标列SageMaker Canvas问题是分类问题还是预测问题将根据列值自动识别。在我导入乳腺癌数据集时,我选择了diagnosis列为目标列后,Amazon SageMaker Canvas判断为二分类问题。的确,该列只有两个值:B表示乳腺癌良性,M表示乳腺癌恶性。

除此之外,SageMaker Canvas上传的数据集将自动预处理。例如,使用数据集中相邻值来推断缺失值,并可以提供数据集中每列数据是如何分布的,这大大节省了使用python对特征进行预处理和选择。

信用卡账单负数是什么意思啊(招商银行信用卡账单负数是什么意思)

图3 使用python特征预处理

然后单击构建或预览模型,SageMaker Canvas您将从您自己的包装模型中推荐最合适的模型,并根据重要性对特征进行排名。您可以看到哪些特征对机器学习模型影响最大,删除不重要的特征,点击更新模型,直到模型准确性没有明显变化。

信用卡账单负数是什么意思啊(招商银行信用卡账单负数是什么意思)

图4 特征排名的重要性

讲到这里,大家肯定想印证一下,用python编程语言筛选的特征和Amazon SageMaker Canvas给出的特征排名,两者之间是否有偏差,或者有多少是一致的?下面就为大家揭秘。

如下图所示,左边是Amazon SageMaker Canvas排名,右边是python特征相关性热力图,因此热力图选择相关特征值维度值较大的特征。

信用卡账单负数是什么意思啊(招商银行信用卡账单负数是什么意思)

表3 SageMaker Canvas Vs. Python

能够识别患者是否患有乳腺癌的分类器训练,那么如何判断分类器的优缺点呢?

使用传统的方法来评估分类器的性能混淆矩阵描述数据集的真实标签和模型预测标签之间的差异。此外,基于混淆矩阵,可以计算各种指标来比较分类器的性能,如F1-Score、准确率(Accuracy)、精确率(Precision)、召回率(Recall)、AUC值。

如下表所示,对比上述指标的结果。通过比较,使用Amazon SageMaker Canvas获得的模型评使用Python中linear_SVM算法得到的结果几乎是一致的,几乎是一致的。

只是AUC值一列,似乎有一些问题,Amazon SageMaker Canvas得出的为0.991%,python得出的是0.974,值是一致的,但是测量差了两个小数点,还有待进一步探讨。

信用卡账单负数是什么意思啊(招商银行信用卡账单负数是什么意思)

表4 Amazon SageMaker Canvas VS. Python

信用卡账单负数是什么意思啊(招商银行信用卡账单负数是什么意思)

图5 SageMaker Canvas混淆矩阵和几个指标

3)小结

分类算法的应用范围和场景很多,涉及各行各业。我们要解决的问题大多可以抽象为分类问题.

以信用卡的生命周期为例。在营销期间,利用分类算法预测积累的客户数据,找到潜在的推广客户,满足个性化营销。

在审计阶段,需要对客户进行资格评估,不通过分类算法预测违约概率,以达到信用评级的目的。

在稳定期,随着客户的到来账龄不断增长,客户资质不断变化,需要定期对客户进行风险研究,及时发现风险客户并进行管理。

最后,在衰退期,会涉及到客户流失的问题,需要用分类算法来预测客户流失的可能性。

2. 预测问题

1)数据集

波士顿房价预测是一个经典的数据分析/机器学习入门级项目。众所周知,房价一般与房间面积、房屋所在城市、房屋空间布局等因素有关。房价预测的任务是给出与房价相关的数据,通过这些数据预测房价。

波士顿房价数据集:波士顿内基梅隆大学的波士顿房价数据集StatLib库涵盖了麻省波士顿506个不同郊区的房屋数据,404个培训数据集,102个测试数据集 每个数据有14个字段,包括13个属性和1个房价的平均值。下表描述了波士顿房价数据集的特征:

信用卡账单负数是什么意思啊(招商银行信用卡账单负数是什么意思)

表5 波士顿房价预测数据集

2)对比分析

波士顿的房价数据集中了13个特征,每个特征或多或少都会上涨或抑制房价。SageMaker Canvas排名和预测特征的重要性Python对比机器学习算法,发现前7个特征中有5个重叠,证明了SageMaker Canvas模型预测值得信赖。

例如,抑制房价最明显的特征是NOX,它表示一氧化氮的浓度。根据常识,一氧化氮浓度越高,住房所在地的环境污染越严重,房价就越便宜。房价上涨最明显的特点是 RM,对应数据集,RM指每栋房子的平均房间数量,这也很容易理解,房间越多,总面积越大,总房价越高。

信用卡账单负数是什么意思啊(招商银行信用卡账单负数是什么意思)

表6 Canvas特征排名的重要性 VS. Python得出的

SageMaker Canvas除了对数据集中影响预测结果的特征进行重要排名外,还可以清楚地显示每个特征与预测结果之间的关系(正相关或负相关),例如,LSTAT这一特征意味着该地区有多少房东属于低收入人群。如下图所示,该地区低收入人群越多,房价越低。

信用卡账单负数是什么意思啊(招商银行信用卡账单负数是什么意思)

图7 各属性对模型预测的影响排名

鉴于可视化能给人们带来最直观的认知,SageMaker Canvas它提供了可视化方法来显示回归模型预测效果。

如下图所示,可以看到波士顿房价数据集,预测房价与实际房价的对比图。针对预测问题,SageMaker Canvas均方根误差提供(RMSE),如下图所示,线条周围紫色区域的宽度代表RMSE房价预测值通常在这个范围内。

信用卡账单负数是什么意思啊(招商银行信用卡账单负数是什么意思)

3)小结

这一次,正在使用SageMaker Canvas在预测房价的过程中,我们只需要给定输入数据集,SageMaker Canvas可以推断出指定目标变量的可能结果。其他预测问题也可以在SageMaker Canvas上实现。

四、总结

高昂的硬件价格、复杂软件配置一直是阻碍初学者入门 AI 低代码机器学习开发平台的出现和推广是码盲人的曙光。支持比通过低代码功能使用 Python 新的机器学习算法,编码更快、更容易,变得令人期待。可以看出,在未来,即使是完全没有机器学习知识的业务人员也可以利用机器学习模型有效地解决业务中的实际问题。

本文由 @麦地与诗人 每个人都是产品经理。未经许可,禁止转载

题图来自unsplash,基于CCO协议

学习养卡提额,融资,信用卡背后财富,免费学习价值998课程 每天限前10名,添加 微信:tu359813 备注:我想学习

关注公众号:阿呆聊卡 学习更多干货
本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 181012072@qq.com举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.xinshang6.com/3560.html