orange人工智能回归问题

实验介绍:

橙现智能是一款可视化,无编程,无门槛的免费人工智能软件。
机器也可以学习,机器学习可以简单理解成总结经验,发现规律,掌握规则,预测未来。

[此处插入图片],该图片作者为未知,来源于百度,仅学习非商用。

一:软件的安装

中文版本下载地址

https://pan.baidu.com/s/1TaYQd5rAzbemBW0EFbNNZA?pwd=8ekr 
提取码:8ekr,里面自带一些数据
概念先按下不表,我们直接从实操开始

二:回归问题

最近房价跌得很快,我们要怎么预测未来的房价呢?

给出历史数据,预测一个数值需要线性回归算法

why?
回归的意思是回归到平均值,举例:一个家族平均身高都是1.7m,即使有个人身高2.1m,一般来说他的子女也很难那么高。我们需要找一个模型,使它预测的值“回归”真实值。
线性的意思就是可以简单理解为直线。

数据+算法生成模型


未导入数据文件,文件上出现x
数据链接

数据处理

与结果密切相关的数据角色为“特征”,我们要预测的数据角色为“目标”,与结果无关的数据角色为“忽略”
如果我们要预测明天食堂的消费额:index(序号)与食堂消费额无关,所以角色为“忽略”;消费额是我们要预测的,所以角色为“目标”。

点击右边半弧拖出一条线,用中文或英语搜索部件

左边半弧是输入,右边半弧是输出。

数据表能让我们直观看见数据

为什么这个显示没有数据呢?

因为我们没有把文件数据输入算法

点开散点图可以看见,线性回归算法拟合的一个方程和值的对比。

为什么方程在值的点中间呢,前面我们说了回归方程是要回归到平均值的。越多点越接近直线,点越均匀分布在直线两侧,则方程拟合越好。

我们添加预测小部件利用数据和算法对未来的情况进行预测和分析


R²是1-点距离方程的距离的平方和,越接近一,代表拟合越好。

已经看见线性回归预测消费额和食堂实际消费额,但还不够可视化。怎么办呢?
添加折线图查看线性回归预测消费额和食堂实际消费额对比
制作折线图时,通常是需要先选择合适的列数据,所以我们需要选择列部件。

把线性回归和消费额作为目标

点开折线图可以看见
选择消费额按住ctrl再选线性回归,可以使两个折线在一张图上。

三:分类问题

我们怎么训练人工智能自动区分猫狗呢?

分类问题需要使用逻辑回归算法。

为什么不是线性回归算法呢?
因为线性回归算法是取平均值;假设我们有宠物的体重数据作为特征来判断是猫是狗,有些品种的猫如缅因猫体型庞大容易误判狗,有的狗体型小如吉娃娃容易误判猫还会大幅度拉低平均值,使线性方程偏离。

如果线性回归方程是一条直线,逻辑回归方程则是一条曲线。

我们在文件导入三种鸢尾花的数据,训练人工智能区分不同种类的鸢尾花。

使用分布小部件 柱状图查看不同种类鸢尾花的数据分布


可以看见不同种类的鸢尾花花瓣长度差异很大

花萼宽度差异不大

混淆矩阵用于总结分类模型预测结果


紫色代表预测和实际相同的数量。红色代表预测和实际不相同的数量。
预测正确的数量是,13+13+12=38。

在测试和评分小部件查看CA,AUC


ROC分析也是越接近一越好

作者:纤秾原文地址:https://www.cnblogs.com/xiannong/p/18509900

%s 个评论

要回复文章请先登录注册