【machine learning-六-supervise learning之线性回归模型】

news/2024/9/19 18:59:31 标签: 线性回归, 算法, 回归

监督学习之回归>线性回归模型

  • 回归>线性回归模型
  • 如何使用线性模型实现智能化预测呢
    • 寻找数据
    • 训练模型
      • 输入、特征、目标、预测值、模型
      • 代价函数

线性模型是人工智能监督学习中最广泛的应用,所以有必要先学习一下这个基础模型,做好基石。

回归>线性回归模型

顾名思义,它的涵义就是指用一条直线,来拟合样本数据。还是以预测房价为例:

线性模型

在这里插入图片描述

我们有一堆样本数据,如上图中红色表示的数据来表示房屋的面积和价格关系。
然后有人说自己的房子1500 英尺,想让你帮忙估算房子的价格,这时候应该怎么做呢?
当然方法有很多,回归>线性回归模型的做法就是把这些数据拟合成一条直线,得到的就是上图中的那条蓝色的直线
这就是这个模型称作线性模型的原因。

假设我们拟合的这个线性模型是y = x + 50,这时候1500英尺的房子很容易就预测出价格了。
当然这是最简单的线性模型,因为房价不可能只受一个因素影响,比如还有这个地区的犯罪率、靠近地铁站等等因素。所以实际上模型不是简单的y=wx + b的模型,更可能是y = wx1 + wx2 + …+ b的形式

回归模型

之所以还被称做回归模型,是因为模型输出的数据不是有限的,是个无限可能的具体值,这种输出的模型被称为回归模型,这块在第二节中有过详细的讲解。

如何使用线性模型实现智能化预测呢

寻找数据

首先是寻找合适的数据,还是以我们这次使用的房价来说,那我们就需要关于这个地方的房价的数据,足够多的数据才能能够更好的拟合样本特性。比如我们使用的波士顿房价这个数据集。
打开这个数据集,数据中的数据是这样的:
在这里插入图片描述
数据中的每一列都是一个特征,所谓的特征就是房屋尺寸等这些因素,上图中最后一列是房价,按照顺序这些列的说明如下:
在这里插入图片描述
可以看到这些列包括犯罪率等等影响因素
这块可以详细看下 https://lib.stat.cmu.edu/datasets/boston

训练模型

有了数据以后,我们就要训练模型了。
把数据中每一行都输入到线性模型中,从输入的这些数据,训练一个线性模型,来拟合这些样本数据。那么它到底做了什么呢,又是怎么达到效果的呢?

输入、特征、目标、预测值、模型

样本数据中除去最后价格列,我们称为模型输入input或者特征features
样本数据中最后一列是我们要预测的价格,称为输出,这些值是真实值,也就是target或者说label

代价函数

要预测的那列为y,而作为依据的则是模型输入x。
在这里插入图片描述
模型要做的就是在x和y之间找到一个映射关系,能够从x映射到y,这个y是label,也就是真实值。
在这里插入图片描述
但是模型不可能完全拟合样本,它只能无限的逼近这个label,这个训练过程中产生的y,这个y就叫做预测值,而我们训练的整体过程就是在不断减少真实值和预测值之间的差距,但是怎么衡量这些差距,我们叫做代价函数,会在下一节中介绍


http://www.niftyadmin.cn/n/5665995.html

相关文章

ICPC网络预选赛1G题

The Median of the Median of the Median - Problem - QOJ.ac 给定一个序列{ai},i从1到n,首先构造一个序列{bij},i和j同样是从1到n,bij表示{ai....aj}的中位数,然后再构造一个{cij},cij表示{bii.....bij.....b(i1,i1).......b(i1,j).......bjj}的中位数,最后要求输出序列{cij}…

[数据集][目标检测]红外微小目标无人机直升机飞机飞鸟检测数据集VOC+YOLO格式7559张4类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):7559 标注数量(xml文件个数):7559 标注数量(txt文件个数):7559 标注…

code eintegrity npm err sha512

当 npm install 出现报错的时候: 你应该这样去解决: 删除 package-lock.json 文件,重新执行 npm install。 问题出现的原因 EINTEGRITY 错误码表示在npm缓存中无法找到 指定sha512校验合的模块。 出现这个问题的原因是缓存不一致&…

YOLOv8改进系列,YOLOv8的Neck替换成AFPN(CVPR 2023)

摘要 多尺度特征在物体检测任务中对编码具有尺度变化的物体非常重要。多尺度特征提取的常见策略是采用经典的自上而下和自下而上的特征金字塔网络。然而,这些方法存在特征信息丢失或退化的问题,影响了非相邻层次的融合效果。一种渐进式特征金字塔网络(AFPN),以支持非相邻…

AI问答-HTTP:理解 Content-Disposition

本文背景 在下载arraybuffer文件时,想要获取文件名,这时引入本文内容Content-Disposition,我们在Content-Disposition获取到文件名就可以在下载后的文件以该文件名命名了。 一、简介 Content-Disposition是HTTP协议中的一个响应头字段&…

若依Nodejs后台、实现90%以上接口,附体验地址、源码、拓展特色功能

背景 前端的宝子们代码写累了吗?那就一起研究下后端吧! 体验地址:http://106.54.233.63:5000 Gitee源码:https://gitee.com/ruirui-study/ruoyi_nodejs_open 本项目的前端基于若依Vue3.0版本,后端是基于MidwayJs框…

inBuilder低代码平台新特性推荐-第二十四期

今天给大家带来的是 inBuilder 低代码平台新特性推荐第二十四期 ——表单格式支持流程配置。 场景介绍: 如下图所示,目前支持在流程设计上的不同节点设置表单字段的必填、显隐等属性控制,不必在表单设计上进行配置,从而减少了开…

以电子书号出版的论著可以评职称吗?

以电子书号出版的论著是否可以评职称不能一概而论,需要根据具体的职称评审单位要求来判断。具体情况如下: 专业的论著出版平台,高效的出版流程。从内容优化到市场推广,全方位服务。 1. 可能认可的情况: - 中级职称评…