首页 全部 玄幻奇幻 都市白领 武侠仙侠 言情说爱 军事历史 游戏竞技 排行 专题 用户中心 原创专区
悠悠小说网 > 都市白领 > 职场小聪明 > 第603章 机器学习里的分类问题和回归问题,一个故事解释

用故事解释分类问题和回归问题

1. 分类问题的故事——森林里的神秘果子

在一片神秘的森林里,小明发现了许多奇怪的果子。有些果子可以吃,而有些果子有毒。他想找到一个方法来区分这些果子。

他观察到:

? 颜色:红色的果子通常是可食用的,紫色的果子通常是有毒的。

? 形状:圆形的果子大多能吃,尖尖的果子往往有毒。

? 大小:太小的果子似乎更危险。

于是,小明决定建立一个“吃不吃果子”的规则系统:

? 如果果子是红色且圆形,就吃!

? 如果是紫色且尖尖的,就不吃!

? 其他情况要谨慎判断。

这个过程就是分类问题——它的目标是给每个果子打上一个“可吃”或“不可吃”的标签。

分类问题的典型特征:

答案是离散的类别(例如:“可吃” vs. “不可吃”)

数据用于区分不同类别(红色vs. 紫色,圆形vs. 尖形)

最终输出是一个标签(1=可吃,0=不可吃)

现实中的应用:

? 邮件是否是垃圾邮件?(垃圾 vs. 非垃圾)

? 贷款申请者是否值得批准?(批准 vs. 拒绝)

? 识别图片中的动物是什么?(猫 vs. 狗)

2. 回归问题的故事——小明卖柠檬水

夏天到了,小明在街头卖柠檬水。他想预测明天应该准备多少杯柠檬水,以免浪费或卖不够。

他发现:

? 温度越高,卖出的柠檬水越多。

? 天气越晴朗,卖出的柠檬水也越多。

? 湿度太高时,人们反而不太想买柠檬水。

他收集了一些数据,比如:

? 昨天 30°C,卖出 50 杯

? 昨天 35°C,卖出 70 杯

? 昨天 28°C,卖出 45 杯

他想建立一个预测模型,比如:

这样,如果明天预测是 32°C,他可以计算:

那么,他就应该准备大约 76 杯柠檬水。

这个过程就是回归问题——它的目标是预测一个连续的数值,而不是一个固定类别。

回归问题的典型特征:

答案是一个数值,而不是分类标签(如“明天卖 76 杯”而不是“卖得多”或“卖得少”)

数据之间有连续性的关系(温度从 20°C 到 40°C,销量随之变化)

最终输出是一个数值预测(如“销量=76”)

现实中的应用:

? 预测房价(基于面积、地段等因素预测房价)

? 预测股票价格(基于历史数据预测未来走势)

? 预测某人未来的收入(基于年龄、教育、工作经验等)

用比喻解释分类问题和回归问题

1. 分类问题——“选择哪种衣服?”

想象你站在衣柜前,思考今天穿什么衣服。你会根据天气决定:

? 晴天 → 穿T恤

? 下雨 → 穿雨衣

? 下雪 → 穿羽绒服

这是一个分类问题,因为你的决策结果是几个固定选项之一(T恤、雨衣、羽绒服)。

2. 回归问题——“决定穿多厚?”

如果你不仅要决定穿什么,还想确定该穿多厚的衣服,就成了回归问题。

你会想:

? 10°C,应该穿厚毛衣 外套(厚度 8 分)

? 20°C,应该穿薄外套(厚度 5 分)

? 30°C,应该穿短袖(厚度 2 分)

这样,你的决定不只是T恤/雨衣/羽绒服,而是一个连续数值(衣服的厚度),这就类似于回归问题。

总结

对比点 分类问题 回归问题

输出类型 固定类别(离散值) 连续数值

目标 识别类别(苹果 or 橘子) 预测数值(温度 vs. 柠檬水销量)

典型应用 垃圾邮件分类、疾病诊断 房价预测、销量预测

示例 这封邮件是垃圾邮件吗?(是/否) 明天应该卖多少杯柠檬水?(75 杯)

分类问题适合选出某个类别,而回归问题适合预测一个数值。希望这些比喻能帮你更容易理解它们的区别!

喜欢职场小聪明请大家收藏:()职场小聪明全本小说网更新速度全网最快。

目录
设置
设置
阅读主题
字体风格
雅黑 宋体 楷书 卡通
字体风格
适中 偏大 超大
保存设置
恢复默认
手机
手机阅读
扫码获取链接,使用浏览器打开
书架同步,随时随地,手机阅读
收藏
换源
听书
听书
发声
男声 女生 逍遥 软萌
语速
适中 超快
音量
适中
开始播放
推荐
反馈
章节报错
当前章节
报错内容
提交