100000是多少钱,100000是十万吗

机器听不懂我们人类语言,我们得用数学语言向它描述问题,这就叫“建模”。Google研发了十年自动驾驶后,终于在本月上线了自动驾驶出租车服务。感谢“深度学习”技术,人工智能近年来在自动驾驶、疾病诊断、机

机器听不懂我们人类语言,我们得用数学语言向它描述问题,这就叫“建模”。

Google 研发了十年自动驾驶后,终于在本月上线了自动驾驶出租车服务。感谢“深度学习”技术,人工智能近年来在自动驾驶、疾病诊断、机器翻译等领域取得史无前例的突破,甚至还搞出了些让人惊艳的“艺术创作”:

Prisma 把你的照片变成艺术作品

AI 生成的奥巴马讲话视频,看得出谁是本尊吗?

开源软件 style2paints 能自动给漫画人物上色

如果不了解其中的原理,你可能会觉得这是黑魔法。

但就像爱情,“深度学习”虽然深奥,本质却很简单。无论是图像识别还是语义分析,机器的“学习”能力都来源于同一个算法 — 梯度下降法 (Gradient Descent)。要理解这个算法,你所需要的仅仅是高中数学。在读完这篇文章后,你看待 AI 的眼光会被永远改变。

一个例子

我们从一个具体的例子出发:如何训练机器学会预测书价。在现实中,书的价格由很多因素决定。但为了让问题简单点,我们只考虑书的页数这一个因素。

在机器学习领域,100000是十万吗,这样的问题被称为“监督学习 (Supervised Learning)”。意思是,如果我们想让机器学会一件事(比如预测书的价格),那就给它看很多例子,让它学会举一反三(预测一本从未见过的书多少钱)。其实跟人类的学习方法差不多,对吧?

现在假设我们收集了 100 本书的价格,作为给机器学习的例子。大致情况如下:

接下来我们要做两件事:

告诉机器该学习什么;

等机器学习。

告诉机器该学什么

为了让机器听懂问题,我们不能说普通话,得用数学语言向它描述问题,这就是所谓的“建模”。为了让接下来的分析更直观,我们把收集回来的例子画在数轴上:

我们希望机器通过这些样本,学会举一反三,当看到一本从未见过的书时,也能预测价格。比如说,预测一本480页的书多少钱:

王者荣耀10点卷是1元,100000点卷就是10000元。简介:古老的魔道家族,流动着神秘力量的血脉传承,都是因为“罪”而获得的。当年轻人追溯着疯狂血缘的来历了解到这个事实后,变得面目全非。他抛开家乡离去,只留下可怕的传说。

480页的书多少钱?

观察图表,我们能看出页数和书价大致上是线性关系,也就是说,我们可以画一根贯穿样本的直线,作为预测模型。

如果我们把页数看作 X 轴,书价看作 Y 轴,这根直线就可以表示为:

w 决定直线的倾斜程度,b 决定这根直线和 Y 轴相交的位置。问题是,看起来有很多条线都是不错的选择,该选哪条?换句话说 w 和 b 该等于多少呢?

每根直线都是一个候选的模型,该选哪个?

显然,我们希望找到一根直线,它所预测的书价,跟已知样本的误差最小。换句话说,我们希望下图中的所有红线,平均来说越短越好。

红线的长度,就是模型(蓝色虚线)预测的书价,和样本书价(蓝点)之间的误差

红线的长度等于预测书价和样本书价的差。以第一个样本为例,55页的书,价格69元,所以第一根红线的长度等于:

因为绝对值不便于后面的数学推导,我们加个平方,一样能衡量红线的长度。

因为我们的预测模型是:

所以 这个样本是一本 55 页,69 元的书。

至此,我们把“预测书价”这个问题翻译成数学语言:“找出 w 和 b 的值,使得以上算式的值最小。”坚持住,第一步马上结束了!

我们现在有 2 个未知数:w 和 b。为了让问题简单一点,我们假设 b 的最佳答案是 0 好了,现在,我们只需要关注 w 这一个未知数:

把括号打开:

在机器学习领域,这个方程被称为“代价 (cost) 函数”,用于衡量模型的预测值和实际情况的误差。我们把括号全打开:

不用在意方程中的数字,都是我瞎掰的。

至此,我们把“预测书价”这个问题翻译成数学语言:“w 等于多少时,代价函数最小?”第一步完成!到目前为止,我们只用上了初中数学。

机器是怎么学习的

代价函数是个一元二次方程,画成图表的话,大概会是这样:

不用在意坐标轴上的具体数字,都是我瞎掰的。

100000是多少钱

前面讲到,机器要找到一个 w 值,把代价降到最低:

机器采取的策略很简单,先瞎猜一个答案(比如说 w 等于 20 ,下图红点),虽然对应的代价很高,但没关系,机器会用“梯度下降法”不断改进猜测。

如果你不记得导数是什么,那就理解为我们要找到一根直线,它和这条曲线只在这一个点上擦肩而过,此前以后,都无交集(就像你和大部分朋友的关系一样)。所谓的导数就是这根线的斜率。

我们可以看得出,在代价函数的最小值处(即曲线的底部)导数等于 0。如果机器猜测的点,导数大于 0,说明猜太大了,下次得猜小一点,反之亦然。根据导数给出的反馈,机器不断优化对 w 的猜测。因为机器一开始预测的点导数大于 0 ,所以接下来机器会猜测一个小一点的数:

机器接着对新猜测的点求导,导数不等于 0 ,说明还没到达曲线底部。

那就接着猜!机器孜孜不倦地循环着“求导 – 改进猜测 – 求导 – 改进猜测”的自我优化逻辑 —— 没错,这就是机器的“学习”方式。顺便说一句,看看下图你就明白它为什么叫做“梯度下降法”了。

终于,皇天不负有心机,机器猜到了最佳答案:

就这样,头脑简单一根筋的机器靠着“梯度下降”这一招鲜找到了最佳的 w 值,把代价函数降到最低值,找到了最接近现实的完美拟合点。

总结一下,我们刚刚谈论了三件事:

通过观察数据,我们发现页数与书价是线性关系——选定模型;

于是我们设计出代价函数,用来衡量模型的预测书价和已知样本之间的差距——告诉计算机该学习什么;

机器用“梯度下降法”下,找到了把代价函数降到最低的参数 w ——机器的学习方法。

机器“深度学习”的基本原理就是这么简单。现在,我想请你思考一个问题:机器通过这种方法学到的“知识”是什么?

现实问题中的深度学习

为了让数学推演简单点,我用了一个极度简化的例子。现实中的问题可没那么简单,主要的差别在于:

现实问题中,数据的维度非常多。

今天在预测书价时,我们只考虑了页数这一个维度,在机器学习领域,这叫做一个“特征 (feature)”。

但假设我们要训练机器识别猫狗。一张 200 * 200 的图片就有 4 万个像素,每个像素又由 RGB 三个数值来决定颜色,所以一张图片就有 12 万个特征。换句话说,这个数据有 12 万个维度,这可比页数这一个维度复杂多了。好在,无论有多少个维度,数学逻辑是不变的。

十万元。100,000.00即数字100000,100000是大于0的正整数,在读时可以直接读,100000读作十万,是多少钱再加上元为单位,读作十万元。

现实问题中,数据之间不是线性关系。

在今天的例子中,页数和书价之间是线性关系。但你可以想象得到,猫照片的 4 万个像素和“猫”这个概念之间,可不会是简单的线性关系。事实上两者之间的关系是如此复杂,只有用多层神经网络的上百万个参数(上百万个不同的 w:w1, w2,……w1000000)才足以表达。所谓“深度”学习指的就是这种多层网络的结构。

说到这里,我们可以回答前面的问题了:机器所学到的“知识”到底是什么?

就是这些w。

在今天的例子中,机器找到了正确的 w 值,所以当我们输入一本书的页数时,它能预测书价。同样的,如果机器找到一百万个正确的 w 值,你给它看一张照片,它就能告诉你这是猫还是狗。

正因为现实问题如此复杂,为了提高机器学习的速度和效果,在实际的开发中,大家用的都是梯度下降的各种强化版本,但原理都是一样的。

感谢你读到这里

深度学习是个日新月异的广袤领域,受限于个人水平和篇幅,这篇文章不过是管中窥豹。希望本文能稍稍掀开机器学习的神秘面纱,给你一个看待“知识”的新角度。

题图来自Unsplash,基于CC0协议

上一篇 2023年02月28 16:48
下一篇 2023年03月08 03:00

相关推荐

  • 托帕石价格多少钱一克,蓝色托帕石值钱吗

    前些天看了不少关于消费的帖子,比如如何攒钱,什么是消费主义,什么消费是商家的技俩,什么消费可降级,简单一句话:看完之后,感觉什么钱都可以不用花了,但是,真能这样吗?聊聊自己的思考吧。谈到消费主义,不能

    2023年03月15 211
  • 精选速购店怎样赚佣金,精选速购怎么赚佣金

    沃尔玛的现在出新政策了吗?怎么开店?:3002905106沃尔玛办理开店需要的资料:1.美国公司+美国税号+其他电商平台的店铺链接2.海外仓发货3.需要邓白氏编码4.美国电话沃尔玛的收款如何解决以及沃

    2023年01月05 250
  • 工资流水怎么打,六个月工资流水截图

    年末了,六个月工资流水截图,不仅工作上迎来总结,我们个人的财政状况也需要做好总结。这时很多朋友就可能会需要频繁跟银行打交道。今天小绘跟大家分享一下银行流水或个人银行卡交易明细应该怎么打印。注意:在一年

    2023年05月19 338
  • 珍珠多少钱一斤,珍珠的分类及价格表

    叫米不是米,古代贡品是以。生湖广沿溪,以醋拌之,肥绿可食。——打一植物人工养殖淡水珍珠价格,在80年代及以前主要依靠在浅海、河、湖、池沼中捕捞海蚌、河蚌取得,那时的珍珠十分昂贵,药用珍珠达700元/公

    2023年03月03 275
  • 玉米多少钱一吨,干玉米粒批发100斤装

    虽然提前半个月就开始建库存,但目前他的玉米库存只有1000多吨。收购量少,一方面是农户卖粮的积极性不高;另一方面,也和各个贸易商都在抢粮有关。山东潍坊玉米贸易商秦熙:大家都在建仓,提前建库存,如果长期

    2023年02月24 234
  • 北京市朝阳区邮政编码是多少,北京市朝阳区各地邮政编码

    当前,北京市朝阳区各地邮政编码,全市疫情防控形势持续向好,经济社会发展加快恢复。根据全市疫情防控形势和有关工作要求,经研究决定,自2020年5月14日起,朝阳区政府及区属各单位来访接待场所恢复接待群众

    2023年04月07 240
  • 养老保险怎么交,手机上怎样交养老保险

    参保缴费指南一、居民养老保险参保条件年满16周岁(不含在校学生),且未参加职工、机关基本养老保险的城乡居民,户籍地在潍城区(不含常住户口),方可参加居民基本养老保险。二、集中缴费期:2022年4、5、

    2023年01月09 279
  • 现在银行贷款利率是多少,2023年最新贷款利率

    贷款年利率低至3.6%“预计最高可贷额度20万元,年化利率(单利)最低3.75%。”春节假期过后,成都市民苏女士准备通过某国有银行办理消费贷,来应对节后的消费需求,经过查询后,目前的利率也给了她一份小

    2023年03月03 281
  • 中芯国际怎么样,北京中芯国际怎么样好进么

    东吴证券国际经纪有限公司陈睿彬近期对中芯国际进行研究并发布了研究报告《晶圆代工龙头,产能扩张与技术追赶并举》,本报告对中芯国际给出买入评级,当前股价为49.62元。中芯国际(688981)投资要点1、

    2023年05月29 253
  • 2017铜多少钱一斤,2019废铜多少钱一斤

    铜是一种过渡元素,化学符号Cu,英文copper,原子序数29。纯铜是柔软的金属,表面刚切开时为红橙色带金属光泽,单质呈紫红色。延展性好,导热性和导电性高,2019废铜多少钱一斤,因此在电缆和电气、电

    2023年03月09 239
  • 10个一千万是多少,10个一千万是1亿吗

    大家好,前面我已经给大家介绍了这一单元的知识点和易错点,快期中测试了,今天领着大家再来复习一遍知识点。1、大数的认识:(1)亿以内的数的认识:十万:10个一万;一百万:10个十万;一千万:10个一百万

    2023年03月14 292
  • 信用卡有额度为什么刷不了,信用卡有额度刷不出来怎么办

    有朋友表示,最近办了一张招行的信用卡,额度刚好三万。不过,用这张卡去购物时,却被告知该信用卡无法支付,大家是不是也遇到过类似的情况呢?明明有额度,却无法支付,这究竟是怎么回事呢?第一,信用卡被风控信用

    2023年04月12 240
  • 银行卡怎么转账

    祝福大家多多省钱,善于理财,多做善事,早日功成名就。Theend。(文章版权系笔者个人所有,未经许可,禁止转载)

    2023年02月09 225
关注微信