MIT的《深度学习》精读（11）-白红宇的个人博客

发布日期：2021-07-01 05:06:12 浏览次数：2 分类：技术文章

本文共 3013 字，大约阅读时间需要 10 分钟。

The performance of these simple machine learning algorithms depends heavily on the representation of the data they are given. For example, when logistic regression is used to recommend cesarean delivery, the AI system does not examine the patient directly. Instead, the doctor tells the system several pieces of relevant information, such as the presence or absence of a uterine scar. Each piece of information included in the representation of the patient is known as a feature. Logistic regression learns how each of these features of the patient correlates with various outcomes. However, it cannot influence the way that the features are defined in any way. If logistic regression was given an MRI scan of the patient, rather than the doctor’s formalized report, it would not be able to make useful predictions. Individual pixels in an MRI scan have negligible correlation with any complications that might occur during delivery.

这些简单的机器学习算法的性能很大程度上是依赖于用户输入数据的表示方式。例如，AI系统当使用逻辑回归（logistic regression）算法来建议剖宫产时，它并没有直接检查病人，反而是依赖医生来输入相关信息，比如子宫疤痕的存在或不存在。每个从病人那里获取回来的数据，被称为特征值。逻辑回归算法通过分析所有特征值之间的相互关系，并且作出预测结果。但是这种使用特征值输入的方式并不能适合任何场合之下，比如逻辑回归的算法直接输入核磁共振成像扫描图(MRI)，而不是使用医生的报告中的特征值，逻辑回归算法将不会做出任何有用的预测结果。因为核磁共振成像扫描图中的每一个独立的像素是很微小的，但是它与分娩过程中任何可能并发症的发生是密切相关的。

在这一段里有逻辑回归的算法，接着来看一下什么是逻辑回归算法：

Logistic回归与多重线性回归实际上有很多相同之处，最大的区别就在于它们的因变量不同，其他的基本都差不多。正是因为如此，这两种回归可以归于同一个家族，即广义线性模型（generalizedlinear model）。

这一家族中的模型形式基本上都差不多，不同的就是因变量不同。

· 如果是连续的，就是多重线性回归；

· 如果是二项分布，就是Logistic回归；

· 如果是Poisson分布，就是Poisson回归；

· 如果是负二项分布，就是负二项回归。

Logistic回归的因变量可以是二分类的，也可以是多分类的，但是二分类的更为常用，也更加容易解释。所以实际中最常用的就是二分类的Logistic回归。

Logistic回归的主要用途：

· 寻找危险因素：寻找某一疾病的危险因素等；

· 预测：根据模型，预测在不同的自变量情况下，发生某病或某种情况的概率有多大；

· 判别：实际上跟预测有些类似，也是根据模型，判断某人属于某病或属于某种情况的概率有多大，也就是看一下这个人有多大的可能性是属于某病。

Logistic回归主要在流行病学中应用较多，比较常用的情形是探索某疾病的危险因素，根据危险因素预测某疾病发生的概率，等等。例如，想探讨胃癌发生的危险因素，可以选择两组人群，一组是胃癌组，一组是非胃癌组，两组人群肯定有不同的体征和生活方式等。这里的因变量就是是否胃癌，即“是”或“否”，自变量就可以包括很多了，例如年龄、性别、饮食习惯、幽门螺杆菌感染等。自变量既可以是连续的，也可以是分类的。

常规步骤

Regression问题的常规步骤为：

1. 寻找h函数（即hypothesis）；

2. 构造J函数（损失函数）；

3. 想办法使得J函数最小并求得回归参数（θ）

MRI是什么呢？

MRI也就是磁共振成像，英文全称是：Magnetic Resonance Imaging。经常为人们所利用的原子核有： 1H、11B、13C、17O、19F、31P。在这项技术诞生之初曾被称为核磁共振成像，到了20世纪80年代初，作为医学新技术的NMR成像（NMR Imaging）一词越来越为公众所熟悉。随着大磁体的安装，有人开始担心字母“N”可能会对磁共振成像的发展产生负面影响。另外，“nuclear”一词还容易使医院工作人员对磁共振室产生另一个核医学科的联想。因此，为了突出这一检查技术不产生电离辐射的优点，同时与使用放射性元素的核医学相区别，放射学家和设备制造商均同意把“核磁共振成像术”简称为“磁共振成像（MRI）”。

核磁共振成像原理：原子核带有正电，许多元素的原子核，如1H、19FT和31P等进行自旋运动。通常情况下，原子核自旋轴的排列是无规律的，但将其置于外加磁场中时，核自旋空间取向从无序向有序过渡。这样一来，自旋的核同时也以自旋轴和外加磁场的向量方向的夹角绕外加磁场向量旋进，这种旋进叫做拉莫尔旋进，就像旋转的陀螺在地球的重力下的转动。自旋系统的磁化矢量由零逐渐增长，当系统达到平衡时，磁化强度达到稳定值。如果此时核自旋系统受到外界作用，如一定频率的射频激发原子核即可引起共振效应。这样，自旋核还要在射频方向上旋进，这种叠加的旋进状态叫做章动。在射频脉冲停止后，自旋系统已激化的原子核，不能维持这种状态，将回复到磁场中原来的排列状态，同时释放出微弱的能量，成为射电信号，把这许多信号检出，并使之能进行空间分辨，就得到运动中原子核分布图像。原子核从激化的状态回复到平衡排列状态的过程叫弛豫过程。它所需的时间叫弛豫时间。弛豫时间有两种即T1和T2，T1为自旋-点阵或纵向驰豫时间，T2为自旋-自旋或横向弛豫时间。

1. TensorFlow API攻略

2. TensorFlow入门基本教程

3. C++标准模板库从入门到精通

4.跟老菜鸟学C++

5. 跟老菜鸟学python

6. 在VC2015里学会使用tinyxml库

7. 在Windows下SVN的版本管理与实战

8.Visual Studio 2015开发C++程序的基本使用

9.在VC2015里使用protobuf协议

10.在VC2015里学会使用MySQL数据库

转载地址：https://mysoft.blog.csdn.net/article/details/66968714 如侵犯您的版权，请留言回复原文章的地址，我们会给您删除此文章，给您带来不便请您谅解！

上一篇：Android培训班(66)dex文件打开流程

下一篇：Android培训班(65)dex文件打开

发表评论

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！