22

AI啊,我这里有些羞羞的东西,你要不要看一眼?

 4 years ago
source link: https://www.qbitai.com/2019/12/9635.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

判断男性生育能力,准确率超过90%。

郭一璞 发自 凹非寺

量子位 报道 | 公众号 QbitAI

自从AI火了之后,它的各种神奇应用就层出不穷。

现在,有人已经把AI用在男科♂诊断上,研究“小蝌蚪”。

NRFzQvq.jpg!web

没错,这是个正经研究,出自挪威奥斯陆城市大学,甚至还发了一篇Nature Science Reports。

解决的核心问题是,如何让AI来观察“小蝌蚪”,进而判断男性的生育能力。

研究者们对着一群“小蝌蚪”的视频研究了很久之后发现:

你们熟悉的 卷积神经网络(CNN) 简直是自动观察小蝌蚪的神器。

相比传统机器学习,CNN可以更有效的对男性小蝌蚪的运动能力进行分析,错误率低至 9% 左右,也就是准确率已经超过 九成 了。

jMFBNjU.jpg!web

因此,将来如果有准备当爸爸的盆友,去医院做检查的时候,盯着你的“儿子”看的,可能就不是医生,而是AI了。

小蝌蚪动不动,影响当爸爸的能力

在这项研究中,AI主要看的指标是小蝌蚪的运动状态。

先来科普一下,一个正常育龄男性能不能当爸爸,和他生殖系统的很多因素有关,单就基因的传递者小蝌蚪来说,它们的总数、形态、浓度等等因素都会影响男性的生育能力。

小蝌蚪的运动状态,也是其中一个重要指标。

比如,有高速运动(progressive)的小蝌蚪,跑起来飞快,可以直线跑,也可以绕大圆圈跑,非常健壮;

EFv2imU.gif

还有低速运动(non-progressive)的小蝌蚪,跑的不快,或者在原地兜圈子,不太健壮;

iMruu2a.gif

也有一动不动(immotile)的小蝌蚪,太不活跃,很难找到另一半来合成受精卵。

F322ymr.gif

而一个小蝌蚪想把自己的基因传承下去,需要至少25微米/秒的运动能力,如果一位男士的小蝌蚪里能跑到这个速度的不到32%,那他可能就没那么容易当爸爸了。

因此,如果要诊断一位男士的生育能力,那就要去医院里检测他的精液样本。

而这项研究,就是用传统机器学习和深度学习的方法区分高速运动、低速运动和一动不动的小蝌蚪。

来自85个人的数据

那么,研究的第一步,要找个小蝌蚪数据集,于是……

他们找到了一个名叫 VISEM 的数据集。

这个数据集的作者找了85个人,这些人去实验室附近的小黑屋或者自己家里收集了一些精液样本,然后研究人员把这些样本放到显微镜下,录2~7分钟的视频,视频的帧率是每秒50帧。

yqARnym.jpg!web

除了视频,数据集里还有这85个人的年龄、体重指数(BMI)和禁欲天数三个指标。

先用机器学习算法

既然要比较传统机器学习算法和CNN哪个辨别小蝌蚪运动状态的能力强,那就先上传统机器学习。

第一步,要提取特征。

这里,研究者们用到了一个名叫LIRE(Lucene Image Retrieval)开源库,然后用超过40个不同的算法测试了超过30个不同的特征。

最终选定了Tamura特征,这组特征里包括小蝌蚪的粗细程度、对照、方向性、线条形状、规则度和粗糙度,并且分别用Tamura特征、数据集里85个人的数据和两者兼顾做了三组辨别三种不同活力小蝌蚪的实验。

综合三组实验的结果,有六个算法表现是最好的,他们是:简单线性回归,随机森林,高斯过程,序列最小优化(SMOreg),弹性网和随机树,识别的错误率大概在 11% 左右。

FzAFRva.jpg!web

不过,用这些机器学习算法有一点麻烦:每次只能辨别出一个值,所以要针对三种活力不同的精子各运行一次,比较费时间。

再用深度学习方法

试完了传统机器学习方法,再来试试深度学习,用CNN来辨别。

这里不能直接用原始数据,需要提前做一些处理,从视频中提取原始帧,用光流生成帧序列的时间表示。

然后在用CNN来在这些处理后的数据上,再做一下那三组实验,分辨三种不同活力小蝌蚪的数量,这下要方便地多,可以一下子辨别出三个值,不用跑三遍算法了。

z6jQBn7.jpg!web

△ 处理过程

最后运行出来的结果,错误率大约在 9% 左右。

vANRFzQ.jpg!web

相比前面的11%,错误率明显降低,效果要好得多了。

所以,用深度学习辨别精子活力,不仅比传统机器学习的方法要好,而且可以只跑一遍算法,更快速便捷。

或许未来,深度学习可以应用到医疗实践中,成为诊断男性不育的利器。

传送门

论文

Machine Learning-Based Analysis of Sperm Videos and Participant Data for Male Fertility Prediction

作者:Steven A. Hicks, Jorunn M. Andersen, Oliwia Witczak, Vajira Thambawita, Påll Halvorsen, Hugo L. Hammer, Trine B. Haugen, Michael A. Riegler

https://arxiv.org/abs/1910.13327

VISEM数据集

https://datasets.simula.no/visem/

参考链接

https://www.medicalnewstoday.com/articles/320160.php#what-is-sperm-motility

https://www.verywellfamily.com/sperm-motility-1960141

https://en.wikipedia.org/wiki/Semen_analysis

—完 —

版权所有,未经授权不得以任何形式转载及使用,违者必究。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK