猪也迈入了看脸的时代?

麻省理工科技评论APP 2022-05-14 15:14

我们无时无刻不生活在摄像头的凝视之下。人脸识别早已不是什么新鲜事,刷脸支付更成为了我们日常生活中司空见惯的行为。你可能难以想象,仅仅在十年前,这些还是天方夜谭一般的存在。而现在,科学家们已经不满足于识别人脸了,他们将注意力转向了猪


图源网络


近日,中国农业科学院农业信息研究所机器视觉与农业机器人创新团队在动物面部智能识别方面取得了新的进展,获得了更加精准的动物面部识别能力,研究成果发表在《图像处理会刊(IEEE Transactions on Image Processing)》上,能够帮助大规模养殖场精准地识别并管理每一只猪。


图源网络


如果说人脸识别是我们普通人都可以做到的,那“猪脸识别”就不是那么容易的了,如果没有经过特殊训练或是长期与动物打交道,我们很可能会“脸盲”。


猜猜我是谁?  图源网络


不过这也不能怪我们。


有一种观点认为,我们人类与猪这个物种之间一直是吃与被吃的关系(嗯,反过来的也有)…… 近年来才有宠物猪甚至是工作伙伴猪(松露猪?)的出现,从进化的角度来看,我们确实没有辨认猪脸的必要,也就丧失了(或许就没有)这种能力。退一步讲,猪也觉得我们人类都长得差不多啊。


©剑飞来自火星


为了解决这一问题,过去大型养殖场主要依靠物理侵入的方式去管理动物群体,比如耳标等等。但这种方式容易造成动物感染或应激反应,且成本较高。


说了这么多,你可能要问了,这个“猪脸识别”到底有什么用呢?


简单来说,动物面部识别技术在完美地规避了物理侵入方式的问题的同时,可以在一群猪当中精准识别出一头特定的猪,实现规模化养殖的精准化管理。这不仅仅是帮助养殖者认识每一头猪那么简单,更可以为每头猪建立起个性化的模型,收集和关联大量诸如身体数据、饮水量、进食量、体温、运动量等的信息,使得养殖者能够精准地掌握它们的所有状态。在此基础上,猪脸识别就可以帮助实现智能化防疫差异化饲养等等目标,在降低损失节省成本的同时,还能提升猪肉的产出质量和效率


一头拥有姓名的猪  图源网络


但是,现有的动物面部识别技术大多只基于人脸识别技术做了些许改进,并没有充分考虑到对象换成动物之后出现的一些特点和难点。比如人会配合镜头,而猪不会,而且猪也不像人一样会天天洗脸(猪:你礼貌吗?);再比如,猪的生长速度很快,生长周期比人类短得多,从出生长到两三百斤可能只需要几个月的时间,“猪脸”也必然随之大变


岁月是把杀……什么刀?  ©图源网络


而这次农科院团队的突破则结合了人工智能深度学习,采用了一种叫做多尺度对比图卷积神经网络(MC-GCN)的新技术,摒弃了传统识别技术基于一张图像去进行身份对比的方式,采用一段视频,或者也可以认为是多张图片去对猪的身份做一个刻画;同时根据整张猪脸的纹理特征进行识别,通过特征可视化提取到猪脸上眼睛、鼻子周围的高权重特征,从而进行身份匹配。除此之外,这一新技术的身份对比集合也会在识别的过程中实现动态更新,相当于一直追踪猪的成长。总的来说,农科院团队的猪脸识别新技术基本解决了现有技术的痛点问题,大幅提高了动物面部识别的效率和精准度,人类从此对猪不再“脸盲”。


©Pixabay


不论是猪脸识别还是人脸识别,这些令人兴奋的科技应用都离不开深度学习技术的迅猛发展,而其所属的机器学习领域则出现得更早。


早期的所谓机器智能需要人为设定好既定的规则、因果关系等条件,机器只能在这个框架下完成执行动作。1763年,一位叫作托马斯·贝叶斯(Thomas Bayes)的英国牧师发表了贝叶斯统计理论的相关著作,其中的贝叶斯定理后来成为了现代概率论和数理统计学领域至关重要的基石之一。两个多世纪后,这一定理被研究机器学习的科学家们发掘出来,并最终发展出了贝叶斯机器学习(2004年全球十大突破性技术)这一革命性的技术,通过概率统计的方法论让机器摆脱了预设条件的限制,并基于对现实世界不完整的知识针对特定问题尝试进行最好的预测。


简单举个例子,原本“下雨草地会湿”的因果关系需要被人工输入到机器当中,机器才能对“下雨”做出“草地湿了”的响应;而有了贝叶斯机器学习加持后,只需要“喂”给它大量的数据,机器就可以自动在“下雨”和“草地湿了”之间建立关联,从而实现“学习”


“斜杠中年”托马斯·贝叶斯  ©Wikipedia


时间推移到数年后,科学家们发现可以模仿人大脑皮层神经元活动建立虚拟神经网络。虽然这一想法早在20世纪50年代就诞生了,但碍于种种限制一直未得到显著的发展。得益于上面的突破以及计算机算力的突飞猛进等等,深层次的虚拟神经网络终于得以实现,深度学习(2013年全球十大突破性技术)应运而生。


深度学习

©Jimmy Turrell & MIT Technology Review


深度学习神经网络一开始专注于图像识别自然语言理解,它可以从第一层神经元层开始学习图像和声音数据的原始特征;当提取到出现频率更高的组合之后,机器就可以准确地识别出这些特征,并将它们送入下一层,去分解、识别更复杂的特征。这个过程逐层重复,直到神经网络能够可靠地识别数据中的音素或是事物为止。


基于大规模数据和深层神经网络的深度学习意味着机器能够识别、学习并解决更复杂的问题,这一阶段最具代表性的成果是谷歌的大型神经网络,在超过1000万的Youtube视频中学习到了如何准确识别图像中的猫以及其他动物,识别效率和精准度相比之前大大提高。毫无疑问,这是迈向真正智能的机器的第一步。


深度学习提取猫图像的特征  ©Microsoft


深度学习出现之后,这一领域开始了爆发式的发展。仅仅数年后,强化学习(🔗2017年全球十大突破性技术)就如同一颗耀眼的新星一般冉冉升起了。强化学习技术同样不是什么新鲜玩意儿,其基本逻辑脱胎于更加古老的生物学习规律,也即重复练习和试错机制以强化特定神经元之间的连结,而在深度学习极其高效的数据模式识别方式的加持下,它充分利用了算力的进一步提升进行大量的虚拟行为模拟,从而能够在没有明确指导的条件下自主学习,甚至能够学到此前从未接触过的事物


强化学习

©Seymour Chwast & MIT Technology Review


强化学习技术的发展解放了人类的双手,不再需要大量的预设代码去“教”机器如何学习和决策,顺带着也拯救了无数程序员的发际线。除了在自动驾驶药物研发等领域应用的诱人前景之外,这一阶段最令人瞩目的成果,毫无疑问是DeepMindAlphaGo在围棋比赛中击败世界冠军李世石的历史性事件,它也标志着机器实现了对现实世界底层架构和基本逻辑的“真正的理解”


AlphaGo与李世石的世纪对决  ©Sandy Chiu


同一时期出现的刷脸支付(🔗2017年全球十大突破性技术)前面也提到了,这一技术首先在中国得到了大幅度的发展和大范围的应用,再加上后来出现的生成对抗网络(GAN,🔗2018年全球十大突破性技术)等等,这才有了我们今天的猪脸识别,真正实现 know what you eat。


刷脸支付

©Yoshi Sodeoka & MIT Technology Review


科技创新有着移山填海、重塑现实的力量,其背后的故事也往往迷人而耐人寻味。我们梳理了由《麻省理工科技评论》发布的200项“全球十大突破性技术”,并邀请全球科技领域专家、投资人,对过往二十年的前沿科技进行深度解读和权威点评,通通整理进了《科技之巅(20周年纪念版)》。目前新书即将推出,想看到更多有趣的故事和新奇的科技吗?欢迎持续关注,我们一起见证20年来科技发展的沧海桑田,一瞥世界未来的样子。



“猪脸健康码”有了,“猪用支付宝”还会远吗?



参考资料:

1.https://www.technologyreview.com/supertopic/tr10-archive/

2.https://ieeexplore.ieee.org/document/9750935

3.https://www.caas.cn/xwzx/tpxw/320553.html

4.https://baijiahao.baidu.com/s?id=1731605213141496228&wfr=spider&for=pc

5.https://mp.weixin.qq.com/s/MkpgKhXWaCBD4_LkjpMbOw

6.https://mp.weixin.qq.com/s/_kdbSRdIwr4bIXfNtut8Fw

7.http://xhslink.com/rIxxdh

8.https://www.wikipedia.org/



- End -

推荐阅读