谁想出来用声音操控机器的，为什么不是用手势？

原标题：谁想出来用声音操控机器的，为什么不是用手势？

早晨，一缕阳光照进卧室，一个柔和的声音响起：“你好，主人，现在是8点30分，今天是2020年8月……新的一天开始了！”

你起床之后对着空调说：“xx，关闭空调”，空调即能停止工作。当你来到客厅，对着电视说一句：“xx，播报新闻，”电视机将被打开，开始播放当天的重要新闻。

话说，当年是谁突发奇想，让机器可以跟人对话的呢？这得从智能语音的历史说起……

智能语音的起源可追溯到20世纪50年代

一个叫“贝尔实验室”的科研机构，一群高精尖的研究员们整天呆在实验室，没人能理解他们在做什么，人生寂寞如雪。

于是给自己定了个小目标，研发一款可以聊天的机器人。

智能语音的萌芽有了，只是光有兴趣并不足以推动整个行业，但甲方和资本可以。

这个机会没让我们等太久，20世纪60年代，美国空军进入喷气式超音速时代，过快的速度让宇航员在飞行中出现超过了7个G的过载。那酸爽跟我们坐在高速下落的过山车里差不多。且那时候飞行员抗压服的性能不是很好，会压着飞行员的身体，无法对飞机进行有效操控，这时美国空军就提出一个需求：能不能用语音来控制飞机？

展开全文

正是这个原因，从60年代到现在，美国国防部的DARPA一直支持语音技术的研究至今。官方转型为甲方，有了充足经费的研究员们开始起早贪黑做科研。

技术有了新突破，智能语音产业化就被提上日程

1997年IBM ViaVoice首个语音听写产品问世，你只要对着话筒说出要输入的字符，它就会自动判断并且帮你输入文字。

2002年，美国国防部先进技术研究计划署（DARPA）启动了 “全球自主语言开发”（Global Autonomous Language Exploitation，GALE） 。GALE目标是应用计算机软件技术对海量规模的多语言语音和文本进行获取、转化、分析和翻译。这一举措给加速了智能语音技术的成熟。

2009年，微软Win7集成语音功能上架，用户可以通过语音来控制电脑。

从2010年开始，基于互联网的发展，智能语音的发展迎来了质的飞跃。现在，智能语音产品已经陆续在我们生活中广泛落地。

同时，越来越多的科技巨头加入到智能语音领域，让落地应用与技术探索双轨并行。

2011年，苹果个人手机助理Siri诞生；

2015年，首个可智能打断纠正的语音技术问世；

2017年，智能语音系统集中扩展深度学习应用技术取得突破性进展。

智能语音也被广泛应用到生活方方面面。

另外，智能语音交互体验也不断升级

在智能语音2.0阶段，信息流、数据存储量更大，为用户提供的信息也越来越准确。但一切还是基于数据库的不断丰富，仍然不能更深层次理解人的意思，无法实现自学习、自成长，与机器的语音交流还不能像人一样自然。比如你要听周杰伦的歌，系统弹出歌单，但不会直接播放。当下达播放指令的时候，歌曲才能被播放。但相对于1.0版本，可以有一定逻辑，但不连贯。

在智能语音3.0阶段，集成深度学习、语音、语义、知识库等多个核心技术于一体，这一时期的智能语音在商业化使用的过程中已经基本足够。如你在问智能语音天气的时候，它除了高速你天气内容，还会告诉你空气质量，需要注意事项等。