几十年前与机器交谈的想法即使不是白痴也属于科幻小说的范畴。然而,经过多年 严谨的多学科研究 和发展,我们来了。未来,数以百万计的用户只使用他们的声音就可以指挥越来越多的设备并与之交互。这一切都归功于尖端的语音识别技术。

语音识别改变我们生活的 3 个原因

近年来,语音识别有了很大的发展。配备基于 AI 的虚拟助手的智能手机和智能扬声器已成为每个家庭的常见景象。我清楚地记得在最初推出 Google Assistant 和微软 Cortana 的那一天尝试过它们。

除了一些奇怪但显然是预先编好的笑话外,语音识别本身相当不准确和令人沮丧。对话不是有机的。人们必须深思熟虑地说话,加上长长的停顿和清晰的标点符号。

总而言之,它充其量只是一个看起来很花哨的功能。足以激发您典型的技术书呆子,但距离成为日常技术还差得很远。

亚马逊 Alexa 失败截图
来源: 推特

 

快进到今天,尖端算法可以在语言处理方面击败我们任何人。

再加上该程序从互联网上的各种来源和语言中汲取灵感的能力,对话就真的结束了。然而,我们无法忽视语言识别在过去几十年中以惊人的速度发展。

就像智能手机和互联网一样,语音识别正迅速成为我们生活中必不可少且不可或缺的一部分。因此,可能值得研究一个充满复杂语音识别算法的世界会是什么样子;以及它们将如何改变我们的生活。

语音识别可以引发多行业颠覆,为中小企业和科技巨头赋能

能够与您的设备通话的最大好处是它比使用计算机或智能手机方便得多。鉴于这一优势,我们预计语音识别将在未来改善品牌与客户之间的沟通。这将允许更大程度的个性化和提高客户满意度。

而这已经在发生。 谷歌报告 大约 58% 拥有声控扬声器的人使用它们来创建和管理购物清单。大约 62% 的人愿意通过他们的扬声器购买产品。

电子商务等行业将从这种转变中受益最大。特别是当智能扬声器可以帮助减少客户的购买阻力时。鉴于这种积极的趋势,很明显 语音搜索正在改变我们的购物方式.

但除了购物之外,医疗保健和教育等行业也从语音识别技术中受益匪浅。亚历克萨是 帮助老年痴呆症患者,而 Google 助理可以提供帮助 加强学习 对于年幼的孩子。这些只是一些精选的例子,但它们表明大多数行业正在迎头赶上的增长趋势。

语音识别将如何占领消费市场

苹果、谷歌和亚马逊(以及其他一些较小的公司)一直在不懈地投入数百万美元用于应用程序和基于家庭的虚拟助手的研发。对于这些巨头来说,语音将是一个巨大的商机,因此竞争激烈,这已经不是什么秘密了。

我们不知道大型科技公司将如何通过语音识别获利,但他们的参与肯定会使该行业受益。随着科技公司继续进一步开发语音技术,我们可以预期基于语音的设备会随着时间的推移变得更好。我们将看到这些设备在定价、功能甚至可访问性方面的显着改进。改进曲线是指数曲线,紧跟发展曲线。

如此快速的增长可能会为语音识别带来多种机会,其中许多甚至在以前未开发的细分市场和行业中也是如此。较小的软件和应用程序开发公司将被激励在这些科技巨头的肩膀上发展。他们将基于大公司构建的底层语音识别架构来开发产品和服务。允许在客户体验和产品可用性等方面进行大幅改进。

这对双方来说都是双赢的。较小的玩家可以使用复杂的语音识别技术,这是他们自己无法开发的。更大的参与者通过开放他们的技术获得不断增加的市场份额。这将不可避免地促进语音采用,并使该技术更深入地渗透到消费者市场。

总而言之,语音识别将很快为越来越多的行业赋能。基于语音识别的技术和设备的估计市场规模预计将达到 271.6 亿美元 到 2026 年。凭借如此有希望的数字和开创性的影响,语音识别肯定会在未来几年占领消费市场。

 

在虚拟助手时代重新思考我们的隐私

语音识别具有巨大的潜力。它可以显着增强业务运营,改善消费者与设备的交互,并将机器与人的关系提升到一个全新的水平。

然而,在所有炒作的背后隐藏着一个明显但丑陋的问题,我们大多数人都不敢承认。 我说的是隐私。

大约 50% 的智能音箱用户 担心语音技术会危及他们的隐私。一方面,网络攻击和数据泄露的风险始终存在。品牌正试图通过开发在本地进行大部分语音识别的设备来解决这个问题。这是为了防止任何数据传输到云端。但在更深层次上,我们面临着将企业间谍软件意外安装到我们家中的问题。

科技公司是我们生产的每一点数据和个人信息的幕后黑手,这已经不是什么秘密了。虽然收集数据来推出个性化广告本身可能并不不道德,但这里肯定需要划清界限。需要明确的是,智能扬声器还没有记录您的日常对话(还)。但他们仍然需要“清醒”,寻找唤醒他们的触发词。

同样,这里的问题不在于亚马逊员工在听你餐桌上的谈话;但不是“隐私期望”。

什么是隐私期望?

隐私期望,简单来说,就是消费者在使用公司产品和服务时可以期望从公司获得的隐私水平。

新技术,尤其是智能扬声器和虚拟助手等新技术,通常会降低我们对隐私的期望。 换句话说,随着我们熟悉该技术,它们使我们能够轻松地共享越来越多的数据。

冒着听起来像阴谋论者的风险,我并不是说语音识别(至少以目前的形式)是对我们隐私的主要威胁。事实上,该业务中的大多数公司都合理地遵守隐私法;公司记录的任何音频样本主要用于训练算法。

但这里的问题是语音识别与其他数据收集技术有很大不同,因为它将隐私范式进一步转移到公司而不是消费者。例如,对于社交媒体,科技公司只能访问用户愿意在线发布的数据。

虽然像智能扬声器这样的东西,如果公司选择在未来跟踪我们,选择我们希望共享(而不是共享)的信息的选项根本不存在。 我们冒着将我们的整个生活开放给算法的风险,这些算法会扫描我们所说的每一个字,唯一的目的是让我们买一双袜子或其他东西。

新的隐私范式

但请记住,这完全是一种假设的可能性。但企业尚未这样做的事实并不足以证明他们将来不会这样做。毕竟,公司需要从他们销售的智能扬声器中赚钱,尤其是当他们 实际上是免费赠送的.而他们弥补的方法是将用户锁定在他们的生态系统中,并使用基于语音的广告来定位他们。

有了每一种突破性的设备/技术,消费者都愿意用更多的信息和隐私来换取更好的体验和服务。语音技术将其提升到一个全新的水平,因为我们在这里谈论的数据不是数字的,而是生物识别的。过去没有其他消费技术向算法开放了如此大量的生物识别数据,而这样做的影响可能超出我们最疯狂的猜测。

这是否令人担忧?是的。这是否意味着语音识别将终结我们的隐私?很可能不是。这里的要点是语音识别将引发围绕隐私的新对话。消费者必须更加警惕谁收集他们的数据以及如何使用这些数据。企业的隐私政策必须更加透明和以消费者为中心。最终,语音技术的广泛采用肯定会改变我们当前的隐私范式。

语音识别将如何改变我们是谁。

与智能音箱交谈的有趣之处在于,它与我们通常的交流方式不同。日常对话中充满了一些微妙之处,例如肢体语言暗示、面部表情和人际交往——这些都是智能扬声器所不具备的。

更重要的是,智能扬声器被设计为“智能”;再加上互联网,他们几乎无所不知,比其他人更具吸引力和娱乐性。那么与我的亚马逊回声互动可以改变我的交流方式是否合理?

当谈到对话时,它会夸大我的期望吗?让我不满意,因此对与其他人交谈不太感兴趣。我知道这听起来很牵强,但如果 电子游戏可以改变我们的大脑 and 发短信可以改变我们的语言,为什么要假设语音识别可以改变我们的交流方式有点牵强?

基于语音的虚拟助手有望在教育甚至治疗等领域表现出色。这些地方传统上被认为是人类的强项。但在这里令人着迷的不仅仅是助手的普遍性,还有它的个性。 Alexa 不仅仅是一个助手。它不再只是一个工具,而是随着每个补丁和更新,因为它的工程师努力使其响应看起来更有机, Alexa 慢慢地获得了人格。

这打开了一个全新的蠕虫罐。从我们开始像对待人而不是机器一样对待助手的那一天起,我们就将大量权力传递给了我们的助手(以及控制他们的公司)。虽然这是一个伟大的科幻小说情节,但我们必须承认,这样的未来比看起来要近得多。

语音识别和人工智能

考虑 Replika 的例子。 Replika 是一款聊天机器人应用程序,其营销名称是“关心的伴侣”。我是从一个音乐视频的 Youtube 评论部分发现 Replika 的。事实证明,当用户表示他们感到孤独时,Replica 向他们推荐了一个音乐视频,让他们感觉更好。它似乎奏效了。评论部分与针对 Replika 的温暖信息和情书合作,因为人们表达了他们对 AI 的感激之情。

而 Replika 只是一个聊天机器人,我敢打赌,这是一个很好的机器人,但仍然是一个聊天机器人。 想象一下,完全冲昏了头脑的语音助手——用听起来自然的人声和同理心编程——可以做什么。

如果虚拟助手和聊天机器人可以向其忠实用户推广音乐,他们也可以轻松地推广产品或想法。不要误会我的意思,只要我们的个人 AI 给我们讲一些愚蠢的笑话并提供一些琐碎的建议就可以了。但是当他们开始告诉我们什么是真实的或投票给谁时,乐趣很快就结束了。请记住,两者之间的距离惊人地短且不断缩小。再次,如果 社交媒体会影响我们的政治观点,为什么不能语音助手?

我承认这些是一些极端的例子。我不想表明语音助手本质上是坏的或邪恶的。我在这里唯一的主张是,语音识别不仅可以从根本上改变数字人机界面,还可以从根本上改变我们的日常生活。

当我们像使用屏幕一样习惯使用语音时,我们最终也可能会像信任人一样信任算法。语音识别是我们机器最好的人性化。

综上所述

语音识别是一项即将到来的突破性技术,具有深远的影响,尤其是与其最初的用例相比。虽然目睹科技巨头争夺该行业的寡头垄断地位可能令人担忧,但可靠的 免费和开源的语音识别 替代方案当然是有保证的。

在未来几年,我们可以期待语音设备能够改善我们的业务和个人体验。与我们的计算机进行有意义的对话将不再是科幻小说。大规模语音采用将迫使我们深入思考隐私和技术对我们生活的影响等领域。

这是一个充满欣喜若狂的冒险和意想不到的危险的令人兴奋的未来。虽然我们可能不知道语音识别会把我们带到哪里,但我们至少可以确定它会改变我们今天所知的世界。

图片来源:杰西卡刘易斯;像素;谢谢你!