使用 XVF3610 语音处理器为智能网关添加语音
eBOM 高效套装中的高性能语音
技术交织在我们日常生活的方方面面——在我们的家居、我们的工作场所、我们的车辆和其他场所 中,技术无所不在。
在我们日益繁忙、复杂和充满压力的生活中,我们的互动以速度和效率的需求为特征。我们希望尽可能快和轻松得获得问题的答案(或请求的实现)。在短短的几十年里,我们与技术互动的方式已 经从笨拙的键盘体验转变为复杂的触摸屏,再到语音(智能和其他传感技术即将到来)。
迄今为止,语音主要用于信息和娱乐,“Alexa,播放 Sunday Morning Mix”,“Siri,达特茅斯的天气如何”。但它也被用来控制我们的空间,“Alexa,关灯”,嘿谷歌,将温度设置为18度”。免提交互让我们可以同时处理多项任务并享受更好的搜索体验——我们无需查看屏幕或浏览菜单选 项即可直接实现我们想达到的目的。语音让我们的互动变得更容易,而且它很快就超越了智能扬声 器,涵盖了从门铃到抽油烟机的各种电子设备。
语音也是一个很好的平等主义者;您不需要任何先验知识就可以使用语音;无论您的年龄或技术知识如何,它都是快速而直观的。随着主宰智能家居的斗争愈演愈烈,全球领先的服务提供商明白语音可以帮助他们在服务和体验方面实现差异化——他们正在将他们的语音产品转移到专有智能扬声器、机顶盒和路由器。借助语音助手和人工智能,今天的语音是即时、可信且经济高效的。
用户体验是成功的关键——智能家居网关体验需要简单直观。它需要感觉自然,即您可以随时从房 间的任何地方激活语音服务。因此,成功取决于拥有可靠的接口,该接口可以隔离感兴趣的声音并 消除周围环境中所有不需要的/竞争性噪音。它还需要易于实施,以满足苛刻的上市时间表。
这就是 XMOS VocalFusion 双麦克风语音处理器 (XVF3610) 的用武之地。借助专门设计的算法,XVF3610 可以从整个房间捕获清晰的语音流,即使在嘈杂的环境中以及当内容通过音频播放器流式传输时——实现近距离精确的现场语音捕捉。XVF3610 提供强大的性能和 eBOM 优化设计。
本白皮书概述了将 XVF3610 集成到智能家居网关中的难易程度,并重点介绍了将为客户带来的好处。
智能家居网关
家居网关通过 WiFi 和无线物联网协议将不同类型的设备连接在一起。它们正迅速成为我们生活空间的核心功能,使用网状接入点、扩展器和集线器将智能家居连接在一起。

图 1: 智能网关和无线网络扩展器非常适合为房屋中的每个房间启用语音助手
无论您在家中的何处,都始终靠近集线器,使您能够与连接的家居设备和云服务进行无缝交互。
通常,智能家居自动化系统将由终端设备组成,如开关、传感器、灯、锁等;集线器和网关等连接设备;和一个云控制网络。
家居自动化和管理跨越四个不同的区域。
A. 监控:使您能够查看给定系统的状态,例如:
- 现在多少度?
- 门锁了吗?
- 灯是开着的还是关了?
B. 控制:使您能够更改给定系统的状态,例如:
- 开暖气
- 锁门
- 开灯或关灯
C. 自动化:使您能够自动更改给定系统的状态以响应事件,例如:
- 如果外面的温度低于某个点,就打开暖气
- 没人在家时关灯
D. 维护:使您能够通过无线 (OTA) 方式运行设备更新,例如:
- 固件升级
- 地理特定设置(例如语言变体)
今天,大多数智能家居系统仍然在控制级别运行,但边缘人工智能(设备上处理和推理)将使产品 设计师能够设计增强的体验和交互。
通过智能家居网关传递语音
XMOS 和 XVF3610 语音处理器带来了许多好处,包括:
- 优化的语音管道,可实现清晰的语音捕获
- 部署就绪固件(无需重新编译二进制文件)
- 通过 USB 接口(XVF3610-UA 设备)进行 I/O 扩展,用于低成本 CPE SOC 解决方案, 包括 GPIO、I2C 和 SPI
- 具有智能家居网关实施经验的现场工程师提供的技术支持
- 低成本 eBOM
在远场捕获清晰的语音命令是一项复杂的技术挑战。它需要专为现代生活空间构建的智能算法;智 能算法致力于分析房间的音景,并将语音命令与所有其他噪音隔离开来。
捕获的准确性和命令的清晰度至关重要。我们的耳朵会自动调出背景噪音,专注于并放大我们想听 到的声音。但是麦克风可以捕获声学环境中的所有内容,包括不需要的噪音,例如谈话、交通噪 音、电器、空调、鸟鸣和狗叫声。
XVF3610 使用复杂的数字信号处理 (DSP),解决并减少或消除三个主要噪声源,以确保高质量的语 音捕获和传输。我们将这些称为自生噪声、点噪声和环境噪声(如图 2 所示)。
自生噪声是设备产生的噪声——例如,如果您正在与播放音乐的智能扬声器或正在播放电影的智能 电视通话。我们的声学回声消除器 (AEC) 通过对房间的回声响应(“远端”信号)进行建模并创建 对麦克风拾取的音频的估计来抑制此音频流。从远端信号中减去麦克风信号,从设备扬声器中去除 所有不需要的噪音,并在任何正在播放的音乐或音频中实现一致、可靠的语音打断。
点噪声(或来自房间内固定点的噪声)是我们需要解决的第二种噪声类型。干扰消除器 (IC) “扫 描”房间的音景,创建噪声模型,然后在每个点噪声源的方向上清“零”。
环境噪声是所有需要抑制的剩余环境噪声(例如空调或房间内的一般噪声)。这是由我们的噪声抑 制算法完成的,该算法降低了麦克风输入的噪声,允许清晰的音频流传递到“语音识别”服务。

图2:简化图(显示在典型用户家居空间中发现的三种主要噪音类型)
每个算法块(下图 3)都是自调整的,因此它可以适应任何房间条件并随着房间的变化而变化(例如 人们走动)。然后将输出输入到自动增益控制 (AGC) 装置中,该装置对语音识别引擎的音量进行标 准化和优化。

图 3: XVF3610 语音管道
在复杂的音频系统中,音频参考信号和音频输出之间的延迟会降低性能。我们的自动延迟估计器算 法可补偿系统发出的音频中的任何延迟,并确保优化回声消除以实现可靠的语音打断。
XVF3610 系统最大限度地减少了制造商的开发时间和资源,确保最终客户无需担心他们将语音设备 放置在房间的什么位置。
智能技术
除了自适应语音处理管道外,XVF3610 还旨在帮助缩短制造商的上市时间。
随时可用的数据驱动配置
XVF3610 易于集成到智能家居网关系统配置中。它使您能够从基于 QSPI 闪存的数据分区读取配置 或通过发送 Host-SOC 发起的命令,消除对工具链或软件开发时间尺度的担忧,并使您能够将 XVF3610 语音处理器配置为您的系统架构。
灵活的音频传输
灵活的音频 I/O 使您可以将 XVF3610 配置为特定的系统架构,以便在开发过程中进行调试和测试;它甚至可以在生产测试期间使用。
使用 XVF3610 控制接口,音频流输入和内部音频源可以路由到音频输出。简单的映射命令可用于通过 XVF3610 将音频路由到或路由自通过 I2S 连接的其他设备。一系列可配置的过滤和速率转换操作 可用于减少接口挑战。
附加用户界面组件的简单集成
XVF3610 可以接收主机命令,这些命令可以桥接至其 SPI 和 I2C 接口并控制多个 GPIO 引脚。这为 使用 USB 配件升级现有智能家居网关设备的制造商提供了更丰富的物理用户界面。
USB 接口不仅限于附加配件,它还为希望在新的家居网关设计中扩展其现有网关芯片组的制造商提 供了一个很好的解决方案。
应用选项
XVF3610 语音处理器提供两种固件版本:XVF3610-UA 支持 USB 配件设备,而 XVF3610-INT 旨在 启用内置解决方案。两者都包含我们专门设计的算法。
XVF3610-INT | I2S 接口
系统设计如下图所示

图 4: 家居网关通过 I2S 与 XVF3610 -INT 连接
远端音频通过 I2S 接口从 Host SOC 馈送到 XVF3610,并可直接用作 AEC 参考信号。
然而,一些扬声器驱动放大器支持 I2S 输出,该输出包含它应用的任何信号增强,例如,动态范围压缩、扬声器保护等。在这种情况下,XVF3610 可以通过 I2S 将远端音频发送到扬声器驱动放大器,然后从放大器接收处理后的音频并将其用作 AEC 参考信号。 结合放大器的音频增强处理提供 更准确的 AEC 参考信号,以实现更好的整体性能,音频输入(到扬声器)和 AEC 之间的固定延迟最小。
XVF3610-UA | USB 接口
系统设计如 图 5 所示

图 5: 家居网关通过 USB 与 XVF3150-UA连接
远端音频最初通过 USB 从 Host SOC 路由到 XVF3610。XVF3610 灵活的路由结构允许将此音频参考桥接到 I2S 并立即路由到放大器。然后它通过放大器的处理管道传递到 XVF3610 的 AEC,再次显现 I2S 配置的优点(见 #XVF3610-INT | I2S 接口)。
集成支持
XVF3610 旨在最大限度地减少制造商的工程开发负担。但是,XMOS 随时准备支持客户评估和安装 启用 XVF3610 语音处理器。我们的现场应用工程师在欧洲、亚洲和美国拥有丰富的行业专业知识和最新的语音支持智能家居网关经验。
有关我们的语音接口以及为任何智能家居网关或家居网络扩展器设备提供高性能语音体验方面的更多信息和协助,请访问 xmos.com 或发送电子邮件至 sales@xmos.com
木瓜科技是XMOS在中国的合作伙伴。如果您身处中国,木瓜科技可为您提供本地化的支持与方案评估,帮助您的项目落地。如您需要协助,可访问 pawpaw.cn 或发送电子邮件至 sales@pawpaw.cn
Copyright © 2021,版权所有。
Xmos Ltd. 是此设计、代码或信息(统称为“信息”)的所有者或被许可人,并“按原样”提供给您,不提供任何类型的明示或暗示保 证,并且不承担任何与其使用有关的责任。Xmos Ltd. 不保证信息或其任何特定实施工作不存在或将不存在任何侵权索赔,并且重申不对任何此类索赔承担任何责任。