语音识别将如何影响物联网的隐私

使用语音识别的物联网设备需要声音的收集和解释。声音的捕获和处理方式可能会使用户相信组织是受人尊敬或偷窥。

个人隐私
wikimedia.org

可用性是创建要用作物联网(IoT)一部分的设备的关键区别。避开了传统的用户界面,以支持语音识别。实际上,在语音识别的一些研究中表明,这种方法比传统的用户界面方法更快,更准确。

语音识别的使用需要声音的收集和解释。设备需要确定何时寻址,然后将紧随其后的声音发送到服务器进行解释。这带来了一些独特的隐私挑战。组织需要对以下方面保持敏感:

  • 如何收集声音,
  • 出于什么目的使用声音,
  • 谁正在与设备通信,
  • 信息如何存储,
  • 声音会保留多长时间,
  • 监控法律和法规要求。

以下各节讨论其中一些项目:

声音收集

请注意,以上各要点的重点是声音,而不是声音。当设备可能正在响应语音命令时,当发出语音命令时,它们将捕获环境中存在的任何声音。展望未来,设备响应诸如拍手,口哨声,门开/关,甚至狗叫声之类的非语言声音并非没有道理。

与从传统界面收集信息的设备不同,对声音有反应的设备必须不断地“聆听”。设备必须确定何时应执行某些功能以响应指令或查询。通常,这是由发言人提供诸如“ Alexa”,“ Siri”或“ OK Google”之类的关键字来完成的。随后的声音随后被发送到服务器以做出一些响应。

关键字后面的声音可能包括带有命令的声音。声音还将包括正在发生的任何背景对话。实际上,声音中可能包含无数事物,这些事物指示诸如环境中使用的工具(例如电钻或调音台),偏好的音乐,存在的动物,有多少人等事物。附近,人们正在讨论的主题,或者正在观看什么电视或广播节目,仅作为示例。这些声音中的每一个都揭示了有关用户的某些信息。

随着非语言命令开始用于启动设备的活动,对关键短语的依赖将变为静音。但是,将所有声音发送到服务器进行解释是昂贵,低效的,并且肯定会涉及隐私。如果出于保护隐私的目的,则需要对设备中的声音进行本地处理以应对这一挑战。在设备本地解释声音之后,可以将传统的基于数据的消息(尽管附加了一些声音)发送到服务器,以提供有关采取何种操作或提供响应所需的信息的指令。

声音的用途

设备收集并发送到服务器的声音肯定会用于响应命令或查询。我认为收集的声音还有其他两种用途,“安全”。

一种是改善设备提供的服务。这可能包括创建设备用户的个人资料。例如,如果每天晚上10点用户请求关闭电灯,设备是否可以在晚上10点问“我要关灯吗?”

同样,当人们进行交流时,我们将先前的操作和上下文作为简写。例如,我有一只叫露西的狗。露西偏爱一种狗粮品牌。当我说“我们需要给露西更多的食物”时,我的妻子理解我指的是什么产品。通过建立配置文件,设备可以识别过去帮助我订购的狗食以及露西是狗,然后在我告诉设备“为露西订购更多食物”时做出适当的响应。

声音的“安全”第二个用途是改进服务器为解释声音所做的处理。可以使用匿名或化名声音来实现此目的。

另一个用途是使用捕获的背景声音添加到用户配置文件。例如,有一种技术可以仅从捕获的声音中识别歌曲,电视节目或电影。显然,依赖声音的语音驱动IoT设备可以检查背景声音,确定歌曲,电视节目或电影,然后将其添加到用户配置文件中。这种信息显然会有市场。我建议。但是,这种使用方式可能会被视为类似于偷窥狂,并且是对用户隐私的侮辱,类似于居家中的“偷窥汤姆”。

用户认证

物联网设备可能具有的一些个人信息可能包括对零售商帐户的访问,财务信息(例如所观察的股票),搜索历史记录以及对其他设备的访问。该访问权限将使设备用户可以轻松地下订单,打开灯,开门或获取订单状态。设备应具有验证请求用户有权访问个人信息或请求执行操作的机制。

符合法律法规要求

必须遵守为处理个人信息提供指导的法律法规。例如,从孩子那里捕获的声音可能需要捕获组织在捕获声音之前获得父母的许可或具有其他补偿控制权。在欧盟中捕获的声音可能需要建立法律基础,然后才能将声音传输到欧盟之外进行处理。还必须考虑将语音模式视为生物特征识别。

隐私法律和法规环境正在迅速发展。必须不断监视这些要求的更改。在没有法规或条例的情况下,隐私专业人员必须向其组织提供有充分根据的指导,以预期要求可能如何发展。

提供通知

无论如何解决上述问题,重要的是要提供一个隐私声明,说明设备如何收集信息,如何使用信息,如何保护信息,与谁共享信息,将信息保留多长时间,以及如何最终销毁它。

版权© 2016 IDG通讯,Inc.