你知道語音助手背后的公司是如何處理你的語音數(shù)據(jù)嗎?

語音助手已經(jīng)成為日常生活中的好幫手,但是你知道不同的公司是如何收集語音數(shù)據(jù)的嗎?

你知道語音助手背后的公司是如何處理你的語音數(shù)據(jù)嗎?

熟悉Alexa、Cortana、Google Assistant、Bixby或Siri嗎?每天都有數(shù)億人使用由亞馬遜、微軟、谷歌、三星或蘋果開發(fā)的語音助手,而且使用人數(shù)還在不斷增長。

據(jù)最近進行的一項調查顯示,每月有9010萬美國成年人在智能手機上使用語音助手,7700萬人在汽車上使用,4570萬人在智能揚聲器上使用。然而許多用戶可能沒有意識到他們的語音記錄不會被立即刪除。相反,它們可能會被存儲多年,某些記錄甚至會由審閱人員進行人工分析。

亞馬遜
亞馬遜表示,為了改善客戶體驗,只對非常小的語音記錄樣本進行分析。例如會訓練語音識別和自然語言理解系統(tǒng),以便Alexa能更好地理解用戶請求。亞馬遜雇傭了第三方承包商來審查這些錄音,但亞馬遜表示,公司有嚴格的技術和操作保障措施以防止記錄被濫用,而且這些員工無法直接獲得識別信息(只有賬號、名字和設備序列號)。“所有個人信息都被高度保密,我們使用多因素認證來限制訪問、加密服務和審計控制環(huán)境?!?/p>

在web和app設置頁面中,亞馬遜為用戶提供了禁用語音錄制功能的選項。不過,該公司表示,在定期審查的過程中,選擇禁用的用戶的錄音可能還是會被人工分析。

蘋果
蘋果在其隱私頁面討論了Siri錄制音頻的審核過程。蘋果解釋說,出于更好地開發(fā)和保證質量,只對Siri數(shù)據(jù)的一小部分進行了“評分”,并對其進行了標注,每個評分者都會根據(jù)音頻質量進行分類,并指出正確的操作。這些標簽有助于持續(xù)提高Siri識別系統(tǒng)的質量。

另外,供審查的錄音都是加密和匿名的,與用戶的姓名或身份等個人信息無關。審閱人員不會收到用戶設備的標識符。這些語音記錄會被保存6個月,在此期間,Siri的識別系統(tǒng)會對這些錄音進行分析,以“更好地理解”用戶的聲音。六個月后,這些沒有標識符的錄音也繼續(xù)將被保存下來,用于改進和開發(fā)Siri,最長可保存兩年。

谷歌
谷歌的一位發(fā)言人稱,谷歌只進行非常有限的音頻轉錄,以改進語音識別系統(tǒng),并且應用了廣泛的技術來保護用戶個人信息。谷歌審核的音頻片段與任何可識別的個人信息都沒有關聯(lián),而且轉錄基本上是自動的,不由谷歌員工處理。此外,在使用第三方服務來審查數(shù)據(jù)的情況下,谷歌通常提供文本,不提供音頻。

谷歌會無限期地存儲Google Assistant錄制的音頻片段。但是,谷歌與亞馬遜和蘋果一樣,允許用戶永久刪除這些錄音,并選擇不參與未來的數(shù)據(jù)收集。盡管如此,谷歌在其隱私政策中表示,可能保留與服務相關的信息,以防止垃圾郵件和濫用,并改善服務。

微軟
微軟的一位代表表示,微軟的支持頁面中概述了微軟在Cortana方面的隱私做法。微軟收集語音數(shù)據(jù)是為了加強Cortana對個人用戶語音模式的理解,不斷改進Cortana的識別和響應,以及改進其他使用語音識別和理解的產品和服務。

但是還不清楚是由微軟員工還是第三方承包商進行人工審查,以及數(shù)據(jù)是如何匿名的。但該公司表示,只有啟用了“Hey Cortana”功能的電腦,Cortana才會收集語音。微軟允許用戶通過訪問Windows 10中的控制面板或搜索頁面來選擇退出語音識別。