消息稱蘋果研究人員正探索免喚醒詞呼叫 Siri

更新時間:2024-06-15

《麻省理工科技評論》報道,蘋果公司的研究人員正在探索一種前沿技術(shù),旨在通過人工智能識別用戶與 iPhone 等設(shè)備的交談,從而消除像“Siri”這樣的觸發(fā)短語的技術(shù)需求。

消息稱蘋果研究人員正探索免喚醒詞呼叫 Siri

在這項上傳到 Arxiv 且未經(jīng)同行評審的研究中。研究人員利用智能手機(jī)捕捉的語音數(shù)據(jù)和背景噪音的聲學(xué)信息,訓(xùn)練了一個大型語言模型。該模型的目標(biāo)是識別那些可能表明用戶需要設(shè)備輔助的情境或模式。

論文指出,這個模型的部分構(gòu)建是基于 OpenAI 的 GPT-2,這種輕量級的結(jié)構(gòu)使得它能夠在智能手機(jī)等設(shè)備上高效運(yùn)行。論文還描述了用于訓(xùn)練模型的超過 129 小時的數(shù)據(jù)、額外的文本數(shù)據(jù),但沒有說明訓(xùn)練集的錄音來源。據(jù)領(lǐng)英個人資料,七位作者中有六位列出他們的隸屬關(guān)系為蘋果公司,其中三人在蘋果 Siri 團(tuán)隊工作。

論文的結(jié)論頗具啟發(fā)性,它指出,與單純的音頻或文本模型相比,這種混合模型能做出更為準(zhǔn)確的預(yù)測,并且隨著模型規(guī)模的擴(kuò)大,其性能還會得到進(jìn)一步提升。這意味著,未來的 Siri 可能會更精準(zhǔn)地理解用戶的意圖,無需通過固定的喚醒詞來觸發(fā)。

目前,Siri 的功能是通過保留少量音頻來實現(xiàn)的,聽到“嘿,Siri”等觸發(fā)短語之前,不會開始錄制或準(zhǔn)備回答用戶提示。

然而,這一創(chuàng)新也引發(fā)了一些關(guān)于隱私和數(shù)據(jù)安全的擔(dān)憂。斯坦福人類中心人工智能研究所的隱私和數(shù)據(jù)政策研究員詹?金指出,取消“嘿,Siri”這樣的觸發(fā)短語可能會讓人們更加擔(dān)心設(shè)備是否在“始終監(jiān)聽”。

消息稱蘋果研究人員正探索免喚醒詞呼叫 Siri