AI 新聞繁中

Apple 將在一年一度的國際聲學、語音與訊號處理會議 (ICASSP) 上發表最新研究，該會議將於 5 月 4 日至 8 日在西班牙巴塞隆納實體舉行。我們很榮幸再次贊助此次會議，它匯集了專注於訊號處理及其應用的科學和產業研究社群。以下是 Apple 參與 ICASSP 2026 的概覽。 ## 議程歡迎在展覽期間前往位於西班牙巴塞隆納國際會議中心 (CCIB) 的 Apple 攤位 #P2。所有時間均為中歐夏令時間 (CEST，當地時間)： * 5 月 4 日星期一：19:00 - 21:30 * 5 月 5 日星期二至 5 月 8 日星期五：09:00 - 17:00 ### 5 月 6 日星期三 * **海報發表** * [利用影音資料縮小自我監督語音模型的多語言差距](https://machinelearning.apple.com/research/leveraging-audio-visual) * 16:30 - 18:30，SLP-P25：影音語音辨識，海報區 27 * María Andrea Cruz Blandón (坦佩雷大學), Zakaria Aldeneh, Jie Chi, Maureen de Seyssel ### 5 月 8 日星期五 * **海報發表** * [StereoFoley：從影片生成物件感知立體音訊](https://machinelearning.apple.com/research/stereofoley-object-aware-stereo-audio) * 14:00 - 16:00，AASP-P30：影音與多媒體音訊，海報區 25 * Tornike Karchkhadze (加州大學聖地牙哥分校), Moji Heydari, Kuan-Lin Chen, Josh Atkins, Mehrez Souden, Robert Henzel, Alessandro Toso * **口頭發表** * [語音推測解碼中基於原則的粗粒度接受機制](https://mlr-preview.g.apple.com/research/coarse-grained) * 15:00 - 15:20，SLP-L20：串流與高效 TTS 系統，114 室 * Moran Yanuka, Paul Dixon, Eyal Finkelshtein, Daniel Rotman, Raja Giryes (特拉維夫大學) ## 獲選論文 ### [利用影音資料縮小自我監督語音模型的多語言差距](https://machinelearning.apple.com/research/leveraging-audio-visual) 作者：María Andrea Cruz Blandón†, Zakaria Aldeneh, Jie Chi, Maureen de Seyssel ### [語音推測解碼中基於原則的粗粒度接受機制](https://machinelearning.apple.com/research/coarse-grained) 作者：Moran Yanuka†, Paul Dixon, Eyal Finkelshttein, Daniel Rotman, Raja Giryes† ### [StereoFoley：從影片生成物件感知立體音訊](https://machinelearning.apple.com/research/stereofoley-object-aware-stereo-audio) 作者：Tornike Karchkhadze†, Kuan-Lin Chen, Mojtaba Heydari, Robert Henzel, Alessandro Toso, Mehrez Souden, Joshua Atkins ## 致謝 Daniele Giacobello, Kumari Nishu, Nimshi Venkat Meripo, Sakshi Rathi, Sibel Oyman, Tatiana Likhomanenko, Xuankai Chang 和 Zijin Gu 擔任 ICASSP 2026 的領域主席。 Bo-Hao Su 擔任 ICASSP 2026 的議程主席。 Daniele Giacobello 是「2026 年臨場感與延伸實境應用資料科學」研討會的共同組織者。 Bo-Hao Su, Honor Chen 和 Tatiana Likhomanenko 擔任 ICASSP 2026 的審稿人。

Apple 於 ICASSP 2026 發表最新聲學、語音與訊號處理研究