AI 驅動的手語翻譯受限於缺乏高品質的標註資料。儘管 ASL STEM Wiki 和 FLEURS-ASL 等新資料集包含專業手語譯者和數百小時的資料,但由於大規模標註成本過高,這些資料集仍僅部分標註,因此未能充分利用。在這項工作中,我們開發了一套偽標註(pseudo-annotation)管線,它以手語影片和英文作為輸入,並輸出一個包含時間區間的潛在標註排名集,內容涵蓋詞彙(glosses)、手語拼寫(fingerspelled words)和手語分類器(sign classifiers)。我們的管線利用來自稀疏預測的…