TW Deep Master (臺灣深度大師):將Natural Language Processing (自然語言處理)和Speech Processing (語音處理)的SOTA以繁體中文為基礎做迭代,模組化提供 WEB API 調用;整合機器閱讀理解對文章抽取答案,搭配聲紋和語音識別以及語音去噪還有分離為Meeting & Minutes Master (M&M Master, 會議記錄大師):可針對會議或對話訪談記錄由聲紋識別來分離出說話人,再藉由去噪和分離等技術強化語音品質,最後針對內容進行理解問答探索;比傳說中提供開源模型Jupyter檔的更適合深入整合。

任意連續唸至少30秒文章做聲紋註冊,可用 M$ Azure、Google GCP、NVIDIA Nemo 做語音識別,再搭配Sincnet做聲紋跟維基百科做閱讀理解問答

藉由特定對象的聲紋特徵,判別其說話者身份並且識別其語音內容;並借助維基百科,進行閱讀理解問答

找到描述特定聲音特徵,並將其去除以提高質量

從多個聲音信號中提取出目標;多個說話人的語音辨識問題

針對文章提出問題並從中抽取答案

適用針對文本內容之實體 (店、人、食物名等等)進行識別

適用針對輸入文本進行分類以供下一步對話搜尋

針對輸入文本(對話)或候選詞比較是否語義相似

適用於輸入文本(對話),特別是語音識別同音異字進行改錯

中文機器閱讀理解 整合維基百科

中文機器閱讀理解 整合維基百科