研究AI或深度學習都想讓她產品化落地,但想搞個靠譜的Chatbot, 命名實體識別、分類和相似度不能不做,卻發現公開模型都是基於簡體中文或英文數據集,本地化工程耗大,只好投入人力維運正規表示式和關鍵字。
TW Master Network (TWMAN) 將Natural Language Processing (自然語言處理)和Speech Recognition (語音識別)的SOTA以繁體中文為基礎模組化為API;整合機器閱讀理解對文章抽取答案;搭配聲紋、語音識別、去噪跟分離,整合為Meeting & Minutes Master (M&M Master, 會議記錄大師),深入探索關鍵互動研究。