非結構化數據理解之LLM技術應用研究
需求企業:
鴻海精密工業股份有限公司
場域需求:
隨著資訊科技的發展,各種形式的資料日益增多,特別是非結構化資訊,如文本、影像、語音等。這些資料包含了豐富的訊息,但由於其非結構化的特性,讓資料的處理與理解成為一大挑戰。對於許多企業而言,能夠有效地理解和利用這些資料,將直接影響到其商業決策、客戶服務、產品開發等多方面的效能和成效。
目的:
旨在開發和驗證一種方法,使得預訓練的大型語言模型(LLMs)能夠更有效地理解和處理非結構化數據,包括但不限於文本、圖像、語音等形式,進而支持企業在資訊檢索、內容理解和問答等方面的應用需求,提高自動化程度,並在多領域中實現準確且高效的信息處理
資源提供:
主要以Pytorch進行開發之模型,可搭配現今常用的框架,例如: Huggingface Transformers、Meta Fairseq等。
驗收標準:
【期末驗證方向】 1.理解能力:模型能夠準確識別和理解不同格式的非結構化數據中的關鍵信息。 2.跨領域適應性:處理和回答問題的能力,並保持高準確率。 3.實時處理能力:證明模型在處理大規模非結構化數據集時的效率和準確性,並能夠在合理的時間內提供反饋。 4.用戶互動體驗:用戶能夠通過自然語言與系統進行有效交流。
加碼獎勵:
將依據團隊表現,適時給予額外資源。