Skip to content

iii-org/gpt-inside-llama2

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

中文|ENGLISH

簡介

提供企業便利的開源GPT訓練工具,可快速透過excel版型導入企業自有資料,並於企業內部的雲端進行訓練、部署,解決企業對於機敏資料不外流的安全問題。模型目前已提供GPT-J、LLama2,讓企業可自行選用合適的模型進行應用發展,未來可結合本計畫研發的對話驗證技術,打造可信任的AI對話生成服務,更多的介紹請參考本工具之介紹網站

本工具由中華民國數位發展部數位產業署(ADI)支持開發

目錄

  • 系統環境需求
  • 安裝
  • 訓練
  • 推論

系統環境需求

系統硬體部分,可選擇本機端或是雲端的運算資源,詳情如下所示。

硬體

最低需求 建議需求
CPU 16 core 32 core
Memory 128 G 128G
GPU Nvidia A100 40G * 1 Nvidia A100 80G * 2
Storage 256G 512G
Price 約70萬 約130萬

雲端

規格(建議需求) 執行個體數量 價格 (每日)
AWS p4d.24xlarge 1 約1.5萬
GCP a2-ultragpu-2g 1 約0.8萬
Azure NC48ads A100 v4 1 約0.8萬
  • 最新價格請至官網取得

訓練資料格式

以衛生福利部國民健康署提供的孕婦衛教手冊問答為例,格式如data/raw_data.xlsx所示。每一列資料為一則的問答,每個欄位之定義如下:

欄位名稱 欄位定義 欄位範例
Q 問題 在哪個孕期進行高層次超音波檢查?
A 回應 建議於懷孕20~24週進行。
REF 參考資料 高層次超音波能清楚顯示胎兒影像,建議於懷孕20~24週進行。這是屬於自費檢查項目,孕婦可以考慮自身狀況,決定是否接受。高層次超音波依規定不可用來判定胎兒性別。若孕婦身體不適或胎兒有特殊狀況,可與醫師討論檢查的頻率及次數。發現胎兒畸形時,請諮詢相關專科醫師。

快速開始

在Ubuntu 20.04 TLS作業系統中,於命令列執行以下指令:

bash run_service.sh -i 127.0.0.1 -d ./data/raw_data.xlsx -t {your HuggingFace access token}

其中:

  • -i: 機器的IP位置,預設為本機端,若網頁介面需提供給其他外部機器使用,則需設置一個可對外的IP位置
  • -d: 訓練資料存儲路徑
  • -t: HuggingFace的存取權杖 (請先至HuggingFace的說明頁面了解相關規範並申請許可)
  • -s: 跳過訓練/推論階段(-s skip-train/skip-inference)

該指令將會自動安裝環境並訓練模型,訓練完成後可在畫面上看到以下訊息

Please enter the URL link below into your browser to activate the dialog interface
    URL link: http://127.0.0.1/gpt/qa/

請將URL link複製並貼到瀏覽器的網址列上,即可開始進行問答

僅啟動網頁服務

在命令列執行以下指令:

bash run_service.sh -i 127.0.0.1 -d ./data/raw_data.xlsx -t {your HuggingFace access token} -s skip-train

該指令將會跳過訓練階段,直接使用現有模型啟動網頁服務

關閉系統服務

在命令列執行以下指令:

bash stop_service.sh

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published