MedicalGPT/role_play_data at main · 0202zc/MedicalGPT

Name		Name	Last commit message	Last commit date
parent directory ..
README.md		README.md
role_generate.py		role_generate.py
roleplay_data_generate_doubao.py		roleplay_data_generate_doubao.py
roleplay_data_generate_gpt4.py		roleplay_data_generate_gpt4.py
seed_nurse_role.jsonl		seed_nurse_role.jsonl
seed_patient_role.jsonl		seed_patient_role.jsonl

README.md

本数据集使用OpenAI API接口生成，流程：

种子特征集和基础设定：
- 手工编写的种子集包含基本角色特征。
- LLM从这个种子集生成角色的基础设定。
角色设定的进化：
- 第二个种子集包含指导角色设定进化的指令Prompt。
- 这些进化角色的指令Prompt被放到一个指令池中。基于这些进化Prompt，LLM对基础设定实施进化。
反馈循环：
- 由人类评估者和GPT-4组成的混合评价系统。此系统对进化后的设定给出反馈。
- 反馈用于迭代更新种子集。如此迭代，我们最终得到一个细致的角色设定数据集。
角色扮演和对话生成：
- 使用self-instruction框架基于角色设定生成角色的对话数据。

cd role_play_data

python role_generate.py

python roleplay_data_generate_gpt4.py

python roleplay_data_generate_doubao.py