CollectiveAI

This is the official repository of CollectiveAI

android_data

runs

从android_world中直接收集的数据（第一版）

traj_reward_sft

以traj-level的label（0/1）作为整个轨迹中所有step的reward

reward_model_trian

训练reward model的数据（第一版）

runs_step_reward

step-level的reward，从android_world中直接收集的数据，使用gpt4o对每一步的行为给出reward，数据格式（每个task）：['before_element_list', 'after_element_list', 'action_prompt', 'action_output_list', 'agent_step_scores'...]

runs_step_reward_sft

tsv格式，数据格式：["goal", "task_template", "query", "response", "rating"]

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
android_data		android_data
data_process		data_process
.DS_Store		.DS_Store
README.md		README.md
download_model.py		download_model.py
qwen_api_test.py		qwen_api_test.py
test_qwen.py		test_qwen.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CollectiveAI

android_data

runs

traj_reward_sft

reward_model_trian

runs_step_reward

runs_step_reward_sft

About

Releases

Packages

Languages

Zhitao-He/CollectiveAI

Folders and files

Latest commit

History

Repository files navigation

CollectiveAI

android_data

runs

traj_reward_sft

reward_model_trian

runs_step_reward

runs_step_reward_sft

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages