对比两个 JSON 文件的键值对差异,主要是为了避免重复翻译键值对。 参数说明
compare_keys_directory.log
或 compare_keys_single.log
。同时会生成 _en-new.json
、_zh-new.json
以及(如有需要)_zh-filtered.json
,默认写入根目录的 temp_dir
,可通过 --out-dir
自定义目录。
python3 tools/compare_keys.py \
--zh-file lang/zh.json \
--en-file org_dir/en.json
用于将 JSON 文件格式化,并按照其中 string 字段的长度升序排序输出。为了方便丢给 chatgpt 进行逐行翻译。 参数说明
.json
文件执行格式化。
python3 tools/format_json.py lang/zh.json
python3 tools/format_json.py lang/
用于将大型 JSON 文件拆分为多个小文件,每个小文件包含指定数量的键值对。chatgpt 一次处理的词条数量有限,所以需要拆分文件。 参数说明
split_dir
目录,文件名形如 split_<文件名>_001.json
。
python3 tools/split_json.py lang/en.json 100
用于将多个拆分后的 JSON 文件合并为一个大型 JSON 文件。 参数说明
split_dir
)temp_dir/merged*.json
。若拆分文件名形如 split_en_*.json
会自动生成 merged_en.json
,split_zh_*
则生成 merged_zh.json
)
python3 tools/merge_json.py
python3 tools/merge_json.py -i lang/zh/split -o lang/zh/merged.json
python3 tools/compare_keys.py --zh-file ./lang/zh/zh.json --en-file ./lang/zh/en.json
python3 tools/format_json.py lang/zh.json
python3 tools/format_json.py lang/