Ray Jobs CLI API 参考#
本节包含用于提交 Ray 作业的命令。
ray job submit#
提交作业以在集群上运行。
默认情况下(如果未设置 –no-wait),将日志流式传输到 stdout 直到作业完成。如果作业成功,退出代码为 0。如果作业失败,退出代码为 1。
- 示例
ray job submit -- python my_script.py --arg=val
ray job submit [OPTIONS] ENTRYPOINT...
选项
- --address <address>#
要连接的 Ray 集群地址。也可以使用 RAY_ADDRESS 环境变量指定。
- --job-id <job_id>#
已废弃:请改用
--submission-id
。
- --submission-id <submission_id>#
要为作业指定的提交 ID。如果未提供,将自动生成一个。
- --runtime-env <runtime_env>#
包含 runtime_env 定义的本地 YAML 文件路径。
- --runtime-env-json <runtime_env_json>#
JSON 序列化的 runtime_env 字典。
- --working-dir <working_dir>#
包含作业运行所需文件的目录。可以是本地目录,也可以是指向 .zip 文件的远程 URI (S3, GS, HTTP)。如果指定,将覆盖
--runtime-env
中的选项。
- --metadata-json <metadata_json>#
要附加到作业的元数据 JSON 序列化字典。
- --entrypoint-num-cpus <entrypoint_num_cpus>#
为入口点命令保留的 CPU 核数量,与由其启动的任何任务或 Actor 分开计算
- --entrypoint-num-gpus <entrypoint_num_gpus>#
为入口点命令保留的 GPU 数量,与由其启动的任何任务或 Actor 分开计算
- --entrypoint-memory <entrypoint_memory>#
为入口点命令保留的内存量,与由其启动的任何任务或 Actor 分开计算
- --entrypoint-resources <entrypoint_resources>#
一个 JSON 序列化的字典,将资源名称映射到资源数量,描述为入口点命令保留的资源,与由其启动的任何任务或 Actor 分开计算
- --no-wait#
如果设置,将不流式传输日志,也不等待作业退出。
- --verify <verify>#
一个布尔值指示,用于验证服务器的 TLS 证书,或者指定一个包含受信任证书的文件或目录路径。
- 默认值:
True
- --headers <headers>#
用于通过 http/s 将头部信息传递给 Ray 集群。请遵循 JSON 格式:{“key”: “value”}
- --log-style <log_style>#
如果设置为 'pretty',输出带有格式和颜色。如果设置为 'record',输出记录风格,没有格式。'auto' 默认使用 'pretty',如果标准输入不是 TTY,则禁用漂亮日志记录。
- 选项:
auto | record | pretty
- --log-color <log_color>#
使用彩色日志记录。如果标准输出是 TTY,Auto 会启用彩色日志记录。
- 选项:
auto | false | true
- -v, --verbose#
参数
- ENTRYPOINT#
必需参数
警告
使用 CLI 时,不要将入口点命令用引号括起来。例如,使用 ray job submit --working-dir="." -- python script.py
,而不是 ray job submit --working-dir="." -- "python script.py"
。否则,您可能会遇到错误 /bin/sh: 1: python script.py: not found
。
警告
您必须将入口点命令 python script.py
放在最后(在 --
之后),并且任何其他 ray job submit
的参数(例如 --working-dir="."
)必须放在两个连字符 (--
) 之前。例如,使用 ray job submit --working-dir="." -- python script.py
,而不是 ray job submit -- python script.py --working-dir="."
。此语法支持使用 --
将 ray job submit
的参数与入口点命令的参数分隔开。
ray job status#
查询作业的当前状态。
- 示例
ray job status <my_job_id>
ray job status [OPTIONS] JOB_ID
选项
- --address <address>#
要连接的 Ray 集群地址。也可以使用
RAY_ADDRESS
环境变量指定。
- --verify <verify>#
一个布尔值指示,用于验证服务器的 TLS 证书,或者指定一个包含受信任证书的文件或目录路径。
- 默认值:
True
- --headers <headers>#
用于通过 http/s 将头部信息传递给 Ray 集群。请遵循 JSON 格式:{“key”: “value”}
- --log-style <log_style>#
如果设置为 'pretty',输出带有格式和颜色。如果设置为 'record',输出记录风格,没有格式。'auto' 默认使用 'pretty',如果标准输入不是 TTY,则禁用漂亮日志记录。
- 选项:
auto | record | pretty
- --log-color <log_color>#
使用彩色日志记录。如果标准输出是 TTY,Auto 会启用彩色日志记录。
- 选项:
auto | false | true
- -v, --verbose#
参数
- JOB_ID#
必需参数
ray job stop#
尝试停止作业。
- 示例
ray job stop <my_job_id>
ray job stop [OPTIONS] JOB_ID
选项
- --address <address>#
要连接的 Ray 集群地址。也可以使用
RAY_ADDRESS
环境变量指定。
- --no-wait#
如果设置,将不等待作业退出。
- --verify <verify>#
一个布尔值指示,用于验证服务器的 TLS 证书,或者指定一个包含受信任证书的文件或目录路径。
- 默认值:
True
- --headers <headers>#
用于通过 http/s 将头部信息传递给 Ray 集群。请遵循 JSON 格式:{“key”: “value”}
- --log-style <log_style>#
如果设置为 'pretty',输出带有格式和颜色。如果设置为 'record',输出记录风格,没有格式。'auto' 默认使用 'pretty',如果标准输入不是 TTY,则禁用漂亮日志记录。
- 选项:
auto | record | pretty
- --log-color <log_color>#
使用彩色日志记录。如果标准输出是 TTY,Auto 会启用彩色日志记录。
- 选项:
auto | false | true
- -v, --verbose#
参数
- JOB_ID#
必需参数
ray job logs#
获取作业日志。
- 示例
ray job logs <my_job_id>
ray job logs [OPTIONS] JOB_ID
选项
- --address <address>#
要连接的 Ray 集群地址。也可以使用 RAY_ADDRESS 环境变量指定。
- -f, --follow#
如果设置,将跟随日志(类似于
tail -f
)。
- --verify <verify>#
一个布尔值指示,用于验证服务器的 TLS 证书,或者指定一个包含受信任证书的文件或目录路径。
- 默认值:
True
- --headers <headers>#
用于通过 http/s 将头部信息传递给 Ray 集群。请遵循 JSON 格式:{“key”: “value”}
- --log-style <log_style>#
如果设置为 'pretty',输出带有格式和颜色。如果设置为 'record',输出记录风格,没有格式。'auto' 默认使用 'pretty',如果标准输入不是 TTY,则禁用漂亮日志记录。
- 选项:
auto | record | pretty
- --log-color <log_color>#
使用彩色日志记录。如果标准输出是 TTY,Auto 会启用彩色日志记录。
- 选项:
auto | false | true
- -v, --verbose#
参数
- JOB_ID#
必需参数
ray job list#
列出所有正在运行的作业及其信息。
- 示例
ray job list
ray job list [OPTIONS]
选项
- --address <address>#
要连接的 Ray 集群地址。也可以使用 RAY_ADDRESS 环境变量指定。
- --verify <verify>#
一个布尔值指示,用于验证服务器的 TLS 证书,或者指定一个包含受信任证书的文件或目录路径。
- 默认值:
True
- --headers <headers>#
用于通过 http/s 将头部信息传递给 Ray 集群。请遵循 JSON 格式:{“key”: “value”}
- --log-style <log_style>#
如果设置为 'pretty',输出带有格式和颜色。如果设置为 'record',输出记录风格,没有格式。'auto' 默认使用 'pretty',如果标准输入不是 TTY,则禁用漂亮日志记录。
- 选项:
auto | record | pretty
- --log-color <log_color>#
使用彩色日志记录。如果标准输出是 TTY,Auto 会启用彩色日志记录。
- 选项:
auto | false | true
- -v, --verbose#
ray job delete#
删除已停止的作业及其关联的内存数据。
仅支持已处于终端状态的作业。如果作业尚未停止,将以退出代码 1 失败。不会从磁盘删除作业日志。提交与先前删除的作业具有相同提交 ID 的作业不受支持,并可能导致意外行为。
- 示例
ray job delete <my_job_id>
ray job delete [OPTIONS] JOB_ID
选项
- --address <address>#
要连接的 Ray 集群地址。也可以使用 RAY_ADDRESS 环境变量指定。
- --verify <verify>#
一个布尔值指示,用于验证服务器的 TLS 证书,或者指定一个包含受信任证书的文件或目录路径。
- 默认值:
True
- --headers <headers>#
用于通过 http/s 将头部信息传递给 Ray 集群。请遵循 JSON 格式:{“key”: “value”}
- --log-style <log_style>#
如果设置为 'pretty',输出带有格式和颜色。如果设置为 'record',输出记录风格,没有格式。'auto' 默认使用 'pretty',如果标准输入不是 TTY,则禁用漂亮日志记录。
- 选项:
auto | record | pretty
- --log-color <log_color>#
使用彩色日志记录。如果标准输出是 TTY,Auto 会启用彩色日志记录。
- 选项:
auto | false | true
- -v, --verbose#
参数
- JOB_ID#
必需参数