본문 바로가기
Hadoop

[Hadoop] HDFS에서 S3로 Distcp

by 초이MS 2022. 1. 17.

목적

  • on-premise hdfs에서 s3로 데이터 올릴 때 get, put으로 데이터를 올리는 과정이 번거롭다

방법

hadoop distcp -Dfs.s3a.access.key=$AWS_ACCESS_KEY -Dfs.s3a.secret.key=$AWS_SECRET_KEY -Dfs.s3a.endpoint=$AWS_END_POINT $HDFS_SOURCE_PATH s3a://$S3_DEST_PATH
반응형

댓글