질문 #: 181주제 #: 1
부동산 회사는 새로운 주택 가격을 예측하는 새로운 제품을 출시하려고 합니다. 속성과 가격에 대한 과거 데이터는 .csv 형식으로 Amazon S3 버킷에 저장되어 있습니다. 데이터에는 헤더, 일부 범주형 필드 및 일부 누락된 값이 있습니다. 회사의 데이터 과학자들은 일반적인 오픈 소스 라이브러리를 사용하여 누락된 값을 0으로 채웠습니다. 데이터 과학자들은 모든 범주형 필드를 삭제하고 기본 매개변수를 사용하여 오픈 소스 선형 회귀 알고리즘으로 모델을 학습했습니다.
현재 모델의 예측 정확도는 50% 이하입니다. 회사는 모델의 성능을 향상시키고 새로운 제품을 가능한 빨리 출시하려고 합니다.
가장 적은 운영 오버헤드로 이러한 요구 사항을 충족하는 솔루션은 어떤 것입니까?
- A. Amazon Elastic Container Service (Amazon ECS)용 서비스 링크 역할을 생성하고 S3 버킷에 액세스합니다. AWS Deep Learning Containers 이미지를 기반으로 ECS 클러스터를 생성합니다. 특성 엔지니어링을 수행하는 코드를 작성합니다. 가격 예측을 위해 로지스틱 회귀 모델을 학습하고 데이터셋이 있는 버킷을 가리킵니다. 학습 작업이 완료될 때까지 대기하고 추론을 수행합니다.
- B. 새 IAM 역할이 노트북과 연관되도록 Amazon SageMaker 노트북을 생성합니다. S3 버킷에서 데이터셋을 가져옵니다. 특성 엔지니어링 변환, 회귀 알고리즘 및 하이퍼파라미터의 다양한 조합을 탐색합니다. 노트북에서 모든 결과를 비교하고 가장 정확한 구성을 예측에 대한 엔드포인트로 배포합니다.
- C. Amazon S3, Amazon SageMaker 및 AWS Lambda에 액세스할 수 있는 IAM 역할을 생성합니다. SageMaker 내장 XGBoost 모델을 사용하여 데이터셋이 있는 버킷을 가리키는 학습 작업을 생성합니다. 가격을 대상 특성으로 지정합니다. 작업이 완료될 때까지 대기하고 모델 아티팩트를 Lambda 함수에로드하여 새로운 주택 가격에 대한 추론을 수행합니다.
- D. Amazon S3 버킷에 액세스 할 수 있는 Amazon SageMaker용 IAM 역할을 생성합니다. SageMaker Autopilot을 사용하여 데이터셋이 있는 버킷을 가리키는 SageMaker AutoML 작업을 생성합니다. 가격을 대상 속성으로 지정합니다. 작업이 완료될 때까지 대기하고 최상의 모델을 배포하여 예측을 수행합니다.
질문 #: 182
주제 #: 1
데이터 과학자는 회사 제품에 대한 고객 의견을 검토하고 있습니다. 데이터 과학자는 차트와 워드 클라우드를 사용하여 초기의 탐색적 분석을 제공해야 합니다. 데이터 과학자는 자연어 처리(NLP) 모델을 시작하기 전에 이 분석을 준비하기 위해 피처 엔지니어링 기술을 사용해야 합니다.
데이터 과학자가 이 요구 사항을 충족하기 위해 사용해야 하는 피처 엔지니어링 기술 조합은 무엇입니까? (두 개 선택)
- A. 명명된 개체 인식
- B. 공지어
- C. 어간 추출
- D. 단어 빈도-역문헌 빈도 (TF-IDF)
- E. 감성 분석
질문 #: 183
주제 #: 1