클래스: 데이터 엔지니어링의 기초

무료이용으로 수강해 보세요.

업계 전문가가 강의하는 클래스 23,000개를 수강하세요.

해결: 데이터 변환

해결: 데이터 변환

과제에 대한 해답입니다. 모든 평점을 그룹화하는 데 사용할 첫 번째 함수는 groupBy입니다. 그런 다음 그룹화하려는 열을 추가합니다. 그것은 movie_id입니다. 평균 평점을 계산하려면 mean 함수를 사용합니다. 열 이름은 rating입니다. 그런 다음 두 데이터 프레임을 병합하려면 공통 열을 제공해야 합니다. 이것은 movies_df의 .id 그리고 평균 평점 데이터 프레임의 movie_id입니다. 마지막으로 최종 데이터 프레임인 df.show를 출력해야 합니다. 그게 전부입니다. 변환된 데이터 프레임이 있으며 이것이 여러분이 보게 될 최종 데이터 프레임입니다.

목차