pandas다시보기3

개요

배열의 값들을 또다른 배열과 매핑(map)해서 새로운 배열을 만드는것
기존 데이터의 값을 수정하거나 새로운 포멧으로 변경할때 사용
사용법은 python의 map과 같다.
새로운 Series와 DataFrame을 만들기 때문에 기존 데이터는 수정이 안된다.
map()
- 새로운 Series(열)을 출력한다.
- ```
  review_points_mean = reviews.points.mean()
  reviews.points.map(lambda p: p - review_points_mean)
```
- 위는 points라는 열에서 각 값을 mean값과 뺀 결과를 보여준다.
apply()
- map()과 같지만, 새로운 dataframe을 출력
- ```
  def remean_points(row):
  row.points = row.points - review_points_mean
  return row

  reviews.apply(remean_points, axis='columns')
```
- 위는 각 행 마다 반복으로 points라는 열의 값을 평균과 뺀 값으로 넣어준다.
- axis는 columns와 index로 정할 수 있다.
위의 map없이도 바로 계산이 되기도 한다.(built-in)
- reviews.points - review_points_mean
  - 위의 map()의 예시와 같은 결과가 나온다.
- reviews.country + " - " + reviews.region_1
  - country열의 값과 region_1열의 값 사이에 -가 들어간 값을 출력한다.