[Data Science] pandas

pandas란?

원래 데이터 사이엔스에서는 파이썬보다 R이 훨씬 인기가 많았습니다.
R은 애초에 통계를 위해 만들어진 언어이기 때문에 데이터 분석에 파이썬보다 적합했습니다.
그러다가 개발자들이 R의 장점을 파이썬으로 베껴오기 시작했습니다.

R에서 데이터를 보관, 분석 시 가장 핵심적 역할을 한 게 DataFrame인데,
파이썬의 pandas 그 DataFrame을 사용할 수 있게 해놓은 라이브러리입니다.

pandas는 numpy를 이용해서 만들어졌으므로 numpy의 기능들은 pandas에 기본적으로 있다고 보면 되고,
거기에 추가로 데이터 분석, 정리, 외부 데이터 읽고 쓰기 등 편리한 기능들이 추가된 것이 pandas입니다.

pandas로 DataFrame 만들어보기

pandas로 데이터 읽어들이기

Updated:

Leave a comment