pandas

Python

[python] datetime hour 추출 후 zfill

datetime hour 추출 후 zfill datetime column에서 시간만 추출하고자 한다. 이 때 1시를 '1'이 아닌 '01'로 기록하고자 한다. 즉, 남은 자리를 0으로 채워 길이 2의 문자열로 변경하는 zfill을 사용한다. python 내장 함수로 str.zfill이 있는데, 이를 pandas series에서도 사용할 수 있는 pandas.Series.str.zfill 함수가 있다. 공식 문서 https://pandas.pydata.org/docs/reference/api/pandas.Series.str.zfill.html https://docs.python.org/3/library/stdtypes.html#str.zfill 1. datetime hour 추출 df라는 pandas.Da..

Python

[python error] pandas.read_excel TypeError: got an unexpected keyword argument

에러 발생 pandas.read_excel를 사용하는 도중 다음과 같은 에러를 만났다. Traceback (most recent call last): File "/home/____________________.py", line 189, in read_data df = pd.read_excel(self.data_path, header=0) File "/home/anaconda3/lib/python3.9/site-packages/pandas/io/excel/_base.py", line 478, in read_excel io = ExcelFile(io, storage_options=storage_options, engine=engine) File "/home/anaconda3/lib/python3.9/site..

Python

[python] datetime resample, groupby with Grouper

datetime resample, groupby with Grouper datetime 행을 내가 원하는 간격(하루, 일주일 등)으로 모아서 합을 구하거나, 평균을 구하고 싶은 경우가 있다. groupby를 사용하면 되겠지 싶었지만 편리하게 사용하기 좋은 함수가 있어서 소개하고자 한다. 특히 datetime을 처리하는 데 있어서는 pandas.DataFrame.resample과 pandas.Grouper 함수를 활용해보는 것을 추천한다. 두 함수는 매개변수부터 사용법까지 거의 유사하기 때문에 어떤 매개변수가 어떤 역할을 하는지만 알아둔다면 둘 다 편하게 사용 가능하다. pandas.DataFrame.resample 시계열 데이터의 빈도 변환 및 리샘플링을 위한 편리한 방법이다. 공식 문서를 활용하여 다양..

Python

[python] pandas.DataFrame.round 반올림

pandas.DataFrame.round 반올림 평균을 계산한다거나 float인 값에 대해서 반올림을 수행하고 싶을 때 round 함수를 사용해본 적 있을 것이다. 이와 비슷하게 pandas.DataFrame에서도 같은 역할을 수행하는 round를 소개해보고자 한다. 특별한 점은 원하는 행에 원하는 반올림하고 싶은 소수점 자리를 지정할 수 있다는 것이다. round의 매개변수인 decimals에 int, dict, Series 중 원하는 방식으로 지정해주면 된다. 공식 문서 https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.round.html 예시 import pandas as pd df = pd.DataFrame({ 'age': [43, 29..

Python

[python] datetime columns difference 구하기

데이터프레임에서 두 datetime 행의 차, 즉 시간의 차이를 구하고 싶은 경우 여러가지 방법이 있다. 시간의 차이를 시, 분, 초로 나타내거나 날짜를 구할 수도 있다. 다양한 경우에 대해 알아보자. 공식 문서 https://pandas.pydata.org/docs/reference/api/pandas.Series.dt.html https://pandas.pydata.org/docs/reference/api/pandas.Timedelta.html 설정 날짜 차이를 계산하고자 하는 행들의 dtype이 datetime이어야 함을 주의한다. 만약 object type이라면 pandas.to_datetime을 사용하여 datetime type으로 변경해준다. import pandas as pd df = pd...

Python

[python] DatetimeIndex 만들기 - pandas.date_range

pandas.date_range 시계열 데이터를 만지거나 데이터를 적재할 때 등록 일자를 함께 넣어주고자 할 때 내가 원하는 범위, 간격으로 날짜 리스트를 만들려고 한다. 커스텀 함수를 만들어도 되지만, 간단하게 사용할 수 있는 pandas.date_range를 사용하면 간단한 변수 조절만으로 원하는 범위, 간격의 날짜 리스트를 만들 수 있다. 공식 문서에서는 이러한 날짜 리스트를 DatetimeIndex 개체라고 한다. pandas.date_range를 사용했을 때 결과값으로 확인 가능하다. 공식 문서 https://pandas.pydata.org/docs/reference/api/pandas.date_range.html parameter(매개변수) 살펴보기 모든 매개 변수 및 기본 default 설정..

Python

[python] DataFrame 결합 - pandas.DataFrame.join

Pandas.DataFrame.join pandas는 조인/병합 유형 작업의 경우 인덱스 및 관계 대수 기능에 대한 다양한 종류의 집합 논리와 함께 Series 또는 DataFrame을 쉽게 결합할 수 있는 다양한 기능을 제공한다. 저번 글에서는 merge에 대해 다루어봤는데, merge가 join보다 세세한 설정이 가능하고 따로 설정을 하지 않아도 겹치는 열을 찾아 합쳐준다면 join은 index 설정을 해주어야 깔끔한 결합이 가능하다. join은 merge 함수를 기반으로 만들어졌기 때문에 기본 작동 방식이 비슷할 수 있다. 그럼 오늘은 join에 대해 살펴보자. 공식 문서 https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.join.html..

Python

[python] DataFrame 결합 - pandas.merge

pandas.merge pandas는 조인/병합 유형 작업의 경우 인덱스 및 관계 대수 기능에 대한 다양한 종류의 집합 논리와 함께 Series 또는 DataFrame을 쉽게 결합할 수 있는 다양한 기능을 제공한다. 저번 글에서는 concat에 대해 다루어봤는데, 조금 다른 결인 merge를 살펴보고자 한다. pandas.merge는 두 데이터프레임을 각 데이터에 존재하는 고유값(key)을 기준으로 병합할 때 사용한다. 옵션(매개 변수)에 따라 합치는 방법이나 결과가 다양해지기 때문에, 원하는 방식에 맞게 옵션을 선택해서 사용해야 한다. 공식 문서 https://pandas.pydata.org/docs/reference/api/pandas.merge.html https://pandas.pydata.org..

Python

[python] DataFrame 결합 - pandas.concat

pandas.concat pandas는 조인/병합 유형 작업의 경우 인덱스 및 관계 대수 기능에 대한 다양한 종류의 집합 논리와 함께 Series 또는 DataFrame을 쉽게 결합할 수 있는 다양한 기능을 제공한다. concat 외에도 merge, join 등의 함수도 있으나, 먼저 concat을 살펴보도록 한다. concat은 DataFrame을 물리적으로 이어붙이는 기능을 한다. 옵션(매개 변수)에 따라 합치는 방법이나 결과가 다양해지기 때문에, 원하는 방식에 맞게 옵션을 선택해서 사용해야 한다. 공식 문서 https://pandas.pydata.org/docs/reference/api/pandas.concat.html parameter(매개 변수) 살펴보기 모든 매개 변수 및 기본 default ..

so-so
'pandas' 태그의 글 목록